首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于距离最大熵值的蛋白质结构域边界检测系统
引用本文:邹淑雪,刘桂霞,时小虎,周春光.基于距离最大熵值的蛋白质结构域边界检测系统[J].吉林大学学报(理学版),2009,47(6):1237-1240.
作者姓名:邹淑雪  刘桂霞  时小虎  周春光
作者单位:吉林大学 计算机科学与技术学院, 长春 130012
基金项目:国家自然科学基金,高等学校博士学科点专项科研基金 
摘    要:首次将蛋白质结构域边界检测问题归结为非平衡数据学习问题, 提出一种新的欠采样方法, 即在支持向量机特征空间中对与正类样本具有距离最大熵值的负类样本进行采样. 以经过筛选的蛋白质结构域数据库作为实验数据, 支持向量机学习系统的平均预测准确率可达80%, 同时具有较高的敏感性和特异性.

关 键 词:蛋白质结构域边界  支持向量机  非平衡数据学习  基于距离的最大熵  
收稿时间:2009-02-23

Detection of Protein Domain Boundaries via Distance-based Maximal Entropy
ZOU Shu-xue,LIU Gui-xia,SHI Xiao-hu,ZHOU Chun-guang.Detection of Protein Domain Boundaries via Distance-based Maximal Entropy[J].Journal of Jilin University: Sci Ed,2009,47(6):1237-1240.
Authors:ZOU Shu-xue  LIU Gui-xia  SHI Xiao-hu  ZHOU Chun-guang
Institution:College of Computer Science and Technology, Jilin University, Changchun 130012, China
Abstract:The domain detection was taken as an imbalanced data learning problem. A novel undersampling method using distance-based maximal entropy in the feature space of support vector machines is proposed. By way of scanning the selected proteins from the protein domain database, the overall accuracy of our machine study system is about 80% with high sensitivity and specificity.
Keywords:protein domain boundaries  support vector machine  imbalanced data learning  distance-based maximal entropy
本文献已被 万方数据 等数据库收录!
点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(理学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号