首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于类别空间的基因选择
引用本文:张军英,Y.J.Wang,J.Khan,R.Clarke.基于类别空间的基因选择[J].中国科学(E辑),2003,33(12):1125-1137.
作者姓名:张军英  Y.J.Wang  J.Khan  R.Clarke
作者单位:1. 西安电子科技大学雷达信号处理国防重点实验室,西安,710071;Electrical Engineering Institute,The Catholic University of America,Washington DC20064,USA
2. Electrical Engineering Institute,The Catholic University of America,Washington DC20064,USA
3. Cancer Genetics Branch,National Human Genome Research Institute,National Institutes of Health,Bethesda,Maryland,USA
4. Lombardi Cancer Center,Georgetown University,Washington DC,USA
基金项目:美国国家健康研究院(NIH)/美国国家癌症研究院(NCI)研究基金(5R21CA83231),中国国家自然科学基金(批准号:60071026,60371044),国防科技预研基金(00J1.4.4.DZ0106),图像信息处理与智能控制国家教育委员会开放实验室基金(TKLJ0005)
摘    要:基因选择通常是在基因空间中进行的. 由于基因空间的维数(基因数目)比该空间中的样本数要多得多, 这种做法存在严重的维数发难(curse of dimensionality)问题, 其结果是在基因空间中所建立数据模型难于获得满意的精度, 基于所建立模型的基因选择结果可信度低. 如何对具有极少样本的极高维空间进行特征选择(基因选择)是一个极具挑战性的课题. 将基因空间变换为它的对偶空间, 称为类别空间, 从而空间的维数仅为基因空间中样本的类别数, 空间中的样本数则为基因空间的维数. 显然, 在类别空间中不存在任何维数发难现象; 提出了在类别空间中基于将不同的类尽可能分开的原则、并借助主分量分析的基于类别空间基因选择方法. 对真实基因数据的基因选择实验, 并通过Fisher指标、加权Fisher指标以及leave-one-out cross validation等可分性指标, 与其他两种基因选择方法进行了深入的比较, 结果表明该方法是十分有效的.

关 键 词:类别空间  特征选择(基因选择)  主分量分析  特征空间(基因空间)
收稿时间:2003-03-10
修稿时间:2003年3月10日
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中国科学(E辑)》浏览原始摘要信息
点击此处可从《中国科学(E辑)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号