首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于矩阵填充的肿瘤基因表达谱数据缺失点估计
引用本文:黄经纬,杨国亮,胡政伟,王艳芳.基于矩阵填充的肿瘤基因表达谱数据缺失点估计[J].科学技术与工程,2017,17(7).
作者姓名:黄经纬  杨国亮  胡政伟  王艳芳
作者单位:江西理工大学电气工程与自动化学院,江西理工大学电气工程与自动化学院,江西理工大学电气工程与自动化学院,赣州市立医院信息技术科
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目);江西省教育厅科技计划项目
摘    要:为解决肿瘤基因表达谱数据后续研究需要完整数据矩阵的问题,针对包含缺失点的数据集。提出基于矩阵填充(matrix completion)与模糊C均值(fuzzy c-means algorithm,FCM)相结合的缺失点估计方法(FCM_MC)。该方法充分利用肿瘤基因表达谱数据的冗余信息,通过模糊C均值聚类得到具有良好的低秩特性的基因语义片段,再利用矩阵填充方法分别对每个语义片段进行缺失点的重建。在不同数据集上进行实验,与传统缺失点估计算法比较。实验表明FCM_MC算法在缺失数据估计准确度和类结构保持度上效果得到有效提升,同时运行效率较高。

关 键 词:矩阵填充  模糊C均值  低秩  基因语义  缺失值估计
收稿时间:2016/9/4 0:00:00
修稿时间:2016/10/19 0:00:00

Tumor gene expression missing value estimation based on matrix completion
Abstract:To solve the problem that the research of tumor gene expression data needs a complete data matrix, a missing value estimation method (FCM_MC) based on matrix completion (MC) and fuzzy c-means algorithm (FCM) is proposed for matrices contain missing values. The method makes full use of the redundancy information of tumor gene expression data, the low rank genetic semantics matrices are obtained by fuzzy c-mean clustering method. Then we use matrix completion theory to estimate the missing values of every semantics matrices. After the estimation of different data sets, we compared our proposal with tradition missing value estimation algorithm. Experimental results show the improvement of our method on missing value estimation accuracy and structure of class preserving accuracy with suitable efficiency.
Keywords:matrix completion  fuzzy c-means  low rank  genetic semantic  missing value estimation
本文献已被 CNKI 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号