首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
研究表明阿尔茨海默病(AD)的致病机理可能与基因有关.利用计算方法对AD基因表达数据进行挖掘,以获得AD候选致病基因,寻找治愈AD方法.结合生物信息理论应用基于主成分分析(PCA)方法的模糊C均值算法处理基因表达数据:观察到AD基因表达数据具有线性相关性后,先用PCA对数据降维,再利用一维分类方法对降维后的数据聚类,然后将结果提供给模糊C均值算法作为其初始聚类数目和聚类中心.通过算法,最终识别出9个AD候选致病基因.  相似文献   

2.
利用双向聚类方法提高系统性红斑狼疮(systemic lupus erythematosus,SLE)基因表达数据特征基因提取的有效性;预测SLE患病过程中转录因子活性以及对靶基因的调控强度变化,构建和挖掘与SLE发病密切相关的转录调控网络及其生物过程.利用FastICA方法进行双向聚类筛选出800个SLE显著基因,结合转录调控信息选取其中表达显著的转录因子及其靶基因,利用NCA预测SLE发病过程中转录因子活性以及对靶基因调控强度的变化,并构建调控网络.构建了由9个转录因子和47个靶基因所组成的调控网络,结合分子生物学分析发现,转录因子在正常样本和患病样本中的活性有明显的变化趋势,其调控的靶基因的变化符合SLE的病理特征.利用矩阵分解技术进行SLE特征基因提取及转录调控网络构建能够发现多个与炎症反应及免疫系统等密切相关的生物过程,对研究SLE致病机理和相应的生物学实验提供了方法和依据.  相似文献   

3.
目的 提出一种利用共有基因模块构建大规模基因调控网络算法(Common Gene Mod-ules Network,CGMN),有效降低传统基因调控网络构建基因节点规模较大的基因调控网络(包含几百个,甚至几千个基因节点)时时间复杂度过大的缺陷.方法 CGMN算法从基因表达数据出发,采用6种常用聚类算法把基因表达模式相似的基因聚类成功能模块,找出6种聚类方法的共有模块,并将其作为功能模块基因节点,采用局部贝叶斯网络(Local Bayesian Network,LBN)算法构建功能模块基因-基因调控网络.结果 与结论 大规模细胞周期基因表达数据集上仿真实验结果表明,搜索共有模块压缩基因节点数目策略,能够有效降低大规模基因调控网络重构时间复杂度,且验证了CGMN算法构建大规模基因调控网络的有效性.  相似文献   

4.
将EFICA(Efficient Variant of Algorithm FastICA)方法与基因网络相结合分析一组阿尔茨海默病(AD)微阵列数据.根据分类结果提取特征基因集并探寻与早期AD相关的基因网络,实验结果表明,EFICA方法比传统的Fastica方法能够获得更好的分类效果.并且通过对基因网络的研究,扩展了EFICA在生物信息学中的应用,为AD疾病的进一步研究提供新思路.  相似文献   

5.
聚类是识别基因表达数据蕴含的关键基因调控模块的一种有效方法,基因表达谱的相似性度量是聚类的关键问题.然而,一般的相似性度量方法不能刻画时间序列基因表达谱数据所蕴含的时间延迟、反向相关和局部相关等复杂的基因调控关系.针对时间序列基因表达谱数据,提出一种基于近邻传播和动态规划的相似性度量方法和聚类算法.在大鼠再生肝细胞基因表达谱数据集上的聚类结果与基因功能富集分析结果高度一致,证明算法在时间序列基因表达谱数据聚类上的有效性.  相似文献   

6.
癌症通常由基因发生突变引起,因此从大量基因中有效地识别出少量致癌基因具有重要意义.针对基因表达谱数据高维小样本的特点,将支持向量机递归特征消除(SVM-RFE)和特征聚类算法相结合,提出一种新的基因选择方法:K类别SVM-RFE(K-SVM-RFE).该算法通过特征排序算法去除大量无关基因,利用K均值聚类算法将相似基因聚为一类,并通过两次SVM-RFE算法精选致癌基因.随后将K-SVM-RFE算法应用于多个基因表达谱数据集,并对其中的关键参数设置进行了讨论.实验结果表明K-SVM-RFE算法所选基因较已有方法在分类准确率上有显著提高,特别是在选择少量致癌基因上效果提升更为明显.  相似文献   

7.
Isomap在基因表达谱数据聚类分析中的应用   总被引:8,自引:0,他引:8  
基因表达谱数据的聚类分析对于研究基因功能和基因调控机制有重要意义。基于非线性降维算法等容特征映射 ,提出了一种新的大规模基因表达谱数据聚类算法 ,该方法改进了样本向量之间的距离度量 ,用测地距离代替传统的欧式距离 ,有助于挖掘高维数据内在的几何结构。将该算法应用于两个公开的基因表达数据集 ,并用一种新的评价方法Normalized Cut将聚类结果与其他聚类方法的结果进行了比较。结果表明 ,该文的聚类算法优于其他聚类算法 ,聚类结果具有明显的生物学意义 ,并能对数据的类别数作出较好的预测和评估  相似文献   

8.
DNA甲基化是一种重要的表观遗传学修饰,能够参与基因表达调控从而影响生理活动.在病例-对照组研究中,利用甲基化水平定位与疾病相关联的基因功能区域,有助于了解甲基化调控基因表达的机制,为后续研究提供疾病关联基因的线索.目前检验甲基化差异区域的方法存在一定不足:一是缺乏定义差异甲基化区域的统一标准;二是检测结果存在横跨多个基因功能区域的现象,难以进行生物学解释.本文基于得分检验(Zscore test)提出了以基因功能区域为单位的检验差异甲基化水平的方法cZST.该方法的特点是依靠位点物理距离和染色体全局信息修正协方差矩阵.模拟研究表明cZST在亚硫酸氢盐测序数据样本量小、读数低、扰动位点多的情形下具有高功效,且优于现有方法.将cZST运用到乳腺导管癌真实数据中,检测出与疾病显著相关的661个基因功能区和81个单位点.基因注释分析说明了cZST方法的有效性,并发现Dbl、Pleckstrin基因家族及Rho调控基因的甲基化与乳腺导管癌紧密相关,为后续研究提供指引.  相似文献   

9.
针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整基因的近邻基因,以缺失值的最近邻区间为约束,采用混合编码将缺失值填补与聚类中心优化融入NSGA-Ⅱ进化过程,通过将数据集的统计信息与聚类结果共同作为缺失值填补因素,提升不完整基因表达数据的填补准确度及聚类性能.在多个基因表达数据集上的实验结果表明,所提算法得到了更接近真实表达值的填补结果及更紧凑的聚类效果,且聚类结果具有统计显著性.  相似文献   

10.
针对基因间共调控关系的特点和现有共调控基因聚类分析方法的不足,提出一种基于广义信息论中二次互信息的广义相似性度量标准QMISM,并利用免疫遗传算法将高维样本映射到二维空间,进而实现动态模糊聚类和聚类结果可视化.对人工合成数据和真实的基因表达数据的实验结果表明,该算法能得到更好的聚类结果.  相似文献   

11.
利用非负矩阵分解(NMF)技术,依据加强算法的稀疏性对患早期阿尔茨海默症(AD)样本的基因表达数据进行分析,提取对疾病早期诊断具有重要意义的显著基因,样本分类实验结果证明了算法的有效性.在此基础上,结合与炎症反应有重要关系的NF-κB等基因初步建立了与早期AD密切相关的基因表达调控网络结构图,为AD致病机理的探询、早期诊断与治疗等提供了有益的途径和方法.  相似文献   

12.
基于模型的基因表达聚类分析技术研究进展   总被引:4,自引:0,他引:4  
基因表达数据聚类分析能将功能相关的基因按表达谱的相似程度归纳成类,有助于对未知功能基因进行研究.基于判别的基因表达数据聚类方法具有无法准确确定类别的局限性,研究工作已转向具有更好聚类效果的基于模型的聚类方法.文中介绍了常见的基于模型的聚类方法及其特点,并就如何开发新的适合基因表达数据分析的基于模型的聚类算法进行了讨论.  相似文献   

13.
为深入了解阿尔茨海默症的发病机制,利用匹配的基因表达数据和miRNA表达数据,对miRNA的靶基因进行预测分析.首先对选择出的差异表达miRNA进行靶基因预测;然后利用HCTarget算法验证预测的靶基因;最后对miRNA及其靶基因构建调控网络.调控网络中包含11个已确定的与AD有关的miRNA及6个AD致病基因.通过分析网络发现miRNA及其靶基因在正常与患病两种情况下的活性变化趋势,生物学分析也证实了它们在AD中的重要作用,为AD发病机制研究提供了依据.  相似文献   

14.
为了研究p53基因与其下游/靶基因的关联性,以了解p53基因表达调控网络,采用文本数据挖取方法,利用自编的Perl 5.10程序,对PubMed文献数据库中p53基因相关文献及人类基因本体数据库进行数据挖掘,并利用连锁聚类法构建p53基因表达调控网络图.结果发现,目标基因的频率分布同文本中所有基因本体的频率分布存在一定的关联性,低频基因的文本挖掘比例明显低于高频基因的文本挖掘比例.从而说明,p53基因表达调控网络中各基因的分布情况与基因频率有较大关系,而文本数据量对文本数据挖掘的准确率也有重要影响.  相似文献   

15.
OPSM作为一种基于模式的双聚类方法,被广泛应用于基因数据矩阵的分析上.在一个OPSM聚类中,形成聚类的若干基因在特定的条件子集下具有一致的表达模式,其中隐含着基因的关联调控信息,对基因数据矩阵进行双聚类分析具有生物学意义.其中,Deep OPSM是OPSM聚类中行数少列数多的特殊聚类.根据OPSM模型,该文提出了一种快速有效的精确性算法,用于挖掘分散在基因数据矩阵中的OPSM聚类.首先寻找基因数据矩阵中任意两行的公共子序列,然后利用STL map对找到的公共子序列进行支持度统计,并将符合支持度阈值的OPSM聚类输出,且通过阈值的设置即可输出Deep OPSMs.结果证明该算法能够快速地找到符合条件的Deep OPSMs.通过P-value值分析,验证了找到的Deep OPSM具有明显的生物学意义.  相似文献   

16.
针对层次聚类算法高维度数据计算复杂度较高、抗干扰性较差、误差较大等不足,在结合基因表达式编程(GEP)非线性演化优越性能的基础上,提出一种基于GEP计算模型的层次聚类算法(GEPHCA),寻找经过基因遗传进化适应度最高的聚类中心.通过试验对比验证可知:基于基因表达式编程的自适应层次聚类方法在实际应用中是有效的,不仅能够实现自动聚类,而且和一般的聚类方法进行比较,具有自适应迭代、速度较快、稳定高效等优点.  相似文献   

17.
整合阿尔茨海默症患者6个脑区的基因表达数据和蛋白质相互作用数据,较好地避免了基因表达数据高噪声、高变异等不足对构建基因调控网络精度和准确性的影响.考虑到脑部神经炎症是AD发病的重要原因之一,以及钙平衡失调可能是AD几个致病因素联系的纽带,结合蛋白质网络挖掘与AD发病密切相关的基因及炎症和钙离子功能网络,采用最大权重诱导子图(Heinz)算法实现两种高通量数据的结合并提取显著扰动子网,在此基础上利用基于边权的模拟退火算法预测和优化扰动网络,去除网络中较弱的相互作用,添加预测的较强的相互作用,提高网络的精度.实验共提取206个特征基因,并且提取了脑部炎症及钙离子作用机制的功能模块子网.结果证明,使用基于边权的模拟退火算法进一步加强了功能网络的模块性.经生物学分析证明炎症和钙离子机制在AD致病机制中起着很大的作用.这些数据在不同方面为系统地认识基因的复杂调控机制提供了必要的信息.  相似文献   

18.
基因聚类结果的内部确认技术研究   总被引:3,自引:0,他引:3  
聚类分析是后基因组时代基因表达数据处理的主要技术之一.聚类确认是聚类分析过程中的必要环节,其目的是对聚类结果的质量和聚类算法的性能进行评估,有助于聚类结果的注释.选择有效的确认函数是正确评价聚类结果的前提.文中采用分层聚类、K-均值聚类和SOMs算法对标准基因表达数据集进行聚类分析,研究了Silhouette指数、Dunn's指数、Davies-Bouldin指数及FOM(Figure of merit)测量等内部确认函数在基因聚类分析中评价聚类结果质量的有效性.结果表明:Silhouette指数和FOM测量能较好地反映聚类算法的性能和聚类结果的质量,Dunn's指数因其对噪声的高度敏感性不能直接用于基因聚类结果的确认,Davies-Bouldin指数确认算法的能力好于Dunn's指数,但偏爱单连接聚类.上述研究结论将为基因聚类分析中聚类算法的评估与聚类结果的确认提供有价值的参考依据.  相似文献   

19.
本文利用非负矩阵分解(NMF)技术,依据加强算法的稀疏性对患早期阿尔茨海默 症(Alzheimer’s Disease,AD)样本的基因表达数据进行了分析,提取了对疾病早期诊断具有重 要意义的显著基因,样本分类实验结果证明了算法的有效性。在此基础上,结合与炎症反应 有重要关系的 NF-κB 等基因初步建立了与早期 AD 密切相关的基因表达调控网络结构图, 为 AD 致病机理的探询、早期诊断与治疗等提供了有益的途径和方法。  相似文献   

20.
定义了一种基于滑动匹配的相似度, 并在此基础上提出一种能够自适应确定聚类数目的全局K-均值算法, 解决了现有共调控基因聚类方法无法考虑到基因的正反、 延时、 部分时间和差异表达全部4种共调控关系的问题. 将提出的算法应用于微阵列数据中, 并将实验结果与CLUSTER 3.0算法进行了比较, 验证了算法的可行性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号