首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 578 毫秒
1.
双聚类作为一种无监督的学习方法,其作用是对基因表达数据进行分析.为了获取较大容量的双聚类簇,弥补传统的双聚类方法在基因表达数据一致波动性方面的不足,引入粗糙集的上、下近似集概念,将粗糙集理论运用到模糊双聚类算法中,将粗糙上、下近似集与加权均方残差相结合,得到新的粗糙均方残基,进而提出一种基于粗糙均方残基的模糊双聚类算法.针对基因表达数据集,首先进行缺失值填补;其次,用非负矩阵分解算法对基因数据集进行降维;最后,计算数据矩阵的粗糙均方残基,结合综合评判度量函数与贴近度原则对矩阵的行列进行删除和添加,得到容量更大的双聚类结果.实验结果表明,该模糊双聚类算法是有效的.  相似文献   

2.
双聚类是微阵列基因表达数据分析中很实用的一种数据挖掘技术,它是一种同时对微阵列基因和条件进行聚类的方法,用来挖掘基因子集在条件子集下所体现出来的生物模式。传统的双聚类算法对于庞大的基因表达数据处理效率很弱,考虑在j Metal平台上实现基因表达数据的双聚类的一种新的研究方法及思路。同时考虑加入并行策略,提高算法的效率。在酵母啤酒细胞基因表达集和人类B-细胞两个标准数据集上对两个算法进行实验验证,表明所提出算法比其他多目标双聚类算法呈现出更好的优越性。  相似文献   

3.
双聚类算法的出现促进了生物基因分析领域的发展,简单介绍双聚类算法的起源、概念、目的及主要模型,对现有主要模型的优势与不足进行分析,并对常用双聚类算法的实验方法进行概括。  相似文献   

4.
OPSM作为一种基于模式的双聚类方法,被广泛应用于基因数据矩阵的分析上.在一个OPSM聚类中,形成聚类的若干基因在特定的条件子集下具有一致的表达模式,其中隐含着基因的关联调控信息,对基因数据矩阵进行双聚类分析具有生物学意义.其中,Deep OPSM是OPSM聚类中行数少列数多的特殊聚类.根据OPSM模型,该文提出了一种快速有效的精确性算法,用于挖掘分散在基因数据矩阵中的OPSM聚类.首先寻找基因数据矩阵中任意两行的公共子序列,然后利用STL map对找到的公共子序列进行支持度统计,并将符合支持度阈值的OPSM聚类输出,且通过阈值的设置即可输出Deep OPSMs.结果证明该算法能够快速地找到符合条件的Deep OPSMs.通过P-value值分析,验证了找到的Deep OPSM具有明显的生物学意义.  相似文献   

5.
基于多目标优化的双聚类算法能够同时优化均方残差和尺寸等多个相互冲突的目标,更好地挖掘出均方残差较小、尺寸较大的双聚类,提出了一个多目标人工蜂群双聚类算法.该方法首先采用组信息对蜜源进行编码,然后使用2种交叉和1种变异操作分别实现算法的局部搜索和全局搜索,最后根据非劣排序和拥挤距离对外部档案进行修剪.在2套真实的基因表达数据集上进行实验,结果表明:与其他公开算法相比,多目标人工蜂群双聚类算法具有较好的收敛性和种群多样性,同时挖掘出具有显著生物意义的双聚类.  相似文献   

6.
刘美娟  杨志辉 《江西科学》2021,39(5):790-796,819
利用互联网技术及时掌握顾客需求的变化,是现代企业进行产品设计的一项重要任务.在Kano模型中,每个需求只能属于一个需求属性,而客户需求是动态的,会随着职位、偏好等的变化而变化.因此,传统的聚类算法已经不能对客户需求做出更为准确的分析.针对如何掌握顾客需求的方向问题,提出基于贪心迭代搜索的双聚类算法的方法进行研究分析.首先,针对某类产品在线评论进行筛选和过滤,挖掘其中潜在的信息,确定顾客需求要素;其次,利用顾客对不同需求要素的满意度评分数值来建立顾客-需求矩阵;最后,分别使用传统聚类算法和双聚类算法对该矩阵进行研究.研究结果表明,双聚类算法的结果更有效一致,更容易发现数据的相关性,可以为相关行业提供有用的顾客需求信息.  相似文献   

7.
基于信息熵改进的 K-means 动态聚类算法   总被引:3,自引:2,他引:1  
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题.因此,提出一个改进的K-means算法.改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果.实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升.  相似文献   

8.
对基因表达数据进行双聚类分析是生物信息学领域的一种重要技术方法,但双聚类问题已被证明属于NP难问题.目前针对基因表达数据的双聚类算法都存在时间效率较低的问题.为此,采用遗传算法与粒子群优化算法相结合的混合进化算法来求解基因表达数据的双聚类问题.实验结果表明,所提算法在明显减少运行时间的同时,仍能保证良好的聚类效果.  相似文献   

9.
一种改进的模糊C均值聚类算法   总被引:1,自引:1,他引:0  
由于现有模糊C-均值聚类算法固有的局限性,本文提出了一种改进的模糊C-均值聚类算法.首先用概率密度函数来确定初始聚类中心点和聚类数,其次用竞争学习思想提出使对手增加抑制因子来修改隶属度得到加快收敛速度的效果,最后提出用一个类内差异与类间差异兼备的新的有效性指标来作为迭代条件的目标函数.通过实验获取参数的最优取值范围,通过与经典模糊C-均值聚类算法的比较,证明了该改进算法不仅加快了收敛速度,而且在聚类结果的质量上有一定程度的提高.  相似文献   

10.
权重基因共表达网络分析( weighted gene co-expression network analysis, WGCNA) 可通过聚类鉴定共表达的基因模块来研究生物学数据与相应性状之间的关系。为了挖掘甘蔗响应低温的特异基因,揭示甘蔗响应低温的分子调控机理,本研究以3个耐寒能力不同的甘蔗品种作为试验材料,利用转录组测序技术分析不同抗性甘蔗品种在低温胁迫(4℃)下基因表达。研究结果表明,WGCNA鉴定出13个基因共表达模块,通过相关性分析筛选到blue和yellow模块作为甘蔗抗寒机理研究的目标模块。基于blue和yellow模块中筛选关键基因,以及筛选抗寒品种中特异表达基因,最终筛选出13个基因可能与甘蔗抗寒能力密切相关,为后续选育耐寒性强的优良甘蔗新品种提供理论依据和技术支撑。  相似文献   

11.
利用人骨形成蛋白-4(hBMP4)与人骨形成蛋白-7(hBMP7)的成熟肽cDNA片段制备转基因毕赤酵母菌株,实现了hBMP4与hBMP7在巴斯德毕赤酵母细胞中的共表达.Western-blotting分析表明,表达产物含有hBMP4与hBMP7,片段大小分别为26 kD和17 kD,均为单体蛋白.  相似文献   

12.
分析细胞周期蛋白B2(CCNB2)在肾透明细胞癌中的表达及与临床预后的关系,建立CCNB2共表达网络并探讨其潜在的作用机制。采用GEPIA和UALCAN数据库分析CCNB2在肾透明细胞癌临床样本中的表达情况,获得CCNB2与肾透明细胞癌的病理分期及预后的关系,同时检测肾透明细胞癌及癌旁临床组织中目的 m RNA的表达;通过c Bioportal和String数据库分析CCNB2在肾透明细胞癌的功能作用,建立CCNB2共表达网络;DVIAD和KEGG数据库在线分析共表达网络功能及富集的信号通路。结果表明:CCNB2在肾透明细胞癌组织中高表达,并且与肾透明细胞癌的病理分期及预后呈现正相关性。从c Bioportal数据库获得肾透明细胞癌患者数据,挖掘得到CCNB2表达关系密切的83个基因,建立CCNB2功能网络。进一步采用DVIAD和KEGG数据库在线分析发现富集的基因主要参与细胞周期、卵母细胞减数分裂和卵细胞成熟通路等信号通路,共表达基因功能显示为微管结合、微管运动活性和微管蛋白结合等。因此,CCNB2在肾透明细胞癌组织中显著高表达,并与患者预后、临床病理分期呈正相关,这些预示着CCNB...  相似文献   

13.
双聚类(Biclustering)算法是一种横向纵向同时进行的数据挖掘的聚类算法,主要用于生物信息学上对高维复杂的数据进行聚类,以平均平方残基作为筛选标准,贪婪迭代的方法来选取数据.传统双聚类算法聚出来的簇通常不是预想的结果,迭代次数越多偏差就越大,对于庞大的数据精确度会更小,而模糊集理论可以改进这种迭代产生偏差与得不蓟预想结果的不足.为了获得更加好的实验结果,用模糊数学中的隶属矩阵和综合评判等方法改进双聚类的算法,使得聚类结果更精确更具有一致性,便于发现数据的关联性.  相似文献   

14.
针对目前的轨迹聚类隐私保护方法仍然存在适用性较窄、可用性较低以及难以在实际应用中实施的问题,提出了支持轨迹聚类的差分隐私保护方法,首先给出了典型轨迹聚类算法的通用框架模型及其差分隐私定义,然后根据定义设计满足差分隐私机制的二维拉普拉斯噪声,最后将直角坐标系中得到的噪声形式变换到极坐标系,并加入到原始轨迹点中以进行实际应用实现.实验结果表明,本文算法具有更好适用性,与当前的轨迹聚类隐私保护方法相比,在相同保护强度下,本文算法具有更好的聚类效果.  相似文献   

15.
为有效识别内含子 miRNA 及其宿主基因共表达模式, 提出了一种基于集成特征选择的识别方法。 首先 使用基于支持度的集成特征选择算法, 获取相关性和稳定性较高的特征子集, 再使用封装式特征选择方法结合 FCBF(Fast Correlation-Based Filter)搜索策略进一步去除冗余特征和弱相关的特征, 获得最优的特征子集。 实验 结果表明, 该方法融合了多个特征选择方法的优点, 能提高学习模型的泛化能力并能有效识别内含子 miRNA 及其宿主基因的共表达模式。  相似文献   

16.
基于互信息的差异共表达致病基因挖掘方法   总被引:1,自引:0,他引:1  
为了挖掘基因表达数据中的差异共表达致病基因模块,提出了基于互信息和最大团相结合的方法.互信息用于度量基因表达谱之间的相互关系,计算任意2条基因表达谱在2种不同样本中的互信息值,得到2个互信息矩阵M1和M2,选定2个阈值T1和T2(T1T2)将矩阵M1和M2二值化,并通过M1和M2中元素的逻辑"与"运算得到图的邻接矩阵,从邻接矩阵挖掘出的最大团则为差异共表达致病基因模块.将该方法应用于Colon数据,选定T1=2.2,T2=1.0,得到6个相互重叠的最大团,实验结果表明,该方法能有效挖掘出差异共表达致病基因模块.  相似文献   

17.
【目的】为获得可应用于酯类水解及合成的脂肪酶资源,本研究通过筛选分离得到能够水解长链脂肪酸酯的脂肪酶产生菌,克隆表达其脂肪酶基因并研究脂肪酶的酶学性质。【方法】从环境中筛选分离出可水解三硬脂酸甘油酯的菌株,利用16SrDNA对其进行分子鉴定,并扩增其脂肪酶基因和脂肪酶分子伴侣基因。以pET-22b(+)为表达载体,构建共表达重组质粒,转化Escherichia coli BL21(DE3)进行异源表达,并对重组酶进行酶学性质研究。【结果】经16SrDNA鉴定该菌株为产碱假单胞菌Pseudomonas alcaligenes。通过PCR成功克隆到该菌的脂肪酶基因(lipPA-9A)和脂肪酶分子伴侣基因(lipPA-9B),并构建共表达重组质粒pET22b-lipPA-9A-9B,实现脂肪酶LIP-9A的活性表达。酶学性质研究表明LIP-9A的最适反应温度为35℃,最适反应pH值为10.5,最适反应底物为对硝基苯酚辛酸酯(pNPO);同时,LIP-9A还可以催化醇和羧酸发生酯化反应产生酯类物质。【结论】LIP-9A在碱性条件下具有较高活力,且可以催化酯化反应,在洗涤行业和酯合成领域具有一定的应用价值。  相似文献   

18.
大数据环境下,为了提高支持向量机(support vector machines, SVM)在网络安全应用环境下的性能,提出了面向大数据的超启发式SVM网络安全框架。所提超启发式SVM框架由SVM和超启发式框架组成,超启发式框架的作用是生成配置参数,并将其发送到SVM,SVM使用生成的配置来解决给定的问题,然后将成本函数发送到超启发式框架。超启发式框架分为高层策略和低层启发式,高层策略具有搜索性能,可以控制选择低层启发式并生成新的SVM配置;低层启发式算法构成了一组特定于问题的启发式算法,使用不同的规则实现对SVM配置搜索空间的探索。该框架自适应地集成了基于分解和基于Pareto方法的优点,近似SVM配置的Pareto集,解决了启发式框架的优化问题。实验结果表明,所提框架性能优于其他算法,说明框架的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号