共查询到20条相似文献,搜索用时 531 毫秒
1.
机器学习在生物信息学中的应用 总被引:3,自引:0,他引:3
机器学习具有从数据和经验中获取知识的学习能力,能用于从大量生物数据中提取知识的过程。生物信息学是一个融合多门学科的领域,包括分子生物学、计算机科学、物理化学和数学。机器学习算法已成为生物信息学中数据分析算法的主要内容。介绍了典型的机器学习方法以及它们在生物信息学中的应用。 相似文献
2.
杨恒宇 《合肥工业大学学报(自然科学版)》2012,(9):1212-1216
生物序列数据是生物信息数据中重要的一部分,研究生物序列解读其隐含的生物学意义是生物信息学研究的热点和难点。数据挖掘是当前分析大规模数据的有效工具之一,已广泛应用于分析生物序列数据,并取得了许多研究成果。文章综述了生物序列数据挖掘的关键技术,包括序列比对算法、DNA序列模式挖掘、关联、分类、聚类分析、RNA二级结构预测、蛋白质序列分类和聚类分析,最后展望未来研究方向。 相似文献
3.
计算机科学的核心内容是使用算法处理离散数据,组合数学的重要性日渐凸显.使用形式化方法PAR开发了两个组合数学问题的算法,形式化推导过程为问题求解提供了思路,自然地引进了算法程序中用到的变量,清晰地展示了算法程序的设计过程,最终可得到简洁、易理解、可靠性高的算法程序.对形式化方法开发组合算法做了积极的探索,有利于促进组合算法设计自动化的研究及形式化开发方法的推广应用. 相似文献
4.
5.
马尔仑 《内蒙古师范大学学报(自然科学版)》2020,49(4)
BLAST序列比对算法是NCBI综合性生物信息平台整合的众多重要功能之一。研究建立BLAST算法的脱机环境移植,可使生物信息学研究人员在构建自己专有序列数据库的同时,对DNA序列进行脱机环境比对,以期更高的序列数据安全性,避免联网状态下造成的数据丢失和泄露等严重问题。通过研究BLAST序列比对过程中涉及的标准数据格式与调用细节,实现了脱机环境下的BLAST序列比对,为建立安全序列比对提供了一种可行参考。 相似文献
6.
机器学习技术在生物信息挖掘中的方案探讨 总被引:1,自引:0,他引:1
后基因时代,探索和解释隐藏在分子生物学数据库中的有用信息是对生物信息学研究人员的巨大挑战!为了解决分子生物学中遇到的这些难题,有效及廉价的方法是非常必要的.机器学习是一个崭新的计算机应用领域,而生物信息学是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科.本文分析了机器学习技术的内容,介绍了生物信息学的内涵和新的应用技术,同时探索了机器学习技术对生物信息挖掘应用的途径.这些方法有助于加速生物分子结构预测、基因发现、基因组学和蛋白组学等方面的研究进展. 相似文献
7.
8.
后基因时代,探索和解释隐藏在分子生物学数据库中的有用信息是对生物信息学研究人员的巨大挑战!为了解决分子生物学中遇到的这些难题,有效厦廉价的方法是非常必要的.机器学习是一个崭新的计算机应用领域,而生物信息学是生物学与计算机科学以厦应用数学等学科相互交叉而形成的一门新兴学科.本文分析了机器学习技术的内容,介绍了生物信息学的内涵和新的应用技术,同时探索了机器学习技术对生物信息挖掘应用的途径.这些方法有助于加速生物分子结构预测、基因发现、基因组学和蛋白组学等方面的研究进展. 相似文献
9.
近年来,随着生命科学研究的不断发展,生物信息学这个利用智能算法处理生物数据的新型交叉学科越来越受到科研工作者的关注.机器学习在智能算法的研究中占据极其重要的地位,而机器学习中的半监督分类学习在生物信息学中有着广泛应用.以半监督分类学习中的间谍算法为例,首先回顾了半监督分类学习的发展历程,分析了该方法的研究现状,然后描述了间谍算法在生物信息学研究中的应用,最后总结了间谍算法的优势和局限性,并且讨论了可以改进的方向和未来的发展. 相似文献
10.
2004年7月5—7日在土耳其伊斯坦布尔召开的第13届组合模式匹配国际会议(简称CPM’04)是关于生物信息字符串算法方面的会议。会议云集了百余名不同领域的科学家,包括数学家、计算机科学家和生物信息学家。中国有两名代表出席了会议。 相似文献
11.
胡光华 《国外科技新书评介》2006,(10):11-11
生物信息学代表了科学查询的一个新领域,是专门利用计算资源来回答有关生命的问题。生物信息学的关键性目标是创建能够储存及分析大的生物数据集合的数据库系统与软件平台。鉴于生物数据集合的多样性、生物数据按指数律地增加以及希望能为开放式科学交换共享数据,生物信息学界在不断地探索数据表示、存储及交换的新选择。在过去的几年中,许多生物信息社团转向了使用可扩展标记语言(XML)来满足与生物数据相关的迫切需求。XML正在迅速地成长为生物信息学与生物数据交换的关键性工具。 相似文献
12.
13.
生物信息学是生物技术的核心,序列比较是生物信息学中最基本、最重要的操作,通过序列比较可以发现生物序列中的功能、结构和进化的信息,序列比较的基本操作是比对。描述了常用的各类双序列比对算法,并结合实例进行了详细的解释,最后指出了序列比对算法目前存在的问题。 相似文献
14.
该文研究带有工业约束和凹的交易费函数的离散单因素投资组合模型.与传统的投资组合模型不同的是,该模型中投资组合的决策变量是交易手数(整数),其最优化模型是一个非线性整数规划问题.为此提出了一个基于拉格朗日松弛和连续松弛的混合分枝定界算法,而且分别采用股票市场的真实数据和随机产生的数据来测试该算法的有效性. 相似文献
15.
序列比对是生物信息学中基本的信息处理方法,对于发现生物序列中的功能、结构和进化信息具有重要的意义。该文对典型的双序列比对算法以及多序列比对算法进行了描述和评价;针对目前序列比对算法普遍存在的不足,提出了一种新的思想--基于知识表达系统的序列比对研究,应用知识表达系统对序列比对相似性发现进行定义及其处理。 相似文献
16.
针对目前离散化信息量度无法准确表征数据离散后有效分类信息量的问题,提出了一种基于有效信息比率的离散化算法.在构建离散化方案相依表的基础上,分析了离散区间内类属性分布与分类信息蕴含量间的关系,并根据类属性分布信息引入有效信息比率,用于表征各离散区间内有效分类信息量.然后,依据离散化方案的离散区间数及其有效信息比率,设计出表征离散化方案划分质量的离散化评价指标,从而提高了数据的离散化效果.仿真实验和实际应用的结果表明,该算法离散化后在有效分类信息量和分类预测精度上高于主流基于信息论的离散化算法. 相似文献
17.
生物信息学是用数理和信息科学的观点、理论和方法,以计算机为工具对生物信息进行获取、处理、存储、分配、分析和解释的一门学科,它是生物学、医药学、计算机科学、物理学和数学等学科的有机结合。本书讲述了在癌症研究中所使用的生物信息学分析技术、方法和实验平台等,向读者展示了如何使用生物信息学方法进行癌症相关的研究,以及作为一个连接基础科学与临床应用的桥梁,生物信息学方法是如何积极地影响癌症患者的治疗的。 相似文献
18.
19.
研究带有基数限制的离散多因素投资组合模型.与传统的投资组合模型不同的是,该模型中投资组合的决策变量是交易手数(整数),且限制资产投资的最大数目,其最优化模型是一个非线性整数规划问题.分别用随机产生的一组数据和来自纳斯达克的40只股票数据,利用拉格朗日松弛的混合分枝定界算法求解此模型,并用FORTRAN语言编程,数值结果表明该算法能有效求解此模型. 相似文献