首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
《Nature》2007,445(7125):229-230
  相似文献   

2.
文档挖掘与降维技术   总被引:8,自引:3,他引:5  
提出了基于虚拟数据库和分层数据库的档挖掘的一般模型,讨论了用于降低输入空间维数的维削减技术,以提高挖掘效率、改善挖掘性能。实验结果表明中的方法是可行的。  相似文献   

3.
The toxic chemicals from the database Registry of Toxic Effects of Chemical Substances (RTECS) were analyzed by structural similarity comparison, which shows that the structure patterns or characteristics of toxic chemicals exist in a sufficiently large database. Then, a two-step strategy was proposed to explore noncongeneric toxic chemicals in the database: the screening of structure patterns by similarity comparison and the derivation of detailed relationship between structure and activity by using comparative molecular field analysis (CoMFA) of Quantitative Structure-Activity Relationship (QSAR) technologies. From the performance of the procedure, such a stepwise scheme is demonstrated to be feasible and effective to mine a database of toxic chemicals. It can be anticipated that database mining of toxic chemicals will be a new area for predictive toxicology of chemicals.  相似文献   

4.
在商业、医疗等数据分析中,不知道存在或不存在的一些项目事件组成的数据叫做不确定数据,它的特点是离散型随机变量的概率分布,不确定数据中的挖掘算法研究是当前大数据分析中的重要方向.针对不确定数据的随机变量性特征,有效提高挖掘结果的置信度和提高算法运行时间,本文提出一种挖掘析取关联规则的算法DRUD,利用模糊集的方法选取2元频繁项集,对比最小支持度,完成有效的析取规则提取.经过在大量不同不确定数据库中仿真表明,对比类似算法UApriori和PFCIM,本文所提出的DRUD算法产生的规则置信度得到提高,算法效率有较好改进,新的算法更加适用于不确定数据中的大数据挖掘应用.  相似文献   

5.
结合模式匹配、生物医学本体及共现技术,设计了一种自动抽取基因与疾病、基因与基因之间关系的文本挖掘方法,并开发了一个可以处理海量文本数据的系统.该系统可抽取与疾病相关的基因实体,挖掘基因与疾病、基因与基因之间的关系,衡量基因与疾病实体的相关性,并为分析基因与疾病、基因与基因之间的关系提供了网络可视化工具.实验结果表明,系统在测试数据集上抽取基因与疾病之间的关系可获得83.0%的综合测评率,抽取基因与基因之间的关系可获得78.5%的综合测评率.该系统已成功应用于乳腺癌及相关基因的研究.  相似文献   

6.
收集2010—2014年国家社科基金档案学领域立项课题,基于课题名称进行分词等预处理,得到词项-文档矩阵,依据词项重要性设计局部及全局权重,组合局部与全局权重,得到词项-文档矩阵权重值。利用奇异值分解SVD进行特征降维,研究在不同维度下近5 a国家社科档案学立项课题研究主题。经过可视化分析得到社科档案学七大研究主题为:非物质文化遗产保护、电子文件管理、数字资源建设及体系、档案信息资源价值与挖掘、档案保护机制、档案馆研究、档案信息安全。  相似文献   

7.
分布式数据库的精简频繁模式集及其挖掘算法   总被引:1,自引:0,他引:1  
对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境下的频繁模式集的精简表示方法,以及一种基于各站点的全局大项目集的全局频繁闭项集和全局最大频繁项集的挖掘算法.该算法具有占用空间少、通信量小等特点.最后用实例进行了证明.  相似文献   

8.
针对商业库存数据库中存在大量冗余特征和噪声,许多数据挖掘算法对于目标数据的维度非常敏感,随着数据特征的增加,算法的时间空间开销也急剧增加.商业库存决策支持数据挖掘算法利用粗糙集技术对数据作预处理,分析过滤这些冗余的例子,减少了噪声的干扰,减少了训练数据,运用粗糙集的分类算法和浮动搜索算法对浮动搜索算法进行了改进.并用此算法进行了仿真实现,验证了改进后算法的优越性.  相似文献   

9.
数据挖掘是计算机科学研究的重要领域之一.文章从主从关系数据集的角度开展关联规则挖掘研究,首先构建了主从关系数据库模型,在此基础上提出一种基于元组ID逆传输的关联规则挖掘算法(TIDRP),避免了挖掘过程中数据的集成过程,减少了资源的消耗,并使挖掘出的规则更符合实际情况.  相似文献   

10.
Brumfiel G 《Nature》2008,453(7198):975-976
  相似文献   

11.
本文首先介绍了文本分类算法,并针对基本粒子群算法在收敛性能上的缺陷, 提出了具有量子行为的粒子群优化算法, 把它应用于文本主题挖掘和文本分类. 实验结果显示,这种文本分类方法和基本粒子群算法比较, 提高了文本分类的准确率、召回率, 具有很好的性能.  相似文献   

12.
现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常有限的,即使有经验的程序员也很难仅从数据库模式完全领会该数据库建模的领域知识,因此程序员必须依赖详细的数据库设计文档才能构造SQL语句以正确地表达特定的查询.为此,本文提出一种利用词典扩展数据库模式信息的Text2SQL方法,该方法从数据库表名和列名解析出其中的单词或短语,查询词典获取这些单词或短语的语义解释,将这些解释看成是相应表名或列名的扩展内容,与表名、列名及其他数据库模式信息(主键、外键等)相结合,作为模型的输入,从而使模型能够更全面地学习数据库建模的应用领域知识.在Spider-syn和Spider数据集上进行的实验说明了所提出方法的有效性,即使自然语言查询中使用的表名和列名与数据库模式中对应的表名和列名完全不同,本文方法也能够得到较好的SQL翻译结果,明显优于最新提出的抗同义词替换攻击的方法.  相似文献   

13.
基于数据挖掘和策略决策的研究及它们的结合,针对数据量大,具有交互特点的金融营销数据库提出了一个新的数据挖掘和决策分析算法.并以一个实际系统为例,证明了算法的有效性,同时证明了这个算法也适用于其他领域的复杂自主系统.  相似文献   

14.
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法.  相似文献   

15.
16.
矿区土地复垦是一个复杂的系统工程,建立矿区土地复垦信息系统需要构造概念模型,E—R模型是构建数据库概念模型的一种有效方法。它己广泛应用于GIS需求分析和GIS数据库概念模型的设计。依据相关的研究成果,并结合矿区土地复垦数据的特点对E—R模型进行了修改和扩充,阐述了适合表达矿区土地复垦数据特点的空间E—R模型;为建立矿区土地复垦信息系统的逻辑模型和物理模型提供了理论基础。  相似文献   

17.
针对目前数据越来越多 ,而提取有用数据越来越困难的现状 ,参照流行的观点 ,提出了解决该问题的数据挖掘 (DM)和知识发现 (KDD)的一种方法 .在DM和KDD中应用主动时态数据库技术 ,提出构造一个原型系统的模型  相似文献   

18.
本文介绍了如何建立心律失常复方数据库系统,并讨论了如何将数据挖掘技术中的关联规则发现算法应用于治疗心律失常疾病的传统中药复方数据库系统中,用于发现中药单方之间的配伍规律,获取中医药药方治病机理等,实现对信息的深度开发,并且为人类专家的决策提供高层次的支持,为临床准确、合理选用方剂或为以后的新药研制提供有价值的参考.  相似文献   

19.
20.
从山科学到云科学:即将发生的科学革命和人才革命   总被引:1,自引:0,他引:1  
刘益东 《科技资讯》2011,(14):11-13
信息技术的大规模应用和相关的认识、理念、规则、标准、方法、理论的一系列创新,形成了云科学。它改进、更新、提升了支配学术活动和科技运行的核心要素,使科研经费和科研资源得到充分合理的配置与高效利用,使得优秀人才能够及时胜出并充分发挥作用,学术活动和科技运行的效率及品质得到大幅提升,科技体制由此发生巨大变革,科学事业从工业时代全面进入信息时代。这是一场科学革命与人才革命,可称之为云科学革命。创建高层次创新人才特区是这场云科学革命的启动方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号