首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对当今搜索引擎检索网站信息资源存在的一些问题,为了从浩瀚的网站信息资源中抽取潜在的、有价值的知识,依据概念格的理论,文中提出了将网站信息资源(主要是非结构化的Web文本)与其特征之间的关系通过概念格结构描述出来的方法.利用构造出来的概念格能够有效地抽取隐含在网站信息资源中潜在的、有价值的知识.  相似文献   

2.
针对当今搜索引擎检索网站信息资源存在的一些问题,为了从浩瀚的网站信息资源中抽取潜在的、有价值的知识,依据概念格的理论,文中提出了将网站信息资源 (主要是非结构化的Web文本) 与其特征之间的关系通过概念格结构描述出来的方法.利用构造出来的概念格能够有效地抽取隐含在网站信息资源中潜在的、有价值的知识.  相似文献   

3.
动态多值背景下的概念格在网络中的应用   总被引:1,自引:0,他引:1  
针对搜索引擎检索网站信息存在的一些问题—信息资源相对丰富而知识比较匮乏,文中提出动态背景下的概念格,用于抽取网络信息资源中潜在的有价值的知识。基于web文本的信息特性是不断变化的,在处理过程中,先把动态多值背景转化为静态多值背景,然后在转化成单值背景。在利用概念格的hasse图抽取隐藏在网络信息资源中潜在的有价值的知识。  相似文献   

4.
基于两级概念格的信息抽取的研究   总被引:1,自引:0,他引:1  
该文提出了结构关键词的概念,给出了结构概念格和内容概念格的形式化描述.结构概念格是对文档语义段的逻辑存储,内容概念格是对文档内容信息的逻辑存储.开发了一个基于文档的结构和内容构造两级概念格的信息抽取的实验系统.实验表明,该方法对减少信息抽取的时间和提高信息抽取的精度有显著的效果.  相似文献   

5.
针对客户的需求如何最大可能地发掘客户的兴趣,是一个电子商务网站所最为关心的内容。基于关联规则的挖掘技术可以从大量的数据中抽取潜在的、有价值的信息,而通过人工神经网络技术中的优化算法,则可以明显地提高数据挖掘的效果。  相似文献   

6.
秦渴 《创新科技》2015,(5):30-32
海量的数字资源蕴含着丰富、有价值的知识,如何有效地利用这些知识,解决信息过载而知识匮乏的矛盾成为学术界研究的重点。本文首先探讨了知识抽取的意义,然后从知识抽取实现方法和技术、知识抽取应用实践两个方面对国内外相关研究现状进行了调研和梳理,认为知识抽取未来的研究重点是以科学文献为主要研究对象、基于本体和语义模型的知识抽取技术的研究,构建以用户需求为中心、自适应、可移植的知识抽取系统三个方面。  相似文献   

7.
概念格应用于信息检索具有独特的检索和导航优势。基于概念格理论的基础上,研究民族信息资源概念格的存储与检索,为提高民族信息资源平台的检索效率提供参考。  相似文献   

8.
在电子商务网站中,根据客户的访问日志挖掘出有价值的信息,划分客户群体和发现潜在的客户,使网站可以提供个性化信息服务.Web日志挖掘是数据挖掘在Web页面上的应用,给出Web日志挖掘的步骤和方法,对Web日志挖掘工具进行分析,并应用到电子商务网站中,取得较好的效果.  相似文献   

9.
中文文本挖掘的特征导航机制   总被引:9,自引:0,他引:9  
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制,按概念层次和上下文环境展现用户所关心的内容  相似文献   

10.
基于模糊概念格构建的汽车评价知识库可以通过概念及格结构刻画知识与知识间的层次关系。若从汽车评价数据中挖掘关联知识将对汽车性能推理具有非常重要的作用。文章运用模糊关联规则格的方法对基于模糊概念格表示的知识库进行改进。为了提高模糊关联规则提取的性能,将部分参数进行重新定义,用于构建汽车评价的关联知识,以补充和完善模糊概念格表示的知识。在此基础上,依据模糊关联规则对汽车缺省的评价信息进行推理。  相似文献   

11.
现有自动解题系统从试题文本及相关资源获取解题知识,但由于试题本身潜在的复杂性与多样性,所获取的知识可能不足以支持实际解题,需要进一步获取其他解题知识.本文基于三支概念分析理论,通过构造试题文本三支概念格和决策规则提取,进一步挖掘试题文本中隐含的解题知识,在所收集数据集上进行的试验结果表明,本方法有效提升了自动解题系统的...  相似文献   

12.
为准确地获取动态的用户兴趣信息,提出了一种基于信息抽取的用户兴趣自动获取方法.该方法首先根据电子商务网站中商品的领域知识构建领域Ontology,然后基于该领域Ontology自动抽取用户事务的语义文本信息,并将结构化的信息存入内容数据库,最后通过分析这些数据库中信息的特征值取得用户兴趣的描述文件.在汽车销售网站上的应用实例表明了该方法的有效性.  相似文献   

13.
基于遗传算法的数据挖掘方法及应用   总被引:3,自引:0,他引:3  
车间作业调度问题的研究不仅具有重大的现实意义,而且具有深远的理论意义.该文采用数据挖掘算法从大量的车间作业调度中抽取一些有价值的信息或知识,然后应用这些知识来辅助车间作业调度.该研究的目的就是应用数据挖掘算法从车间作业调度最优方案(基于遗传算法的求解结果)中抽取出最优调度方案的一些模式知识,然后基于这些模式知识发展一些规则集来辅助车间作业调度.这些规则可以看作是隐含在车间作业调度最优方案中的事先未知的潜在有用的信息,根据这些规则可以产生比简单指派更好的车间作业调度方案.最后的数据实例表明本文方法无论在调度质量还是在计算速度上都具有非常好的性能.图3,表4,参15.  相似文献   

14.
高校网站对信息数据的整合需求日益增高,如何对数据进行合理的组织利用,使用户能够从海量的数据中找出有价值的信息和知识,是高校网站亟待解决的焦点问题.论文提出了将Web数据挖掘技术应用到高校网站的方法,有助于高校网站管理人员进行科学决策.  相似文献   

15.
历史信息、即时信息以及流言往往冲淡网站中的主题思想,导致信息隐藏等问题。为解决上述问题,提出了网站信息抽取系统的结构模型、数据结构和处理流程;该模型采用信息抽取技术,从相关网页中抽取出带有主观倾向的主题信息;采用贝叶斯网络对客户需求进行决策与预测分析。仿真测试与客户应用证明,该模型能较准确的抽取网站中的客户倾向、有较好的及时性。  相似文献   

16.
教学评价信息数据挖掘中数据的转化和分析研究   总被引:2,自引:0,他引:2  
数据挖掘就是从大量数据中,抽取隐含的,但又是潜在有用的关联信息和知识发现过程。其中关联规则(Association Rules)的挖掘是一个重要的问题,是大量数据中项集之间有趣的关联或相关联系。介绍了关联规则的概念,并将数据挖掘中的关联规则挖掘应用到教学评价中,从而得到一些对提高教学质量或水平的有用知识。  相似文献   

17.
对只能获得部分标记的训练文本,将主动学习方法应用到文本信息抽取中,提出了一种基于主动学习隐马尔可夫模型的文本信息抽取方法.在该方法中,通过主动学习,仅将对隐马尔可夫模型的训练最有价值的训练文本挑选出来进行标记.实验表明,通过选择模型信任值的最佳门槛值,该方法在保证文本信息抽取性能的前提下,大大减少了用户标记训练文本的工作量.  相似文献   

18.
数据挖掘技术研究   总被引:1,自引:0,他引:1  
随着信息技术迅速发展,数据库的规模不断扩大,产生了大量的数据。但大量的数据往往无法辨别隐藏在其中的能对决策提供支持的信息,而传统的查询,报表工具无法满足挖掘这些信息的需求。因此,需要一种新的数据分析技术处理大量数据,并从中抽取有价值的潜在知识,数据挖掘(Data Mining)技术由此应运而生。本文主要介绍了数据挖掘的基本概念,以及数据挖掘的方法。  相似文献   

19.
越南语是一种典型的资源稀缺型语言,汉越平行语料较为稀少,但在如维基百科、双语新闻等网站上存在大量的汉越可比语料.而从可比语料中抽取平行短语对任务能够有效缓解低资源机器翻译中面临的数据稀疏性问题.考虑到上下文语义信息对抽取高质量的双语短语对有重要支撑.提出了融合上下文语义信息的汉越平行短语对抽取方法.首先使用汉、越单语语...  相似文献   

20.
王蓓 《科技信息》2010,(28):281-281
随着21世纪信息时代的来临,网络技术和信息技术飞速发展。信息是企业最重要的资源,企业网站是信息资源最重要的发布和获取途径之一。因此,及时的、有效的、连续的、安全的信息资源,成为保持和增进企业活力的可行、有效途径。传统的静态网站只能提供信息,不能与使用者交互。采用基于数据库的动态网站技术可以改善传统网站的可用性、降低管理成本和提升企业知识平台。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号