首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
基于查询扩展和分类的信息检索算法   总被引:4,自引:1,他引:4  
岳文  陈治平  林亚平 《系统仿真学报》2006,18(7):1926-1929,1934
文本信息检索是处理海量文本的重要手段之一,针对短查询串中出现的查全率高但查准率低的问题,引入一种基于查询扩展和分类的信息检索算法。该算法在检索的第一阶段利用自动相关反馈方法扩展用户递交的短查询串增加查询信息,在第二阶段使用文本分类技术辅助检索。分析和实验结果表明:新的算法比传统的查询扩展检索算法具有更好的查准率和查询效率。  相似文献   

2.
基于分类和关键词组抽取的信息检索算法   总被引:7,自引:0,他引:7  
钟敏娟  林亚平  陈治平 《系统仿真学报》2004,16(5):1009-1012,1016
本文提出一种基于分类和关键词组抽取的信息检索算法。该算法利用文本分类和信息抽取技术辅助检索,避免了向量空间模型算法中时间复杂度过大,查准率不高的缺点。针对传统的信息检索性能指标无法有效地衡量检索结果的排序状况,本文还引入了排序误差率概念用于评价检索结果的排序。实验结果表明,所提算法与TFIDF算法、基于分类的交互式检索算法相比,具有更快的查询速度,更高的查准率和更小的排序误差率。  相似文献   

3.
生物医学文献知识发现研究探讨及展望   总被引:8,自引:0,他引:8  
采用文本挖掘技术处理海量生物医学科技文献和文本注释型数据库。从而发现创新知识如基因、蛋白质、疾病、药物及其相互关系的研究是当前人工智能和数据挖掘领域研究的热点。本文对生物医学文献知识发现的研究内容、研究成果以及基于文本挖掘的关键技术诸方面进行了系统的分析和阐述。通过分析中医药学数据的特点,提出了基于文本挖掘的中医证候分子生物学知识发现研究,该方法的特点是综合利用中医药学文献和MEDLINE,能够获得创新的证候与基因相关知识。初步实验表明,文本挖掘技术有望为证候的分子水平研究提供辅助和支撑手段。  相似文献   

4.
针对领域本体构建过程中获取概念间语义关系的困难, 提出了一种新的本体关系学习方法——概念特征词法, 支持自动化地构建领域概念间的关系集合. 该方法首先基于语境将领域概念表示为特征词向量模型, 然后通过计算向量的相似度来确定两个概念之间是否存在语义关系. 依据领域专家定义的金标准, 对概念特征词法的学习结果做了详细的性能分析. 结果表明: 相较于已有方法, 本文方法的准确率和召回率更令人满意. 概念特征词法可广泛应用于本体构建、文本挖掘和语义检索等领域.  相似文献   

5.
杨瑞平  赵东波  郭齐胜  曾令卓 《系统仿真学报》2006,18(12):3338-3341,3345
建立了指挥实体任务规划的概念模型,分析了任务规划中指挥实体的思维过程,提出了与这一思维过程相适应的,案例和规则相结合的任务规划方法,对该方法中的知识袁示,案例检索和知识推理等内容分别进行了深入、细致地研究,建立了任务规划流程和任务规划下仿真运行流程。仿真应用结果表明,该任务规划方法适合仿真应用。  相似文献   

6.
面向应用领域的知识系统建模及实现   总被引:1,自引:0,他引:1  
针对知识系统建模过程中不同类型知识的组织、表示、控制和实现等问题,将用户需求作为重要的切入点,通过对用户的需求分析和分解将知识系统数据结构划分为领域概念知识(概念本体)、领域系统知识(方法本体)、需求分解知识(需求本体)、知识系统控制知识和解释知识5大部分,建立了各部分的数据结构,明确了相互之间的关系。提出了基于层次案例规划(hierarchicalcase basedplanning,HCBP)的需求本体建立检索及面向目标的黑板控制结构和改进算法。实例测试表明,该方法不仅有利于不同类型知识块的重用,而且提高了系统的执行效率,大大缩短了知识系统的开发周期。  相似文献   

7.
基于案例推理的冷轧负荷分配模型研究   总被引:5,自引:0,他引:5  
针对冷轧负荷分配的特点,提出了一种基于案例推理的冷轧负荷建模方法,着重研究了基于粗糙集和神经网络的快速案例检索以及利用数据库中的知识发现技术进行案例修改,经现场数据对比实验表明所建模型更符合实际轧制情况。  相似文献   

8.
AIS—基于文本挖掘的增强型Web信息处理技术   总被引:1,自引:1,他引:0  
回顾了中文和英文语言环境下的Web文本挖掘现状,阐明了其现阶段的特点和技术瓶颈.之后提出了一种基于Web文本挖掘的网页内容挖掘技术:AIS(Augmented information support),介绍了相关实现所涉及的基础技术和功能.最后将AIS技术应用于香山科学会议网站,开发了AIS4XSSC文本挖掘系统并展示了现阶段其主要功能.实践表明AIS技术能够从大量的Web文本中有效提炼信息,提高用户检索效率并向用户推送有价值的信息.  相似文献   

9.
本文是文献「1-3」的继续,本文及后续论文仍锂系统地研究因素空间理论及其在知识表示中的应用。首先讨论反馈外延的精细化问题,介绍两种提高精度的方法。剖分法和三角模法。然后,研究概念内涵的表达问题,给出概念外延与概念内涵的相互转化方法。  相似文献   

10.
本文是文献[1~3]的继续,本文及后续论文仍将系统地研究因素空间理论及其在知识表示中的应用.首先讨论反馈外延的精细化问题,介绍两种提高精度的方法:剖分法和三角模法.然后,研究概念内涵的表达问题,给出概念外延与概念内涵的相互转化方法.  相似文献   

11.
结合词性分析与串频统计的词语提取方法   总被引:4,自引:1,他引:3  
在介绍分析现有主要提词方法的基础上,提出并实现了一种结合词性分析与串频统计的词语提取方法.文章首先详细描述了该方法的原理与框架,同时结合实例说明了其实现过程.然后将该方法与已有的具代表性的文本提词方法作计算结果的对比分析,结果表明该方法能够提取得到电子文档中包括原子词与合成词在内的所有词语,并且准确率与召回率较之前的方法均有很大提高.优良的自动提词结果能够保证文本自动处理的性能,进而促进相关领域的自动化程度与性能的提高.  相似文献   

12.
汉语自动分词的研究现状与困难   总被引:31,自引:0,他引:31  
张春霞  郝天永 《系统仿真学报》2005,17(1):138-143,147
汉语自动分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础研究课题。尽管已被研究了二十多年,分词仍然是中文信息处理的瓶颈问题。基于对汉语自动分词研究的现状分析,构建了自动分词的形式化模型,论述了影响分词的诸多因素,分析了分词中存在的两个最大困难及其解决方法。最后指出了目前分词研究中尤其是在分词评测方面存在的问题以及未来的研究工作。  相似文献   

13.
基于广义粗糙近似的信息检索方法研究   总被引:1,自引:0,他引:1  
基于广义粗糙集———条件概率粗糙集,给出一种新的信息检索模型。分别研究了对于精确的特征词条空间和精确的文档及查询、精确的特征词条空间和模糊的文档及查询、模糊的特征词条空间和模糊的文档及查询这3种情况下的信息检索方法。用户可以根据相关反馈信息来调节特征词条间的支持度,获得满意的检索结果,从而满足自己的信息需求。仿真实例表明该信息检索模型的有效性和实用性。  相似文献   

14.
模糊信息处理是信息科学领域的一个热点和难点。针对一类带有三角模型的模糊信息系统,提出一种基于粗糙集的有序规则获取方法。证明了三角模糊数之间基于可能度的序关系是一种弱序关系,进而将模糊信息系统转化为二元信息系统,利用粗糙集理论推理出模糊信息系统的最优有序规则。仿真实例表明了该方法的有效性。  相似文献   

15.
模糊检索系统研究   总被引:1,自引:0,他引:1  
模糊性是人类思维和客观事物普遍具有的属性之一。为了克服现行计算机信息系统的局限性 ,模糊检索应运而生。运用模糊技术开发的计算机信息系统既允许用户用自然语言进行信息查询 ,又能给出输出信号项与用户查询的关联度 ,协助用户完成信息处理任务 ,因而具有一定的人脑进行模糊信息处理的能力。简要讨论了模糊检索系统的结构 ,模糊知识库及其管理 ,模糊数据库的组织等。  相似文献   

16.
Text mining, also known as discovering knowledge from the text, which has emerged as a possible solution for the current information explosion, refers to the process of extracting non-trivial and useful patterns from unstructured text. Among the general tasks of text mining such as text clustering, summarization, etc, text classification is a subtask of intelligent information processing, which employs unsupervised learning to construct a classifier from training text by which to predict the class of unlabeled text. Because of its simplicity and objectivity in performance evaluation, text classification was usually used as a standard tool to determine the advantage or weakness of a text processing method, such as text representation, text feature selection, etc. In this paper, text classification is carried out to classify the Web documents collected from XSSC Website (http://www.xssc.ac.cn). The performance of support vector machine (SVM) and back propagation neural network (BPNN) is compared on this task. Specifically, binary text classification and multi-class text classification were conducted on the XSSC documents. Moreover, the classification results of both methods are combined to improve the accuracy of classification. An experiment is conducted to show that BPNN can compete with SVM in binary text classification; but for multi-class text classification, SVM performs much better. Furthermore, the classification is improved in both binary and multi-class with the combined method.  相似文献   

17.
模糊信息系统知识约简的分辨函数法   总被引:2,自引:0,他引:2  
知识约简是粗糙集理论的重要研究内容.针对不同的粗糙集模型和约简定义,给出相应的知识约简方法一直是知识约简的主要任务.以分辩函数法为代表的各种符号值信息系统知识约简方法已得到深入研究.将分辨函数引入模糊信息系统,得到相应的知识约简分辨函数法,并通过实例分析说明了该方法的具体计算步骤.这为从模糊信息系统中获取知识提供了一种有效的粗糙集方法.  相似文献   

18.
1  IntroductionThe information retrieval is one of the common operations in computer informationsystems ( CIS for short) . With the development of information society and thepromulgation of computer applications,the information retrieval has become one of theindispensable tools in human daily life.However,the CISs in existence are all based oncommon set theory and boolean logic.Under this frame,the information items stored indatabases are all determinate information,and information queries…  相似文献   

19.
在多传感器融合算法的基础上,提出一种基于小波分析的雷达/红外模糊自适应融合算法。因为小波分析对测量数据具有多分辨率分析的去噪能力,将小波分析与模糊自适应卡尔曼滤波器相结合构成一个多分辨率跟踪滤波器,该算法可以对来自主动雷达和红外成像传感器的信息加以充分利用,选择适合的小波函数对测量数据进行过滤优化,把干扰负荷转移到小波分析上,在改善跟踪性能的同时又具有很强的处理非平稳信号的能力,而且又保证了该融合算法简单、实用的特点。仿真结果表明,提出的融合算法有很好的跟踪精度,通过对比表明该算法优于传统的多传感器融合算法。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号