排序方式: 共有6条查询结果,搜索用时 15 毫秒
1
1.
一种文本讨论线索的自动获取方法 总被引:1,自引:0,他引:1
介绍了一种基于知识库的方式获取文本中讨论线索的方法.该方法根据文本出现的控制词与概念网中各个概念的关联,找出文本以及文本中各个段落的主题概念,并通过对概念网中的概念进行关系计算,获取文本的讨论线索,较好地避免了因文本叙述方式的不同以及指代的存在而带来的影响.实验结果显示,该方法对文本主题识别的准确率达82%,对段落主题识别的准确率达70%. 相似文献
2.
3.
本文探讨基于自然语言理解对Web信息进行数据挖掘的方法。对敏感信息监控的有效方法应将传统的Web数据挖掘的方法和自然语言理解方法相结合,寻求一种对Web页面进行更高精度的信息分析和数据挖掘,在此基础上实现对敏感信息监控的目的。 相似文献
4.
中文停用词表的自动选取 总被引:11,自引:0,他引:11
通过对现有基于统计的停用词选取方法的考察,提出了一种新的停用词选取方法.用该方法分别计算词条在语料库中各个句子内发生的概率和包含该词条的句子在语料库中的概率,在此基础上计算它们的联合熵,依据联合熵选取停用词.将该方法与传统方法选取的停用词表进行了对比,并比较了将各种方法用于文本分类的预处理时对分类效果的影响.实验结果表明,该方法更好地避免了语料的行文格式对停用词选取的影响,比传统方法更适用于文本分类的预处理. 相似文献
5.
计算机信息网络面临着来自内部和外部的威胁。网络的脆弱性和网络所面临的安全问题对国家和社会安全构成了潜在的威胁。着重分析计算机信息网络系统的脆弱性,所受到的系统内、外部的威胁攻击,以及所引发的信息社会的安全问题。 相似文献
6.
研究利用文本挖掘技术对已有的刑侦档案进行信息整合和文本挖掘,可以获取大量的有用知识,这些知识不论对刑侦研究,还是对于一线的刑侦工作都有很大的价值。文章对刑侦档案的信息整合和挖掘进行了初步探讨,给出面向刑侦档案文本挖掘的系统框架及文本精炼方法。 相似文献
1