首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
设计了一种基于主题的Web文本聚类方法(HTBC):首先根据文本的标题和正文提取文本的主题词向量,然后通过训练文本集生成词聚类,并将每个主题词向量归类到其应属的词类,再将同属于一个词类的主题词向量对应的文本归并到用对应词类的名字代表的类,从而达到聚类的目的.算法分四个步骤:预处理、建立主题向量、生成词聚类和主题聚类.同时,对HTBC与STC、AHC、KMC算法从聚类的准确率和召回率上做了比较,实验结果表明,HTBC算法的准确率较STC、AHC和KMC算法要好.  相似文献   

2.
针对聚类分析精度和效率低的问题,设计了一种聚类算法FBCLUS.应用卷积定理和傅里叶变换,提出了频率滤波法来消除噪声的干扰;提出了单阈值、多阈值幅度滤波法消除噪声和提取不同密度的感兴趣区间;提出一个数学形态学算子提取聚类簇.实验表明:FBCLUS算法能够发现任意形状的聚类;速度快,计算复杂度为O(N);能够发现不同密度的聚类簇;抗噪声性能强;对网格大小有一定的适应性.FBCLUS算法有很高的聚类精度和效率.  相似文献   

3.
方莹 《科技信息》2008,(18):49-50
关键字的上下文环境是自然语言处理的基础知识,其自动抽取是很多研究的基础和关键。本文主要研究了从百度搜索页面中提取出搜索关键字的文本信息,并将这些文本信息进行分词处理,最后基于去重算法将词语上下文去重的方法。算法的关键过程包括关键字的环境提取、文本分词和提取到的信息的入库三部分。  相似文献   

4.
多雷达多目标航迹起始算法研究   总被引:4,自引:0,他引:4  
提出了一种基于聚类分析与逻辑法相结合的集中式多雷达航迹起始算法。首先采用聚类算法对传送到融合中心的数据进行聚类,使每一类中的数据代表同一个目标,并找出聚类中心作为等价的单雷达的量测,从而使航迹起始过程相对简化;在起始算法中根据目标的运动特点,对逻辑法进行了一定的改进。仿真试验证明了该算法的有效性。  相似文献   

5.
聚类算法作为大数据与人工智能领域重要的分析工具,受到了学术界的高度关注与广泛研究。本文从算法设计思想的角度对现今主要的聚类算法进行了归纳总结。具体来讲,针对中心聚类法、层次聚类法、密度聚类法、谱聚类法以及一些其他聚类算法分析了各自算法及其思想的优缺点与适用性,对算法的实际应用建立指导性作用。  相似文献   

6.
提出一种基于改进后缀树与交互聚类思想相结合的算法ISTC算法, 通过改造传统后缀树结构实现了对文档标题和摘要的层次化聚类, 同时用交互聚类的方式替代了传统的递归算法. ISTC算法具有语言无关性, 不仅适用于基于单词的西方文字, 而且可以在不引入词典分词技术的情况下有效地处理基于单字的中文字符. 在此算法基础上, 设计并实现了基于改进后缀树算法的交互聚类引擎, 在不同的网络环境下对其 进行了系统测试, 并与其他元搜索引擎进行了对比. 实验结果表明, 使用改进后缀树算法进 行实时交互式聚类是可行的.  相似文献   

7.
赵源 《科技信息》2010,(35):58-58,49
本文在中文分词技术的基础上,提出了一种基于中文文本主题提取的分词方法,以概念语义网络的思想构造主题词典,描述词间概念语义关系,采用改进的最大匹配算法对文本进行切词,既提高了分词的准确性,又能识别文中的未登录词,并同步完成主题词的规范工作。从而在概念层次上理解用户的需求,实现概念检索,提高查准率。  相似文献   

8.
纹理图像分割的首要问题是纹理特征的提取和描述。传统的统计纹理描述方法和结构纹理描述方法各有其自身特点,但也存在各自的不足。文中从结构与统计结合的角度,提出了一种基于灰度秩数的结构性统计方法,该方法可以较好地抽取物体表面的结构特征。在用本算法对纹理进行描述的基础上,文中采用了一种广义最小体积椭球聚类算法(GMVE)来对所抽取的纹特征进行了聚类分割。算法的有效性在对实际纹理分割中得到了验证。  相似文献   

9.
提出一种面向大规模数据的特征趋势推理算法. 首先, 采用Hash函数抽取大规模数据样本, 使用Pam聚类算法和并行K means聚类算法对大规模数据样本进行聚类, 获取最佳聚类结果后, 提取大规模数据聚类的动态特征; 其次, 采用基于特征趋势规则的推理算法, 构建大规模数据特征的趋势规则推理模型, 并通过累计趋势规则方法设计趋势规则算法, 推理大规模数据特征趋势, 解决了推理结果误差较大的问题. 实验结果表明, 该算法对大规模数据特征趋势推理的准确率均值为98.10%, 推理速度增长率为50%, 推理耗时最大均值仅为114.25 s, 能快速准确地完成数据特征趋势推理.  相似文献   

10.
针对传统问答系统答案抽取方式对答案片段的分词和上下文语义理解准确性的依赖严重,抽取过程耗费大量的人力和时间的问题,提出采用分步抽取答案的方法,先从答案片段中抽取包含答案的句子,再从提取的答案句中进行最终答案的抽取方式。在答案句抽取过程中使用Bi-LSTM( Bi-directional Long Short-Term Memory)和Max Pooling 结合的方法构建答案句抽取模型。实验结果表明,在答案句的抽取中,该模型的MRR( Mean Average Precision) 指数接近0. 75。  相似文献   

11.
"把"字句是现代汉语处置式的主要表达形式。处置式有两种:"将"字式和"把"字式。汉语史上,"把"字句成为处置式的主要表达形式经历了漫长的过程,我们梳理了"把"字句取代"将"字句成为主要表达形式的过程,并从"把"和"将"的虚化时间、句法结构形式、语体色彩、语义等角度对这个过程产生的原因进行探讨,认为"把"字句成为处置式主要表达形式符合汉语语法、语义、词汇以及语用选择的需要。  相似文献   

12.
写作是当前大学英语教学中需要进一步加强的重要方面,应按照循序渐进的方法组织教学。首先要进行大量的段落专项写作训练,然后才能转入篇章的写作练习。可从段落主题句、扩展句及结论句三个方面入手,提高英语段落写作的水平。  相似文献   

13.
汉语句型的功能分析是汉语语法研究的一个新课题。这种分析不是在西方句法“主动宾”框架之上的“语用”分析,更不是以往所谓的“句类”分析,而是汉语句子结构类型的本体研究,是在深刻认识了汉语文化特征后,汉语语法学理论和方法的新的选择。  相似文献   

14.
连谓句与兼语句的对比研究   总被引:1,自引:0,他引:1  
连谓句和兼语句的区分是语法研究的一个重点,是对一些特定形式句子的归属问题。连谓句和兼语句是两种容易混淆的句式,文章从概念、类型、特点等几个方面分析了这两种句式的区别。  相似文献   

15.
通过对英语句子的剖析、归纳、分类,概括出英语句子的根句型,即英语5种基本句型(简单句的5种基本句型外加一些特殊句型),重点指出这几种句型基本涵盖了所有的英语句子,旨在强调其在英语学习中的重要性,帮助英语学习者在英语学习过程中,不断增强根句型概念,正确使用英语句型,使他们能够尽快掌握英语语言的核心内容,以便更好更快地学好英语。  相似文献   

16.
重点介绍科技日语中被动句的种类,并通过例句分析各种被动句的特点以及翻译技巧。同时,还剖析了科技日语中形态相似的自发句与被动句的区别。  相似文献   

17.
与英语四级作文要求相比,除了字数的要求外,在英语六级作文考试,拿到高分的要求更高。不仅要求考生像四级考试一样,做到文章通顺,切题,无错误。还要求考生掌握更多的固定表达方式,以及更多的短语,句式。更多的使用复合句和复杂句。多用重句。在理解题目要求的基础上,多联系实际,多展现自己对于英语学习的掌握。  相似文献   

18.
如何撰写英文摘要   总被引:1,自引:0,他引:1  
本文叙述了英文摘要的主要写作方法.并给出了写英文摘要时常用的句型.注意事项与例子。  相似文献   

19.
句首出现的表示时间、处所、范围、条件之类的修饰语,是全句的修饰语。目前,中学生的作文往往存在不重视“语序”,未能把全句修饰语放到“合适”位置的问题,所以,应该理解全句修饰语的作用,从修辞的角度认识全句修饰语的位置,认识“位置的选择取决于修辞的需要”,从而解决中学生作文语言中存在的问题。  相似文献   

20.
单部完全句与带有一个主要成份的双部不完全句的区别在于主要成份的表达形式不同,人称形式或行为主体的表达方法也各异。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号