首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
针对现有的中文文本情感分析方法不能从句法结构、上下文信息和局部语义特征等方面综合考量文本语义信息的问题,提出一种基于特征融合的中文文本情感分析方法.首先,采用Jieba分词工具对评论文本进行分词和词性标注,并采用词向量训练工具GloVe获取融入词性的预训练词向量;然后,将词向量分别作为引入Self-Attention的BiGRU和TextCNN的输入,使用引入Self-Attention的BiGRU从文本的句法结构和文本的上下文信息两个方面综合提取全局特征,使用TextCNN提取文本的局部语义特征;最后,将全局特征和局部语义特征进行融合,并使用Softmax进行文本情感分类.实验结果表明,本文方法可以有效提高文本情感分析的准确率.  相似文献   

2.
为在保证中文歧义包容和长度限制的同时提高中文全文检索的速率, 在现有中文分词算法的基础上, 提出了一种改进的中文分词算法。通过在算法中建立索引的过程建立文本中相关词与词库的映射, 对词库进行改造, 使之更好地与相关词进行映射, 以便于实现中文分词。实验证明, 改进的中文分词算法能降低检索耗时, 是已有的分词算法的1/2和1/5, 有效提高中文全文检索的速率。  相似文献   

3.
基于统计学和语义信息的中文文本主题识别技术   总被引:3,自引:0,他引:3  
由于中文分词处理的复杂性在一定程度上限制了中文信息抽取技术的发展,因此,快速有效地抽取中文文本主题的需求越来越突出.该文主要通过中文分词技术、频繁词查找和词性组合计算来分析词与词之间的关联并最终提取出能够表达文章内容的主题词汇,同时还对这些词汇作了记分和排序.读者能够通过这些词汇来判定文章的主题和重要内容.通过对人民日报语料进行实验表明,该方法正确率能够保持在66%以上,同时对于网页邮件等真实文档也有较好的测试结果.  相似文献   

4.
提出一种基于语境相似度的中文分词一致性检验方法。首先利用词法和句法层面的特征, 设计基于构词、词性和依存句法的分类规则, 再使用预训练词向量, 对不一致字串所在语境的语义信息进行编码, 通过语境间的语义相似度对不一致字串进行分类。在人工构建的36万字分词语料库中进行分词一致性检验, 结果表明该方法能够有效地提高中文分词一致性检验的准确率。进一步地, 使用3 种主流中文分词模型在修正一致性后的分词语料中重新训练和测试, 结果表明该方法可以有效地提高分词语料库的质量, 3种中文分词模型的F1值分别提高1.18%, 1.25%和1.04%。  相似文献   

5.
针对传统的壮文分词方法将单词之间的空格作为分隔标志,在多数情况下,会破坏多个单词关联组合而成的语义词所要表达的完整且独立的语义信息,在借鉴前人使用互信息MI方法来度量相邻单词间关联程度的基础上,首次采用互信息改进算法MI~k和t-测试差对壮文文本分词,并结合两者在评价相邻单词间的静态结合能力和动态结合能力的各自优势,提出了一种MI~k和t-测试差相结合的TD-MIk混合算法对壮文文本分词,并对互信息改进算法MI~k、t-测试差、TD-MI~k混合算法三种方法的分词效果进行了比较.使用人民网壮文版上的文本集作为训练及测试语料进行了实验,结果表明:三种分词方法都能够较准确而有效地提取文本中的语义词,并且TD-MI~k混合算法的分词准确率最高.  相似文献   

6.
现有分词工具应用于医学文本,出错率高,并且现有分词工具所参照的词性标注规范集,用于医学文本标注,也明显表现不足。文章基于医疗卫生文本研究依存句法,旨在发现医疗卫生文本词特征和句法特征,构建一定规模依存句法树库,为提高医疗卫生领域汉维机器翻译质量提供优质数据资源。重点研究了语义依存,不仅全面掌握词性标注特征,提出建议;而且着重发现医疗卫生文本数据独特的词间关系,标注并保存,获得医疗卫生领域语义依存树库。同时,总结的特殊句法规则,为下一步实现自动化后处理提供依据。  相似文献   

7.
针对汉语自动分词后词条的特征信息缺失的问题,提出以词串为分词单位的中文文本分词方法,将整个分词过程分解为三个子过程:首先,采用逆向最大匹配法对文本进行切分;第二,对切分结果进行停用词消除;第三,计算第一次分词得到的词条互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串。实验结果表明,词条组合后的词串的语义信息更丰富,有助于文本特征选择效果的改善和文本分类性能的提高。  相似文献   

8.
中文分词是中文信息处理领域的重要技术,现已成为中文信息处理研究中最成熟的领域.融合多策略的中文分词算法模型在字典匹配的基础上引入了标注统计和规则理解的优化策略,将已有的句法、语义研究应用到分词排歧与未登录词识别领域.通过实验对比,初步证实分词效果较好,达到模型分词的准确率和自适应性的提升.  相似文献   

9.
基于语义的汉语文献主题词提取算法研究   总被引:10,自引:0,他引:10  
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.  相似文献   

10.
基于word2vec和BERT词向量技术的方法在文本分类分词过程中存在着错误传播问题,提出了融合ERNIE词向量技术的卷积神经网络模型.针对中文文本,运用ERNIE实体掩码的方式捕获词汇和语义信息,使用卷积神经网络进行特征提取.在THUCNews开源数据集上,准确率达到93.95%,比Word2Vec-CNN高出3.4%,BERT-CNN高出3.07%.实验结果证明了本文模型在缓解错误传播问题的有效性.  相似文献   

11.
阈值分割是一种被广泛使用的图像分割技术,其技术关键,确定合适的分割门限。为了体现图像中因模糊不确定性产生的信息量,本文在Ostu算法的基础上引入隶属度的概念,提出了模糊最大类间方差法。通过利用亚采样图像获取分割门限,提高了算法效率。实验仿真结果表明:该方法在分割质量上取得了很好的效果,时间复杂度也有所降低。  相似文献   

12.
引入二值图像的升高变换,并结合小波变换提出一种IC图像纹理分割算法.在纹理分割过程中,首先对IC图像进行小波分解并对二值化后的近视部分进行升高变换,然后利用原图像信息识别出不同纹理,分割出不同区域.实验表明,该算法快速、高效,具有很好的实用性.  相似文献   

13.
为解决工业机器人机械手末端避障路径规划需要花费大量时间,且规划的路径可能会包含大量冗余分段点的问题,提出一种基于分段点迁移递归(RSPM)和递进约简(PS)的机械手末端避障路径规划方法.通过RSPM算法可以在碰撞段上形成分段点并进行迁移,进而递归处理各分段路径,得到一条无碰撞基础路径.通过PS算法可以去除基础路径上的冗余分段点,得到最终路径.结果表明:RSPM-PS算法能快速规划更短的基础路径且能快速有效缩短路径长度.  相似文献   

14.
 图像分割是图像分析的基础。实际应用中,待分割图像的可变性较大,且时常混杂噪声,因此在很多情况下,基于一维直方图的经典图像分割算法常束手无策。近年来,基于二维直方图的二维图像分割算法已逐渐成为图像分割的热点。本文针对基本遗传算法在优化二维模糊熵图像分割算法中存在的易于早熟的不足,提出了一种改进的遗传算法。提出的改进遗传算法通过定义适应度极值距离,实现了进化过程中“代内”和“代间”的模糊评价。较之基本遗传算法,改进算法对个体的评价更加合理、客观和科学,而且算法整体收敛性能和全局搜索能力显著提升。实验结果表明,将其应用于二维模糊熵图像分割算法的优化,可显著提高算法的执行速度。由于引入模糊评价,本文提出的算法虽然较之基于基本遗传算法的二维模糊熵图像分割算法在时间开销方面虽略有增加,但获得的分割效果更佳。  相似文献   

15.
乔诚  李连东  王秀丽 《太原科技》2008,169(2):47-48
ITK(The Insight Toolkit)是一个开放的、面向对象的类库,它提供了强大的二维医学图像处理功能,主要用于医学图像的预处理、分割及配准.针对医学图像的特点.利用ITK实现了基于分水岭算法的医学图像分割.  相似文献   

16.
基于图像处理的烟叶叶片结构分类算法   总被引:2,自引:0,他引:2  
针对采用传统工艺方法进行烟叶叶片结构检测和分类的缺点,介绍了图像处理和分析技术在烟叶叶片结构分类识别中的应用,讨论彩色图像分割、连通区域标记、面积的检测、识别和分类等主要的图像处理算法,提出一种动态的烟叶叶片面积大小分类的算法,它是基于类的分离度思想而提出的.该算法对于不同品质的烟叶图像具有自适应性,且计算准确、速度快,能满足实时性要求.此算法已有效地应用于烟叶叶片结构自动分类系统,并取得了令人满意的效果.  相似文献   

17.
汉语孤立词声韵分割算法的研究   总被引:2,自引:0,他引:2  
文章从汉语语音评价系统设计的需要出发,针对DTW算法和汉语音节的特点,研究并实现了汉语音节中声母和韵母分割的两种算法,算法依据的基础都是依据不同类语音段数据相异的原理.在实际系统测试中,发现基于段间距离的分割算法取得了良好的实验结果,可以作为汉语语音评价系统中的声韵分割算法.  相似文献   

18.
针对目前基于模糊C-均值聚类图像分割算法的噪声敏感问题, 提出一种基于无监督可能性聚类的自动加权图像分割算法. 该算法先应用均值漂移迭代确定可能性C-均值聚类算法的初始化中心, 利用可能性聚类的模式搜索性质自动确定聚类划分; 然后根据像素间灰度值关系进行图像加权, 通过将加权系数与像素噪声的可能性相关联, 降低噪声对图像分割的影响. 实验结果表明, 相对于基于模糊C-均值聚类的图像分割算法, 该算法不仅取得了较好的分割效果, 而且无监督分割时计算效率更高, 对噪声的鲁棒性更强.  相似文献   

19.
针对文本图像提出了一种基于小波域混合状态HMT(Hidden Markov Tree)文本图像子带分割算法.该算法在充分考虑经二维小波变换后各子带之间相关性的同时,分别对背景、文字、图片三种纹理建立了不同状态的HMT模型,并且通过计算机仿真实验说明了陔算法的有效性。  相似文献   

20.
基于边界剥离分水岭算法的重叠颗粒分离研究   总被引:1,自引:1,他引:0  
针对采集的洗煤厂煤尘图像颗粒重叠严重的问题,运用传统图像二值化方法处理速度慢、不适用于低对比度指纹图像。分水岭分割算法对噪声敏感和易于产生过分割问题,为了提高图像分割的效率和鲁棒性,提出一种新的基于边界剥离距离变换分水岭算法的图像分割方法。该方法通过将图像分割为不相交的N个子窗口,并求出各个窗口对应像素的灰度均值,经改进动态阈值法进行二值化处理,得到的二值化图像经边界剥离距离变换获得灰度图像,最后利用分水岭算法对图像进行分割处理。数值实验结果表明,与传统分割方法比较,此方法处理效率高、鲁棒性好。不但成功地解决了分水岭存在的过分割问题,还大大提高了算法的搜索效率;可以快速准确地分割出目标,是一种有效的图像分割方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号