共查询到20条相似文献,搜索用时 0 毫秒
1.
自动编制中文标题的主题词轮排索引及自动抽词 总被引:3,自引:0,他引:3
自动从中文文献标题中抽出主题词的代用品并且自动编制中文标题的主题词轮排索引,是国内外都关心着的一个难题,本文提出了一种算法,可在一定程度上部分地解决这个难题。 相似文献
2.
根据汉语语言的特点,对以中文文本数据库为数据源的汉语关键词自动转换主题词的方法进行了探讨.其方法是通过现有工具和计算机编程语言实现中文文献的分词、筛选统计,然后与主题词表进行匹配,并将最终转换的主题词进行存储. 相似文献
3.
一种用于自动标引系统的主题词自动切分方法 总被引:2,自引:0,他引:2
该文着重介绍一种知识指导下的主题词自动切分方法,该方法能灵活处理自然主题词、大幅度跳跃及关联词的切分问题,其字面切分精度达99.33%,综合切分精度达98.91%。 相似文献
4.
为了更好地挖掘投资者情绪,解决在股市文本情绪分析过程中,现有情感词典构建方法自动化程度低、行业特异性不足和精确度不足等问题。在构建基本情感词典的基础上,Word2vec对自动添加的高频情感词语进行极性判断与赋值,并将情感词典构建改为优化问题,采用改进模拟退火算法对情感词典的词语分值进行优化,提高股市情感词典性能。实验结果表明:该方法所构建的股市情感词典可以有效识别股市文本情绪,提升文本覆盖率,具有更强的行业特异性,提升情绪分析准确性,可更好用于投资者情绪相关研究。 相似文献
5.
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%. 相似文献
6.
臧青 《芜湖职业技术学院学报》2008,10(1):13-15
从不同结构的词典中可自动构建出一部复合词典的算法。新的复合字典中同时包含有源词典的分类信息和语义信息,自动补充部分源词典中不存在的信息。 相似文献
7.
钣金件工艺过程自动编制方法 总被引:1,自引:0,他引:1
随着人工智能的发展和应用,不少研究人员采用专家系统、神经网络等方法探索创成式CAPP的研究,根据作者开发的钣金件计算机辅助工艺设计系统,详细地介绍了运用专家系统原理进行工艺过程自动设计的原理和方法,提出采用网络图来描述零件信息和表达工艺决策路线,并利用分层推理的方法和灵活的知识表达以解决CAPP系统开发的复杂性,实现了系统的实用性、开放性、智能性要求. 相似文献
8.
9.
部件编程是VB应用程序开发中的一个重要方法,欲使用许多现有的或用户自已开发的ActiveX部件所提供的强大功能,都可通过这种方法来实现.本文介绍了一种在vB中利用ActiveX部件自动生成图表的例子,效果很好. 相似文献
10.
11.
《宁夏大学学报(自然科学版)》2021,42(3)
随着突发事件的频发,对突发事件在线评论进行倾向性分析引起了广泛关注,情感词典是其中重要的资源.对面向突发事件的情感词典自动构建方法进行探讨.基于对大规模评论数据的统计分析,提出采用基于词性标注和snownlp的方法实现突发事件情感词典的自动构建.为验证构建词典的有效性,设计基于情感词典的情感倾向性分析模型.结果表明,词典构建方法在准确率和召回率方面效果较好.基于该词典的情感倾向性分析模型的性能较基础模型性能有较大的提升. 相似文献
12.
根据汉语中二字词较多的特点,提出了一种新的分词词典机制.该机制在词典数据结构中添加二字词检测位图表,在分词时,利用位图表可快速判断二字词优化分词速度.选取人民日报语料片断进行了实验测试.实验结果表明,基于二字词检测位图表的分词词典机制有效地提高了汉语自动分词的速度和效率. 相似文献
13.
《湖北民族学院学报(自然科学版)》2020,(2)
在形状匹配领域中,部件表示法是一种应用十分广泛的方法,它能够有效提高形状识别算法的健壮性,并且在形状分类理论中也发挥着重要作用.因此,深入分析东巴象形文字的图画特征,结合形状匹配领域中的部件表示法,给出了适用于东巴象形文字特征部件的自动计算及提取算法.该算法通过双分辨率采样使得到的特征部件既具有完整性且相互独立,又保留了文字较多的局部细节特征,并且只需少量样本就能准确计算同类字符的特征部件数量.该算法具有良好的尺度、平移和旋转不变性,并且在输入字符存在局部几何扭曲或较多噪音点时也具有较好的鲁棒性.与传统的形状局部特征曲线提取算法相比,该算法对特征部件的提取,以及字符所包含的部件数量计算都是自动完成的,不需要过多的人为干预,从而为东巴文字的相似性比较、检索和识别研究奠定基础,同时也为其他象形文字的研究提供技术参考. 相似文献
14.
针对中文字库制作开销过大的问题, 提出一种基于部件拼接的高质量中文字库制作方法。参考汉字相关规则与信息, 选取供用户书写的少量汉字集合, 将书写的汉字分割至部件级别。根据汉字部件成字关系, 拼接产生剩余汉字, 最终生成完整GB2312标准(共包含6763个中文字符)的高质量中文字库。实验表明, 所提出的字库制作系统实现了快速生成个性化中文字库的功能, 在保证生成字库质量的前提下, 显著降低了个性化中文字库的制作时间。 相似文献
15.
本文在剔除了飞参记录数据中的伪读数后,针对某性发动机飞参系统数据漏记的现象,制定出有效的解决方案,进而利用雨流计数法统计了该型发动机的涡轮部件载荷谱,为今后开展涡轮部件强度和寿命分析工作奠定了基础。 相似文献
16.
17.
本文根据现有消防规范要求,提出防爆火灾报警系统部件如火灾探测器、手动火灾报警按扭等的选型、应用,确保易燃易爆场所的消防安全。 相似文献
18.
一种基于词共现图的文档主题词自动抽取方法 总被引:11,自引:0,他引:11
主题词抽取是文本自动处理的基础性工作.在对现有主题词抽取方法深入研究的基础上,提出了一种基于词共现图的文档主题词自动抽取方法;该方法以基于词频统计方法为基础,利用在词共现图形成的主题信息以及不同主题间的连接特征信息自动地提取文档中的主题词,旨在找出一些非高频词且又对主题贡献大的词.实验表明了该抽取方法抽取出的主题词更能准确地符合了作者的主题. 相似文献
19.