首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
科技论文重复刊用的根源及对策分析   总被引:1,自引:0,他引:1  
从期刊的整体性出发,分析了产生科技论文重复刊用的内因与外因;根据内外因作用的辩证关系,从内因入手寻找彻底杜绝重复刊用的有效方法;消除了产生重复刊用的内因,使外因发生作用的条件发生改变,从而也消除了外因对重复刊用的影响,从源头上彻底根绝重复刊用的发生.  相似文献   

2.
针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种强化文本关联语义和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行语义分析,解决长距离依赖问题;利用隐含狄利克雷分布算法捕获缺陷报告文本的主题特征,同时针对缺陷报告的类别信息,构建一种特征提取网络计算类别差异特征;最后基于3类特征向量进行综合检测。实验结果表明,该模型实现了更优的检测性能。  相似文献   

3.
杨生举  马燕玲 《甘肃科技》2011,27(13):10-11,23
在科研项目的申请、立项和决策过程中,目前存在重复申请、重复立项、评审专家与评审项目不匹配、项目的过程趋同等问题,这些问题严重制约了项目评审、立项的公正和公平,也缺乏科学性和合理性.本项目利用信息抽取、信息检索、自然语言处理、关联分析、文本分类、文本聚类等文本挖掘技术,解决科技计划项目管理中的关联问题,包括项目之间的相似...  相似文献   

4.
当今社会文献的生产和增长的速度越来越快,社会文献的类型也变得丰富复杂。社会文献的时效性强导致了传播速度加快,文献的内容也出现了交叉、重复等错误,这些问题使人们在查阅和利用上变得更加不方便。针对上述问题,设计基于关联规则的图书馆中文文本自动分类方法。从这些图书馆产生的问题入手,计算图书馆中文文本,设计数据预处理按预定规则收集处理信息和提取关键词检索文本信息的方法,利用计算机解决问题,方便了图书馆的自动分类和识别。  相似文献   

5.
在总结常用特征集合的基础上,根据微博文本的特点以及特征选取原则,选取了适合微博文本体裁分析的特征集合,这些特征能典型的反应微博文本和其他文本形式的区别.还分别对不同的文本体裁进行特征值的统计,并将统计结果在不同的文本体裁之间进行了深入的对比分析,并从体裁的角度分析出不同文本体裁的特征值差别的原因.并从体裁特征的角度说明微博文本是一种新的体裁文本.  相似文献   

6.
文本消重是搜索引擎中的一项重要技术,能将搜集到的网页中的近似镜像网页去掉,而后再建索引提供服务,这样用户查询时就不会出现大量内容重复的网页。通过对近似镜像文本检测算法的分析和研究,提出了应用MD5指纹的近似镜像算法对文本文档进行消重处理的方法,并将该算法在基于P2PKM的学习支持平台上的索引模块中作了测试。测试结果表明,这种算法的应用,知识包中的重复文档有了明显的减少。  相似文献   

7.
为了从不同的文本获取干净、有效的信息,首先要做的是删除重复的内容,而问题的核心是字段的匹配。目前大部分的字段匹配算法主要针对英文,对于中文的字段匹配算法还存在许多缺陷。为解决中文文本匹配准确度较低的问题,通过分析汉语语法的特点以及编辑距离算法中针对中文文本相似度计算时的不足,提出了一种基于中文文本的编辑距离算法的改进方法。该算法采用中文分词和基于短句的方法,解决了编辑距离算法在中文文本相似度计算时不能处理字段颠倒的情况。通过对实验结果的分析,改进后的算法明显提高了中文文本相似度计算时的匹配准确率。  相似文献   

8.
为了探索高校学生实习时提交的实践报告文本存在着重复的问题,从高校教学管理部门收集到相关文本的分类数据,结合Jieba分词工具处理文本信息,利用Word2vec词向量转换技术,表现了自然语言精准的语义分析能力。考虑到主题词抽取、概率分布情况及时间复杂度三个方面,使用Python的OS库完成批处理去重、去停用词和去非中文词,运用重要采样思想优化LDA(latent dirichlet allocation),模型,提出了新的训练模型ISLDA (importance sampling latent dirichlet allocation)抽取主题词汇,并采用余弦相似度计算重复率。更好地实现了文本查重算法模型的优化,对比两个模型的主题词类别、各词汇分布概率,结果表明新训练模型优化了主题模型,提高了计算模型训练准确率及测试文本的查重能力,较理想地实现了文本查重分析设计方法。  相似文献   

9.
王李  朱峰 《科技信息》2010,(23):15-16
作为一门比较年轻的学科,口译教学起初主要从认知和心理方面入手,而现在一些文本语言学家和翻译理论家则提倡引导学生从新的文本语言学的角度对口译文本进行各个层次的文本篇章分析。本文探讨了口译文本的篇章性,并建议在教学实践中结合文本语言学来评估口译效果。  相似文献   

10.
传统分布式语义文本分类方法难以高效地在云计算环境下实现文本快速准确分类,为此,提出一种新的云计算环境下分布式语义文本自适应分类方法。通过期望交叉熵对分布式语义文本特征进行选择,针对任意类别中的词,按照权重值从大到小的顺序对其进行排列,将排在前面的若干词看作特征词,针对分布式语义文本集中的所有类别进行同样的操作,将获取的所有类别特征词结合在一起,建立特征词典。针对主题引入加权策略,通过权重值对不同主题针对不同类别的判断能力进行描述,以获取最佳主题,给出新文本特征产生过程。依据提取的分布式语义文本特征,通过朴素贝叶斯分类器实现分布式语义文本的自适应分类。实验结果表明,所提方法分类精度和效率高。  相似文献   

11.
随着民族地区信息化建设的不断推进,中国少数民族语言网络舆情研究也逐渐引起了大家的关注,文本分类和情感分析模块是舆情系统的重要组成部分。传统的文本分类方法主要通过统计字面上的词语重复次数,而对于文字背后的语义关联考虑甚少。该文重点介绍了一种基于LDA模型在少数民族语言(以彝文为例)网络舆情信息情感分析方面的应用,对文字隐含的主题进行建模,通过挖掘少数民族网页上的舆情信息所蕴含的主题,以及对这些主题进行情感分析,在事件全面爆发之前,采取应急措施。  相似文献   

12.
在以严谨、精确、清晰为特点的英文法律语言中,重复这种修辞方法的使用频率远高于其他文本体裁,这成为法律英语语体的一项重要特征。在英文法律语言的表达中,显性重复能起到衔接前后文、强调语义的效果。在立法活动中,起草者往往会利用此种重复来避免文本中可能出现的含糊或歧义现象。在翻译活动中,译者应该根据英文法律语言的特点对原文中的显性重复现象采用替换、省略、合并或保留的对策。  相似文献   

13.
本文在对我国证券投资市场发展趋势进行分析的基础上,结合在证券信息分析方面所做的一些实践工作,从理论上分析了WEB文本投资信,包对投资者决策的影响,并对基于WEB文本挖掘的证券投资系统的实现目标、整体架构、软件体系结构和功能进行了探索,提出了利用数据挖掘技术对WEB文本投资信息进行分析处理的系统的设计思路.  相似文献   

14.
教学不是仅仅局限于单纯的文本知识的传授,更需要进行有效的拓展延伸,才能对语文素养的形成和提升起到积极作用.有效的拓展延伸,可以拓宽学生的知识面,激发并保持对学习的兴趣,产生主动探究的欲望,学会正确搜集和处理信息,逐步形成理解和运用文字的能力,具备不断求知,敢于探索的精神.但在具体的实践中,也存在着一些误区:拓展内容空泛,拓展内容重复,拓展内容滞后,拓展内容无目的,拓展过程不连续、拓展形式的局限等等,在新型的语文教学中,教师如何很好地处理和运用拓展知识,恰到好处地把握文本教学资源开发的度,让学生从教材走向无限延伸的宽阔大道,体现真正的语文教学的大语文观.  相似文献   

15.
针对现有的以文本为载体的隐写术在隐蔽性、鲁棒性、隐写容量等方面存在的问题,提出了一种基于汉字数学表达式的无载体文本隐藏方法,首先应用汉字笔顺分类或者载体文本中不重复的汉字对载体文本进行编码,然后使用汉字数学表达式对含有编码信息的汉字的位置进行描述,从而使得接收方可以进行完整的秘密信息的提取。这种方法中的文本载体没有经过任何的改动,所以其隐蔽性和鲁棒性方面较以前的方法有很大改进,并且在隐藏容量方面也有较高的优势。  相似文献   

16.
文本对沥青混凝土路面早期病害出现原因进行了分析,并针对其产生的原因提出了几点防治措施。  相似文献   

17.
通过对比双语平行文本,对《兄弟》英译本中人称和人物语言动作描写替代现象进行研究,分析出英语和汉语两种语言的差别和语篇衔接特色:汉语多重复,而英语则尽量避免重复。英语往往采用替代的语篇衔接手段来代替上文中已经出现过的同类事物,并连接上下文。其使用频率远远高于汉语,使用手段远远比汉语丰富。针对这种差异,在汉英翻译过程中,译者需要平衡替换与重复手法的使用,使得译文简洁、有力,从而使得译文符合译入语民族的语言心理习惯。  相似文献   

18.
庞雅丽 《科技信息》2008,(15):19-19
本文给出了一种基于目标迁移学习的文本分类方法,用于解决在分类目标发生变化时的训练集重复标注和分类模型重复训练的问题。该方法通过引入一个中间类别体系层作为桥接,首先在中间层类别和目标类别之间建立映射关系,分类时将文本分到中间层类别上,然后根据中间层和目标层的映射来确定目标类别。  相似文献   

19.
传统分布式语义文本分类方法难以高效地在云计算环境下实现文本快速准确分类。为此,提出一种新的云计算环境下分布式语义文本自适应分类方法。通过期望交叉熵对分布式语义文本特征进行选择,针对任意类别中的词,按照权重值从大到小的顺序对其进行排列,将排在前面的若干词看作特征词;针对分布式语义文本集中的所有类别进行同样的操作,将获取的所有类别特征词结合在一起,建立特征词典。针对主题引入加权策略,通过权重值对不同主题针对不同类别的判断能力进行描述,以获取最佳主题,给出新文本特征产生过程。依据提取的分布式语义文本特征,通过朴素贝叶斯分类器实现分布式语义文本的自适应分类。实验结果表明,所提方法分类精度和效率高。  相似文献   

20.
针对现有的中文文本情感分析方法不能从句法结构、上下文信息和局部语义特征等方面综合考量文本语义信息的问题,提出一种基于特征融合的中文文本情感分析方法.首先,采用Jieba分词工具对评论文本进行分词和词性标注,并采用词向量训练工具GloVe获取融入词性的预训练词向量;然后,将词向量分别作为引入Self-Attention的BiGRU和TextCNN的输入,使用引入Self-Attention的BiGRU从文本的句法结构和文本的上下文信息两个方面综合提取全局特征,使用TextCNN提取文本的局部语义特征;最后,将全局特征和局部语义特征进行融合,并使用Softmax进行文本情感分类.实验结果表明,本文方法可以有效提高文本情感分析的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号