首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
通过研究抽取算法的本质和抽取算法之间的关系,对抽取算法的互补性进行分析,提出了一种多算法组合验证机制,该机制能检测出抽取算法的错误,并通过结合动态阈值调整的方法,提高抽取算法的抽取准确率.  相似文献   

2.
研究第五届中文倾向性分析评测的任务3和任务4,即微博的倾向性分析和评价对象识别.网络新词多,句子格式不规范,语言简短且包含的情感内容多都是微博分析的难点.针对此问题,提出对中文微博的过滤算法.在词语倾向性识别中,构建基础观点词和网络观点词等词典,然后利用知网识别所有词语的倾向性.在评价对象的抽取方面,提出一种面向微博的基于统计和规则相结合的评价对象抽取方法,特别是提出利用句法分析和评价词、评价对象互信息的联合抽取算法.实验表明,该算法可以提升评价对象抽取的效果.  相似文献   

3.
文章首次把CART决策树方法应用在关键词抽取工作中,并引进相似度进行了决策树方法的改进.在对特征值选择时,根据档案文本书写特征及习惯,选取档案文本的标题、档案关键词词性组合作为特征向量,并基于以往关键词抽取的先验知识加入词位置、相对频数、词语组合个数等作为特征向量.在CART决策树方法基础上,通过引入Jaccard系数合并相似度高的属性元素改进算法,来提高分类的准确率以及减小算法的复杂度.文章选取大量文本作为训练集,通过CART决策树方法进行训练学习而建立模型,建立好的模型能大大减少关键词抽取工作量,并提高关键词抽取的准确率.  相似文献   

4.
研究评论倾向性分析中情感词的动态极性变化问题.用Apriori算法在语境基础上挖掘情感歧义词语搭配,构建出(情感对象,情感词,情感倾向性)三元组形式的情感歧义词搭配词典,利用条件随机场模型(CRFs)序列标注方法从评论文本中抽取出情感要素,在构建的情感歧义词搭配词典基础上对评论文本进行了细粒度情感倾向性分析.在手机和电脑两个领域的评论语料集上进行多组实验,与传统方法的对比实验表明了方法的可行性,较为明显地提高了情感倾向性分析的准确率.  相似文献   

5.
针对自然语言处理中传统因果关系抽取主要用基于模式匹配的方法或机器学习算法进行抽取,结果准确率较低,且只能抽取带有因果提示词的显性因果关系问题,提出一种使用大规模的预训练模型结合图卷积神经网络的算法BERT-GCN.首先,使用BERT(bidirectional encoder representation from transformers)对语料进行编码,生成词向量;然后,将生成的词向量放入图卷积神经网络中进行训练;最后,放入Softmax层中完成对因果关系的抽取.实验结果表明,该模型在数据集SEDR-CE上获得了较好的结果,且针对隐式的因果关系效果也较好.  相似文献   

6.
该文研究文本极性分类算法优化问题。目前算法多以计算词的极性进行文本极性分类,由于不能保证词的主题相关性,导致文本情感分析准确率较低。为了提高分类精度,该文提出一种新的文本极性分类方法,首先用tf/idf算法抽取主题词确定文本主题句,然后对句子进行句法分析,并利用核函数设计基于词特征、词义特征以及句法特征等多特征融合的句子极性计算方法,通过分析情感主题句的极性进行文本情感倾向的判断。新方法不仅考虑了词本身的极性,还根据核函数区分词的动态极性,同时避免与主题无关的句子对分析结果的影响,进行实验与其它分类算法作比较,证明新方法能够有效提高文本情感分析的准确率,可为设计提供实用有效的算法。  相似文献   

7.
信息主题的抽取是快速定位用户需求的基础任务,主题词抽取时主要存在三个问题:一是词语权重的计算,二是词语间关系的度量,三是数据维度灾难.在计算词权重时首先利用互信息确定共现词对,与词频、词性、词位置信息非线性组合,然后,根据词权重构建文档—共现词矩阵并建立潜在语义分析(Latent Semantic Analysis,LSA)模型.该方法借助LSA模型的奇异值分解(Singular Value Decomposition,SVD)将文档—共现词矩阵映射到潜在语义空间,不仅实现数据降维,而且获得低维度的文档相似矩阵.最后,对文档相似矩阵进行k-means聚类,在同类文档中选出词权重最大的前几对共现词,作为该类文章的主题词.对比基于TF-IDF(Term Frequency-Inverse Document Frequency)和共现词抽取主题词的实验,该算法的准确度分别提高了19%和10%.  相似文献   

8.
融合多尺度多特征的人脸识别方法   总被引:1,自引:1,他引:0  
为降低光照、噪音、姿态等变化的影响,减少有效局部信息的损失,提出了使用图像的变换特征,及多尺度分块线性鉴别分析的算法.将图像进行多尺度划分,对划分后的每个子图像分别抽取其低频部分或奇异值,组合起来作为该图像的特征向量,进行线性鉴别分析.针对单一特征表示图像时的局限性,又提出了融合多尺度低频特征和多尺度奇异值特征进行人脸识别的方法.在ORL和Yale人脸库上的实验结果显示,所提出的算法识别精度明显提高,泛化能力较强.  相似文献   

9.
针对WIVSS默认评分机制无法体现脆弱点复杂性和多样性的缺点,对脆弱性分析理论与脆弱点评分技术进行分析,在通用脆弱点评分系统(common vulnerability scoring system,CVSS)基础上进行改进,设计了一种更具多样性且更能反映实际情况的脆弱点评分方法.该脆弱点评分方法主要由分析后得出的一系列实际系统约束规则出发,使用最优脆弱点评分权值组合搜索算法和基于信息熵的权值组合选择算法,联合确定目标网络的最优脆弱点评分权值组合,最终实现对脆弱点的最优评分.结果表明,文中方法确定的目标网络最优脆弱点评分权值组合保证了脆弱点多样性,弥补了WIVSS的不足.  相似文献   

10.
实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算法应用于铁路文献关键词的抽取,该算法融合多个特征因素改进词汇节点的初始权重设置,并利用Word2Vec训练的词向量表征改进词节点间的转移概率.实验结果表明:本文所提出的关键词抽取算法相对于经典的TextRank和TF-IDF算法在准确率,召回率以及F值上都有较大的提升.与TextRank相比,F值提升了13.9%.  相似文献   

11.
Algorithmic composition is a very popular research field today. Bach's "two voice part invention" is the research object in this.paper. The grammar and compositional rules of "invention" are introduced first, Then two soft computational methods, genetic algorithms and back propagation (BP) neural network technology,are combined to the experiment on assisting in composing "two voice part inventions ". The system presented in this paper is quite effective and satisfactory.  相似文献   

12.
基于生命科学中的免疫思想,在解决遗传算法中的约束问题时,将处理约束问题的两个关键方法(惩罚函数法和修补算法)有机的结合起来,并用于解决一类典型的约束问题--背包问题.其仿真结果表明,对于约束问题的求解,该混合式遗传算法和标准遗传算法相比在搜索全局最优解的收敛速度和精度方面都有明显的提高.  相似文献   

13.
插值法是离散频谱校正分析中应用最为广泛、研究最为深入、算法种类最多的一种校正方法,按照采用的谱线类型又可以分为基于幅值谱比值和基于复数谱比值的两种插值法。在实际工程应用中,抗噪声性能是评价一种算法最为重要的指标之一。在回顾国内外插值校正算法的理论研究和发展现状的基础上,简要介绍了各种插值算法的原理和特点。通过仿真考察了各算法的抗噪声性能,重点分析了插值极性错误对目前各种算法的影响。通过分析比较,指出了现有插值法的不足之处和亟待解决的问题,对插值校正算法的发展进行了展望和探讨。  相似文献   

14.
我国字符一般由汉字、英文字母以及阿拉伯数字组成,字符图片的类型众多给字符的识别带来了很多困难.参照目前现有人工智能算法的优点,结合了字符特征提取方法设计了一个改进的BP神经网络对归一化后的三类字符进行识别,取得了预期效果.  相似文献   

15.
为了研究目前主流的异常检测算法,并了解基于相同数据集的异常检测算法之间性能的差异,首先简要分类综述现有异常检测技术,然后着重实验分析,选取5个具有代表性的异常检测算法,应用于10组不同维数和大小的标准数据集上,执行误差性能(FNR,FPR,AUC)对比,最后试验结果表明,基于统计的高斯混合(Gaussian Mixture)算法具有较大优势。  相似文献   

16.
通过对现有动态组播路由算法及协议的研究和分析,在总结QoS动态组播路由问题研究现状的基础上,提出了一个协议框架,并就此协议框架中的动态问题、QoS问题及分层问题提出了一些理论上的解决办法.框架试图利用集中式算法作为组播路由的预计算方法,同时结合分布式地动态收集QoS信息,做出QoS相关的组播路由决定.把一些现代互联网的先进技术,如Anycast机制等,结合到组播路由算法中,使组播路由算法具有更大的灵活性和可扩展性.  相似文献   

17.
The design of parallel algorithms is studied in this paper. These algorithms are applicable to shared memory MIMD machines. In this paper, the emphasis is put on the methods for design of the efficient parallel algorithms. The design of efficient parallel algorithms should be based on the following considerations: algorithm parallelism and the hardware parallelism; granularity of the parallel algorithm; algorithm optimization according to the underling parallel machine. In this paper, these principles are applied to solve a model problem of the PDE. The speedup of the new method is high. The results were tested and evaluated on a shared memory MIMD machine. The practical results were agree with the predicted performance.  相似文献   

18.
介绍出口茶叶拼配专家系统 TBES 的设计思想和实现技术,阐述了其中多种知识表示、组织和管理的方法及技巧。文章着重介绍了用推理机实现拼配和线性规划实现优化的复合机制及算法。  相似文献   

19.
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。  相似文献   

20.
提出了一种改进时序重排算法,使时序重排可以更有效地与其他组合优化算法结合起来共同提高同步时序电路的速度。在各种不同的测试电路上得到的实验结果显示,这种算法在与其他组合优化方法的结合上,较以往的时序重排算法有很大的改进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号