首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
双标图是一种广泛应用的可视化分析方法,但是当所研究的数据包含较多变量时,如果直接用双标图进行分析会导致图中较多变量重叠,不能很清晰地观察变量间的相关关系,可视化程度较低,分析效果不精确。针对上述问题,故引入一种新的方法——聚类双标图,首先通过对原始数据进行聚类分析,得到新的数据集,然后对得到的数据集进行双标图分析。该方法不仅保留了数据间的绝大多数信息,而且使得双标图的可视化程度增强。对新的方法进行实证分析,并与原始数据构成的双标图进行比较研究,验证了该方法的有效性。  相似文献   

2.
军事标图是指挥决策不可或缺的重要环节。随着军队指挥自动化的逐步实现,计算机技术的日趋成熟,用计算机标图取代传统的手工标图已成为现实。本文是以军队信息化、一体化建设思想为指导,从远方空情自动标图的实现入手,分析了采用计算机技术替代传统人工操作的可行性,提出在Vc++环境下集成MapX控件实现军事标图解决方案,探讨了MapX在Vc++中实现标图的基本方法,实现了远方空情与信息系统一体化。  相似文献   

3.
针对传统的Web信息抽取方法运算量大、自动化程度低的问题,提出了一种基于SVM的WEB信息自动化抽取方法。利用SVM优秀的分类性能将网页中有用数据和无用数据分类标注,有效地完成Web信息抽取任务,准确地抽取出所需信息,实现数据抽取的自动化。实验结果表明,该方法可以有效地获取网页信息特征,具有较高的召回率和准确率。  相似文献   

4.
王磊 《科技资讯》2011,(9):247-247
孙子的军事思想对当今的信息化作战仍然具有指导意义,本文根据信息化作战要求,分析了如何运用应用"慎战"、"全胜"、"诡道"、"知己知彼"、"因敌致胜"和"速胜"等思想,取得信息化作战的最终胜利。  相似文献   

5.
句法分析是自然语言处理的一个基本问题,随着大规模标注树库的建立,基于树库的统计句法分析逐渐成为现代句法分析的主流技术。在介绍句法分析树库及句法分析性能评测方法的基础上,对主要句法分析统计模型和中文句法分析的研究现状进行简要综述和分析,并探讨和总结了基于统计的句法分析模型的不足之处和发展趋势,指出现有的汉语句法分析方法不适合汉语的特点,没有有效刻画出汉语的本质特性,导致目前汉语句法分析性能与英语相比相差较大;将语义信息融入句法分析,并在此基础上建立句法分析与语义角色标注联合学习统计模型,将是句法分析的一个重要研究方向。  相似文献   

6.
基于语义标注的信息抽取   总被引:6,自引:2,他引:6       下载免费PDF全文
词性标注是引起语义缺失的根本原因,提出了以语义标注作为构建信息抽取规则的基础。基于语义标注的信息抽取可消除词性标注引起的3个负面影响,用统一的方法来指导信息抽取过程。这种方法避开语法分析,具有较细的处理粒度,对语义规则性强的领域有一定的普遍适用性。设计了基于语义标注的MIE(军用信息抽取)系统,并对标图文本试行信息抽取。抽取结果表明,基于语义标注的信息抽取方式有一定的可行性和适用性。  相似文献   

7.
提出一种自适应的Web信息抽取规则自动生成方法,通过多样本页面对比模式和单样本重复模式提取Web上复合类型的数据并进行迭代修正,基于语义分析的规则方法进行动态抽取。实验结果表明,该方法具有较好的精确性和鲁棒性。  相似文献   

8.
一种自动化的网页数据抽取方法   总被引:1,自引:0,他引:1  
数据抽取是当前网络飞速发展的背景下衍生的一类技术。简单介绍了数据抽取技术的发展和研究现状,并针对目前数据抽取技术的不足提出了一种新的数据抽取方法.能够自动化地并高准确度地从网页上抽取数据。  相似文献   

9.
李洋  栾吉华 《科技资讯》2007,(35):80-81
以往基于DOM的Web信息抽取方法在信息抽取过程中存在如需要较多样本集、适应性较差等问题,为解决Web上的信息在抽取中存在的问题,本文提出了一种在原有基于DOM的Web信息抽取方法的基础上引入竞争分类方法进行信息抽取.  相似文献   

10.
信息抽取技术是深层次分析文本语义信息的基础.随着数据量的增加,尤其是针对海量网络信息分析的需求,传统的基于手动标注或人工干预的训练分类方法已不能满足要求.以“大学生心理健康”相关网页作为信息语料,提出一种基于案例分析的文本数据抽取方法,可以实现跨领域信息自动抽取,能够快速有效地获得满足用户需求的信息.  相似文献   

11.
提出和实现了一套基于自然语言理解的军用文书到标绘图智能转换的解决方案。文本标图系统通过标绘信息提取模块和军标标绘模块,针对军事文本标图的需求和汉语的特点,由计算机在自然语言理解的基础上对作战文书文本进行分析、理解、提取标绘信息、自动标图作业,最后生成战场态势图。该系统完成了军事标图作业和文书处理的手工作业向机器作业的转换,提高了指挥作业的速度和效率。  相似文献   

12.
13.
首先利用bidirectional encoder representations from transformers(BERT)模型的强大的语境理解能力来提取数据法律文本的深层语义特征,然后引入细粒度特征提取层,依照注意力机制,重点关注文本中与数据法律问答相关的关键部分,最后对所采集的法律问答数据集进行训练和评估. 结果显示:与传统的多个单一模型相比,所提出的模型在准确度、精确度、召回率、F1分数等关键性能指标上均有提升,表明该系统能够更有效地理解和回应复杂的数据法学问题,为研究数据法学的专业人士和公众用户提供更高质量的问答服务.  相似文献   

14.
基于SVG的图像信息实时发布模式   总被引:1,自引:0,他引:1  
网络信息发布逐渐由文本发布向图形、图像化及其混合形式发展.为提高信息发布效率,提出了一种基于SVG(Scalable Vector Graphic)的网络信息实时发布模式.在这种模式下,不仅节省网络传输带宽,减少传输延迟时间,而且图像能够根据数据库中数据的变化,发生相应的变化,实现了实时图像发布.不仅提高了信息发布的效率,而且扩大了信息发布的应用范围.  相似文献   

15.
为了解决分布式词表示方法因忽略词语情感信息导致情感分类准确率较低的问题,提出了一种融入情感信息加权词向量的情感分析改进方法。依据专属领域情感词典构建方法,结合词典和语义规则,将情感信息融入到TF-IDF算法中,利用Word2vec模型得到加权词向量表示方法,并运用此方法对采集到的河北省旅游景点的评论文本与对照组进行对比实验。结果表明,与基于分布式词向量表示的情感分析方法相比,采用融入情感信息加权词向量的改进方法进行情感分析,积极文本的准确率提高了6.1%,召回率提高了6.6%,F值达到了90.3%;消极评论文本的准确率提高了6.0%,召回率提高了7.2%,F值达到了89.6%。因此,融入情感信息加权词向量的情感分析改进方法可以有效提高评论文本情感分析的准确率,为用户获得更为准确的评论观点提供参考。  相似文献   

16.
针对传统用户意图识别主要使用基于模板匹配或人工特征集合方法导致成本高、扩展性低的问题,提出了一种基于BERT词向量和BiGRU-Attention的混合神经网络意图识别模型。首先使用BERT预训练的词向量作为输入,通过BiGRU对问句进行特征提取,再引入Attention机制提取对句子含义有重要影响力的词的信息以及分配相应的权重,获得融合了词级权重的句子向量,并输入到softmax分类器,实现意图分类。爬取语料实验结果表明,BERT-BiGRU-Attention方法性能均优于传统的模板匹配、SVM和目前效果较好的CNN-LSTM深度学习组合模型。提出的新方法能有效提升意图识别模型的性能,提高在线健康信息服务质量、为在线健康社区问答系统提供技术支撑。  相似文献   

17.
MDI为HMM训练的优化准则之一,但传统的MDI是基于局部最优求解的,所得的解也是一个局部最优解,而进化计算则是基于全局搜索的。为此,提出了将MDI及进化计算相结合来训练HMM的方法。各个模型用个体来表示,个体的适应值采用模型的最小差别信息。实验结果表明,该方法所得的系统识别率高于传统的方法。  相似文献   

18.
融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进K-means算法。实验结果表明,提出的方法在一致性指标上要优于使用K-means以及K-means++对特征向量聚类的同类方法;与SBERT-LDA方法相比,在1 852条戏剧评论数据集上,一致性指标值提高了22.9%。因此,所提出的SBERT-LDA-DC方法是有效的,对产品或服务提供者更好地了解用户意见、完善自身产品或提升服务水平提供了新方法,具有较强的实际应用价值。  相似文献   

19.
为了实现快速、自动化发现土地覆盖变化这一目标,在分析传统主成分差异法、差异主成分法、多波段主成分法三种不同处理过程的基础上,结合主成分变换原理提出了一种改进的主成分分析法(modified principal component analysis,MPCA).操作中先将d1时相多光谱影像作主成分分析,得PCd11,PCd12,…,PCd16;d2时相高分辨率全色波段PAN与PCd11进行直方图匹配后,采用了经反复试验效果较好的3×3模板进行边缘滤波增强;然后取代PCd11与PCd12,PCd13,…,PCd16进行主成分逆变换,作者在ENVI4.0和IDL6.0工具包支持下实现了这一融合算法.以北京海淀区为例进行的试验研究表明,MPCA法不仅能够快速发现变化信息,而且增强了影像纹理,弥补了传统主成分分析法的缺陷.此外,变化信息提取精度较高,其Kappa系数比传统主成分差异法、差异主成分法、多波段主成分法依次提高了0.063,0.118,0.029,是一种比较实用的变化信息发现方法,值得推广应用.  相似文献   

20.
提出一种基于关键 $n$-grams 和门控循环神经网络的文本分类模型. 模型采用更为简单高效的池化层替代传统的卷积层来提取关键的 $n$-grams 作为重要语义特征, 同时构建双向门控循环单元(gated recurrent unit, GRU)获取输入文本的全局依赖特征, 最后将两种特征的融合模型应用于文本分类任务. 在多个公开数据集上评估模型的质量, 包括情感分类和主题分类. 与传统模型的实验对比结果表明: 所提出的文本分类模型可有效改进文本分类的性能, 在语料库 20newsgroup 上准确率提高约 1.95%, 在语料库 Rotton Tomatoes 上准确率提高约 1.55%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号