排序方式: 共有25条查询结果,搜索用时 171 毫秒
1.
提出了一种基于弱监督学习的主页人物属性抽取方法,首先根据领域模式从个人主页中提取出人物属性的前导词,接着通过前导词获取人物属性作为初始的属性种子,在这些属性种子中提取属性的模式,并结合分类和bootstrapping方法不断迭代抽取出无前导词的人物属性。在整个抽取过程中,只需要少量的人工标注。在英文机构网站上的人物属性抽取对比实验结果表明,该方法较属性分类抽取方法在准确率上提高了7.8%,召回率上提高了7.5%。 相似文献
2.
针对现有手机防伪方法存在的不足,提出一种新的移动通信手机终端防伪验证方法,并设计实现了基于短信平台和手机数据库的防伪验证系统。系统通过手机预置短信和开机超时自动发送的方式,实现对已售手机信息的主动采集,并利用基于数据加密保护和数据库查询校验的信息双向核实机制进行防伪确认。与传统方法相比,系统大大提高了手机防伪的可靠性,便于对销售信息进行及时、准确地采集和分析。 相似文献
3.
微博的兴起与传播使得短文本情感分类成为目前的热门研究领域。通过对中文微博语料的情感倾向性分析进行研究,提出了一种新的情感分类方法。首先构建了两级情感词典,并对不同级别情感词作不同增强;然后在情感特征方面使用N-Gram方法,尽量获取有限长度博文中的未登录情感词和情感信息。经实验验证与传统方式相比较,该方法的准确率和召回率都有所提高,在COAE2014微博情感倾向性评测任务中也取得了较好的成绩。 相似文献
4.
文章提出了创新构想话题的自动生成任务,主动生成具有新颖性、权威性的话题,能够激发群体讨论热情,有助于推动相关领域的发展。以Encoder-Decoder文本生成技术为基础,构建了一套创新构想话题生成框架。首先通过实时爬取相关网站的内容,作为信息获取的主要来源;然后利用数据分析工具提取文本的关键词和摘要,使用了TF-IDF算法和TextRank算法;最后利用训练好的话题生成模型得到话题表达。实验结果展示了生成的创新构想话题,说明基于该文提出的流程可以有效挖掘文档中潜在的话题。 相似文献
5.
基于多视角特征融合的中文垃圾微博过滤 总被引:1,自引:0,他引:1
微博中隐含着舆论热点等与特定话题相关的有价值的信息。因此,针对微博数据分析(如话题发现等)的工作成了当前的研究热点。由于微博内容和形式的高度自由,使得相关的研究工作面临着垃圾数据噪声大、有用数据提取难的问题。然而,目前针对非公共话题的中文垃圾微博过滤尚无有效方法。提出一种基于多视角特征融合的垃圾微博过滤方法。该方法首先从微博的结构和内容两个视角建立规则,再与微博文本分词结果进行融合构造复合特征,并以此对垃圾微博进行过滤。通过在真实数据集上的实验表明多视角融合的特征使得过滤效果有明显提升。 相似文献
6.
网络舆论对人们生活的影响程度与日俱增,通过结合多源数据进行事件发现可以更好地捕捉舆情事件,提高舆情系统的效果。针对在多源文本场景下如何将来自新闻、微博、微信等多通道的数据融合,文章根据事件的定义,提出了事件核心实体的概念,设计了事件核心实体识别方法,并且将事件核心实体应用到事件发现过程,提出了结合实体的事件发现方法 ESP(Entity Single-Pass)。该方法通过引入实体信息,丰富了多源文本中每篇文档的表达,从而提高了多源文本事件发现的效果。实验表明,在微博、新闻等数据上,我们的方法与K-means和SinglePass方法相比,在NMI与RI两项指标上分别提高了0.2和0.3,证明了ESP算法的有效性。 相似文献
7.
8.
随着IT 技术的高速发展,世界范围内各行各业都在进行信息化变革,几乎每个行业都在努力发现和利用大数据的价值。为了充分利用大数据带来的机遇,同时有效应对大数据带来的挑战,国内外产业界、科学界和政府部门都在积极布局、制定战略规划。本文介绍大数据背景与动态,描述各国大数据政策实践及中国大数据发展的政策环境和产业界生态发展状况;阐述大数据技术的进展,梳理其生态体系和创新特点;提出大数据可视化、多学科融合、安全与隐私、深度分析等发展趋势和相关建议。 相似文献
9.
对用户网络结构信息和主题标签的情感性、地域性等信息进行特征分析,提出了一种考虑用户粉丝网络结构特征以及主题标签自身特性的流行度预测模型。实验表明,新提出的特征是有效的,对以后主题标签的流行度预测具有较高的参考价值。 相似文献
10.
基于转移学习的命名实体挖掘技术 总被引:1,自引:0,他引:1
研究了针对大规模查询日志中丰富的命名实体的挖掘技术,通过利用Wikipedia数据,结合转移学习方法构建目标类别的分类器.该技术很好地利用了监督学习的优越性能以提高查询日志中命名实体挖掘的准确性,同时也解决了监督学习方法中大规模标注的问题.实验结果表明,基于转移学习的命名实体挖掘技术具有优越的命名实体挖掘性能. 相似文献