期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张溟唐慧丰李珠峰《山东大学学报(理学版)》2014,(12):36-42,65

在俄语军事领域文本的自动处理中,对武器装备名称进行共指消解是一个重要的研究内容。为了解决这一问题,采用模式匹配的方法,从维基百科的Infobox结构中同时提取共指词和模式,之后将二者结合成为新模式,再返回词条内容中迭代寻找共指词。实验结果以共指词表形式体现。计算结果表明该模式匹配方法能够准确有效地找出俄语维基百科中武器装备名称的共指词。相似文献

2.

基于维基语义的多文档文摘研究

龚书瞿有利田盛丰《南京大学学报(自然科学版)》2011,(4)

多文档文摘作为自然语言处理领域的重要技术之一,能从不同角度辅助用户实现高效的信息获取.由于文档集合内的内容往往来自不同的信息源,文本之间通常存在丰富而复杂的语义关系.常用的基于词的文档表示法,难以为文摘的语义分析过程提供充足而准确的数据信息.为此,我们提出使用维基百科——当今世界最大的在线概念语料库——为多文档文摘的提取提供语义支持.一方面,我们通过提取文档中的维基概念,生成准确一致的句子表示形式.另一方面,在计算句子特征时,我们利用维基词条的首段指导机器文摘的提取.我们首先通过计算概念在维基中的全局相关性和当前文档集内的局部相关性,获取概念的权重.然后在维基概念表示的基础上,为文档中的句子提取多种基于维基的特征,并最后用于文摘生成.在实验中,我们依次用各个维基特征独立生成文摘,并使用ROUGE(Recall-Oriented Understudy for Gisting Evaluation,面向召回率的要点评估)指标评价文摘质量.通过比较,实验验证了维基词条首段能较好的提升文摘质量. 相似文献

3.

基于维基百科的实体排歧系统设计与实现

刘永彬邹银凤刘志明《南华大学学报(自然科学版)》2016,30(2):83-86, 92

实体排歧一直是信息抽取任务中的难点问题.传统的方法常常借助语言知识库来进行排歧,如WordNet等.但是这类方法存在着一个问题,就是很难对人名以及最新的词汇进行排歧.因此,本文利用当前流行的维基百科知识库中的排歧页对同名实体进行排歧处理,提出基于维基百科的实体排歧方法.实验显示该方法能够有效的对人名进行排歧处理并且效果显著. 相似文献

4.

基于排序学习的文本概念标注方法研究 总被引：1，自引：0，他引：1

涂新辉何婷婷李芳王建文《北京大学学报(自然科学版)》2013,49(1):153-158

提出一种基于排序学习的方法CRM (concept ranking model), 来实现文档的维基百科概念自动标注。首先人工对一定规模的文档进行概念标注, 建立训练集合, 然后利用排序学习算法在多项特征上得到对概念排序的模型, 利用这个概念的排序模型对任意文档进行概念标注。实验表明, 相对于传统的文档概念标注方法, 此方法在各类指标上都有相当大的提高, 标注结果更加接近人类的概念标注。相似文献

5.

基于有限匹配与择优选取的大众生产系统演化研究

李霞李守伟《上海理工大学学报》2013,35(4):345-350

基于维基百科作为典型大众生产系统以及众多用户参与编辑的现实背景,考虑到用户编辑行为的"择优"和"有限匹配"的特征,给出大众生产系统的"择优选取"和"有限匹配"规则以及演化模型,采用计算实验的方法,对大众生产系统演化中的页面编辑次数、页面与用户状态变化、匹配度影响等进行全面分析.实验结果表明:在"择优选取"和"有限匹配"两个原则的作用下,维基百科系统逐渐演化到稳定状态.在稳定状态下,页面被编辑次数服从幂律分布;用户状态与页面状态之差(即匹配度)趋向于零;用户与页面的匹配度越大,幂律分布的幂指数就越小,从而幂律分布的"尾巴"就越长. 相似文献

6.

大学生使用百度百科和中文维基百科的调查比较——以南京高校为例

高海燕《科技情报开发与经济》2014,(21):124-126

百度百科和中文维基百科具有较多的相似性。大学生是百度百科和中文维基百科的主要用户。通过对南京地区大学生使用百度百科和中文维基百科的现状进行的调查与比较,揭示了两者的功能特点及其存在的不足之处,在此基础上,对编辑者提出了改进建议,希望其能更好地为用户提供服务。相似文献

7.

基于隐喻词扩展的短文本聚类算法

王烨左万利王英《吉林大学学报(理学版)》2018,56(6):1447-1452

针对目前短文本词汇量少、表达形式多样, 导致同种类文本聚类方法无效的问题, 提出一种利用中文维基百科的丰富词汇间关系对短文本的隐喻词进行扩充的方法, 以解决短文本包含信息少、词汇表达形式多样的不足. 实验结果表明, 该算法可有效提升短文本的聚类效果. 相似文献

8.

网络信息空间中的知识建构——以维基百科知识生成机制为例 总被引：1，自引：0，他引：1

丁大尉李正风《自然辩证法研究》2012,(5):61-65

本文在分析建构主义知识观两个传统进路的基础上提出,网络信息空间中的知识建构是在知识-社会互动的语境中展开的。进而以维基百科为例考察了网络信息空间中的知识生成机制,在分析其知识建构历程的基础上指出:知识-社会互动视域下的知识建构机制包括知识建构的多主体参与性、知识增长的历时性、知识体系的相对系统性、知识生成的情境性等主要特征。相似文献

9.

基于维基百科的俄汉可比语料库构建及可比度计算

原伟易绵竹《山东大学学报(理学版)》2017,52(9):1-6

可比语料库由于其自身优势和广泛用途逐渐成为语料库研究的热点方向之一,而目前国内俄汉可比语料库相关研究未见学者涉及。通过梳理国内外相关研究成果,设计了一种基于维基百科构建俄汉可比语料库的思路和方法,研制了语料自动获取系统,以篇章对齐为基础建立了俄汉可比语料库,语料字(词)总数达到了百万级,最后利用跨语言相似度计算的方法对俄汉语料的可比度进行计算。计算结果表明该方法能够有效获取可比度较高的俄汉语料,所构建的语料库可被用于俄汉翻译、话语分析及计算语言学研究中。相似文献

10.

基于维基百科信息框的本体信息提取

陈刚徐星羽《吉林大学学报(理学版)》2020,58(2):355-363

针对传统方法在维基百科信息框中提取本体信息精准率较低的问题, 研究维基百科信息框中的属性结构化信息. 首先定义一组候选特征判定信息框属性之间的关系, 建立与类别、列表、文章及维基百科信息框模板之间的关联；然后借鉴本体匹配方法提取维基百科信息框结构化信息, 计算属性对的相似度, 设置边界限制条件, 在达到一定精确度下构建本体结构描述属性之间的关系, 并构建类层次结构. 结果表明, 所给方法解决了提取本体信息精准率较低的问题, 能高效、正确地在给定主题文章中将可能的属性结构提取出来, 并发现合理的类关系. 相似文献