共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
3.
4.
高海燕 《科技情报开发与经济》2014,(21):124-126
百度百科和中文维基百科具有较多的相似性。大学生是百度百科和中文维基百科的主要用户。通过对南京地区大学生使用百度百科和中文维基百科的现状进行的调查与比较,揭示了两者的功能特点及其存在的不足之处,在此基础上,对编辑者提出了改进建议,希望其能更好地为用户提供服务。 相似文献
5.
6.
针对传统方法在维基百科信息框中提取本体信息精准率较低的问题, 研究维基百科信息框中的属性结构化信息. 首先定义一组候选特征判定信息框属性之间的关系, 建立与类别、 列表、 文章及维基百科信息框模板之间的关联; 然后借鉴本体匹配方法提取维基百科信息框结构化信息, 计算属性对的相似度, 设置边界限制条件, 在达到一定精确度下构建本体结构描述属性之间的关系, 并构建类层次结构. 结果表明, 所给方法解决了提取本体信息精准率较低的问题, 能高效、 正确地在给定主题文章中将可能的属性结构提取出来, 并发现合理的类关系. 相似文献
7.
在俄语军事领域文本的自动处理中,对武器装备名称进行共指消解是一个重要的研究内容。为了解决这一问题,采用模式匹配的方法,从维基百科的Infobox结构中同时提取共指词和模式,之后将二者结合成为新模式,再返回词条内容中迭代寻找共指词。实验结果以共指词表形式体现。计算结果表明该模式匹配方法能够准确有效地找出俄语维基百科中武器装备名称的共指词。 相似文献
8.
基于排序学习的文本概念标注方法研究 总被引:1,自引:0,他引:1
提出一种基于排序学习的方法CRM (concept ranking model), 来实现文档的维基百科概念自动标注。首先人工对一定规模的文档进行概念标注, 建立训练集合, 然后利用排序学习算法在多项特征上得到对概念排序的模型, 利用这个概念的排序模型对任意文档进行概念标注。实验表明, 相对于传统的文档概念标注方法, 此方法在各类指标上都有相当大的提高, 标注结果更加接近人类的概念标注。 相似文献
9.
《南京理工大学学报(自然科学版)》2016,(4)
为了解决跨语言汉越词语相似度计算问题,以维基百科多语言概念页面作为桥梁,利用概念之间存在的翻译对应关系、词语出现在不同概念页面及与其他概念之间存在共现关系,提出了基于维基百科的汉越词语相似度计算方法,该方法首先提取维基百科中汉语越南语具有对应关系的概念集合,构建双语概念特征空间,然后根据词语在相应概念描述文本中出现的词频特征,以及词语与概念在其他概念文本中的共现特征构建词语的概念向量值,最后通过夹角余弦对两个向量进行词语相似度计算。实验结果表明提出的方法在汉越双语词语相似度计算上表现了好的效果,概念共现关系能够提高词语相似度的准确率。 相似文献
10.
实体排歧一直是信息抽取任务中的难点问题.传统的方法常常借助语言知识库来进行排歧,如WordNet等.但是这类方法存在着一个问题,就是很难对人名以及最新的词汇进行排歧.因此,本文利用当前流行的维基百科知识库中的排歧页对同名实体进行排歧处理,提出基于维基百科的实体排歧方法.实验显示该方法能够有效的对人名进行排歧处理并且效果显著. 相似文献
11.
在互联网技术高度发达的时代,网络上的学习资源呈现出指数型增长态势,面对各种学习对象、概念之间存在的多样化和无序性,如果能识别出之间的依赖关系,将有可能对计算机教育产生重要影响。针对该问题,提出一种面向维基百科的概念依赖关系识别方法,利用概念在维基百科中的特点,设计出一套识别概念依赖关系模型,在公共数据集上采用基于机器学习的分类算法进行测试。实验结果表明,该模型具有较高准确率和召回率,能够有效发现概念之间的依赖关系。 相似文献
12.
《兰州理工大学学报》2017,(3)
通过对目前自然语言处理领域中基于深度学习的词向量表示方法对不同文本语料文本表达的有效性进行分析,将主流词向量训练方法用于不同的文本语料集,包括英文维基百科语料、新闻语料、论坛语料和Web语料进行训练,并采用三种评价指标:余弦相似度平均差、斯皮尔曼等级相关和米克罗夫类比方法对训练出的文本词向量表达方法进行比较.实验结果表明,针对上述四种语料,词向量能够实现对文本的有效表示,但各个语料训练出的词向量的通用性不同,其中维基百科语料训练的词向量的通用效果最好. 相似文献
13.
基于维基百科作为典型大众生产系统以及众多用户参与编辑的现实背景,考虑到用户编辑行为的"择优"和"有限匹配"的特征,给出大众生产系统的"择优选取"和"有限匹配"规则以及演化模型,采用计算实验的方法,对大众生产系统演化中的页面编辑次数、页面与用户状态变化、匹配度影响等进行全面分析.实验结果表明:在"择优选取"和"有限匹配"两个原则的作用下,维基百科系统逐渐演化到稳定状态.在稳定状态下,页面被编辑次数服从幂律分布;用户状态与页面状态之差(即匹配度)趋向于零;用户与页面的匹配度越大,幂律分布的幂指数就越小,从而幂律分布的"尾巴"就越长. 相似文献
14.
王兴波 《佛山科学技术学院学报(自然科学版)》2011,29(3):53-57
对位运算的运算律进行了研究,得到了按位与、按位或、按位异或及移位运算在交换律、结合律以及对加法的分配律方面的一些性质.基于这些性质,还研究了维基百科所列一个同余恒等式的证明方法,并给出了一个正确的证明. 相似文献
15.
16.
近年来搜索引擎技术发展迅猛,大学生作为网民组成的重要群体,也同时是搜索引擎的主要使用者。本文在借鉴国内外搜索引擎评价方法的基础上,结合我国大学生网络信息检索行为的现状和特点,选取了与搜索引擎紧密相关的若干指标,建立了搜索引擎评价体系,对谷歌、百度、搜狗、维基百科等搜索引擎进行了实证分析。 相似文献
17.
18.
网络群体智能涌现问题是信息科学和社会科学的多学科交叉研究问题。基于映射思想将其映射为维基百科词条编辑演化问题,提出词条编辑演化研究方法框架;以维基百科高质量词条编辑历史数据为数据集,以编辑者为节点,以编辑者间编辑交互关系为连边,构建词条编辑交互网络,通过建立网络演化测度拓扑势熵实现对词条编辑演化研究。实验分析表明,网络结构和词条总体上朝着有序方向演化,演化呈现出“从注重完整性到注重准确性再到注重可读性”的由低到高3个阶段,直至群体结构趋于稳定,结构具有无标度性,词条质量和群体智能达到很高水平;存在语量与语义之间此消彼长、最终达到动态平衡的过程,语量与语义平衡临界点近似为黄金分割点,词条编辑演化遵循着黄金分割律。方法框架有效,深化了对词条编辑演化、网络群体智能和社会计算的认识。 相似文献
19.
本文针对现在高校在招生工作中所遇到的困境,提出利用WEB2.0的中的相关技术和理念作为解决方案出发点,分析了基于WEB2.0的高校招生工作的流程,建立新的高校招生信息系统。提出可以使用RSS技术、建立高校自己的招生维基百科、使用即时消息软件、以及大众目录和标签的运用,可以解决高校在招生中所面临的难题。 相似文献
20.
针对目前短文本词汇量少、 表达形式多样, 导致同种类文本聚类方法无效的问题, 提出一种利用中文维基百科的丰富词汇间关系对短文本的隐喻词进行扩充的方法, 以解决短文本包含信息少、 词汇表达形式多样的不足. 实验结果表明, 该算法可有效提升短文本的聚类效果. 相似文献