首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
丝绸之路经济带为丝路沿线各国及地区带来的发展机遇。丝路沿线不同语言信息的交换及处理技术的提升将面临新的机遇与挑战。以蒙古文为实例,研究了丝路带相似多语言信息交叉处理通信问题,研讨了基于词典及语言学知识和基于统计的机器翻译( SMT)两种方式的蒙文多语种文本的自动转写或翻译方法。试验结果显示,SMT方法对于相似语言转写的效果相比于语言学以及不同语系不同语族语言的翻译效果近提升一倍。  相似文献   

2.
计算文本相似度常用的方法是计算以VSM表示的文本之间的夹角余弦值,但这种方法并没有考虑文本中词语之间的语义相似度.另外由于计算余弦值时要考虑VSM向量对齐,从而导致计算的高维度、高复杂性.《知网》作为一个汉语常用的知识库得到广泛的研究,利用该知识库能方便地求得汉语词语之间的相似度.利用《知网》计算每篇文本中词语之间的相似度,对VSM进行改进,用少量特征词的TF/IDF值作为改进后的VSM向量中的权重,进而计算文本之间的相似度.通过比较改进前后的VSM的维数、召回率和准确率,结果显示,改进后的算法明显降低了计算的复杂度并提高了召回率和准确率.  相似文献   

3.
4.
对链接算法在搜索引擎检索结果排序中的应用进行研究,提出基于Page Rank和锚文本对检索结果进行二次排序,合理评价网页重要程度.实验结果表明,该方法在一定程度上能提高检索效果.  相似文献   

5.
6.
基于事件的文本相似度计算   总被引:2,自引:0,他引:2  
大量研究成果已经表明,事件在很多文本中是客观存在的.从语义的角度理解,诸多文本是由事件组成的,事件是文本表示的最小语义单位.给出了基于事件的文本表示模型,在此模型的基础上,从文本类型相似度计算和文本内容相似度计算两个层面论述了文本相似度计算的方法.  相似文献   

7.
企业信息检索系统所要解决的核心问题就是:提高检索关键字集合的规范性与完备性,通过对文本相似度计算及相关分类算法,达到检索关键字集合规范性及完备性提高的目的。本文给出了线性序列相似度的定义,讨论了匹配矩阵的性质,给出了一种计算线性序列相似度的算法,并对算法作出了优化。  相似文献   

8.
计算文本相似度阈值的方法   总被引:8,自引:0,他引:8  
基于VSM(向量空间模型)的相似度分类器的相似度阈值通常由经验确定导致分类精度不高。该文提出一种基于Boosting机制在不同文档集上自动计算相似度阈值的方法。它利用Boosting迭代生成多个基于相似度划分的子分类器,通过加权把决定这些子分类器的相似度阈值组合起来,得到对理想相似度阈值的一种逼近。实验表明:这样得到的相似度分类器的平均精度比传统方法高15%左右,甚至可以与一些复杂方法相比。它在处理网络实时文本信息处理问题(分类、过滤和检索)中的效率是这些复杂方法的3倍以上,且问题规模越大、越复杂,其优势越大。  相似文献   

9.
从海量无结构互联网信息中提取高质量的社会网络有着广阔的应用前景和较高的学术价值,本文以新浪微博网站作为信息源提取用户之间的共同兴趣网络,在知网文本相似度计算方法的基础上,结合用户特征词的词性分析,提出了一种结合词性的用户相似度计算方法,此方法可以计算用户之间的兴趣强度,进而构建共同兴趣网络。实验结果表明,该方法对用户类别判定的准确率有所提高,对兴趣网络的提取有较好的效果。  相似文献   

10.
基于文本最小相似度的中心选取方法   总被引:1,自引:0,他引:1  
基于划分的聚类算法是一种局部最优算法.聚类初始中心的选择对该聚类算法的收敛速度和聚类的性能都有很大的影响.初始中心点应该选择来自不同的类并且初始中心点文本之间的相似度应尽量小,为此提出了一种新的基于最小相似度的中心选取方法,该方法选择相似度最小的两个样本分别作为初始的两个中心,然后依次选择到已知中心相似度最小的样本作为其他类的中心.实验表明该方法能够选出来自不同类的样本作为聚类的初始中心,同其他初始中心选择方法比较,聚类算法的性能有明显提高.  相似文献   

11.
为了保证几何相似模型与原件具有完全相同的应力-应变分布,必须对几何相似模型施加与实际构件成对应比例的各种载荷,因此需要寻求几何相似模型在应力-应变分布完全相同时各种外加载荷的比例关系。从相似理论入手,以2端固支的矩形梁下表面边线中点的应力解析表达式为基础进行推导,得出相应的理论载荷关系,并用算例在弹塑性状态下验证了所得关系的正确性。得到的结论是:对于2个几何相似构件,若几何相似系数为kl,则当外加集中载荷的载荷系数为kl、均布线载荷的载荷系数为kl、均布面载荷的载荷系数为1时,2构件的应力-应变分布完全相同。  相似文献   

12.
任何一种语言,在其长期的使用发展过程中,都会形成完整的规则体系,都有着无限的自由表现空间和无限的组合活用性。从认知心理学程序性知识的两个方面,构成了学习内容与方式互动作用的二维空间。把意义的化维度与思想维度融合起来,通过多层次性与多维度概念的建构,获得一个积极主动的知识建构过程。认知要经过对信息点的采集、信息的存储、整理归纳、提取和应用,并与已有的知识相融合,把那些看似没有生命的符号组合起来,按照逻辑被排列,产生思想化,同时也就具备了跨语言化共性的对应与可融通性。  相似文献   

13.
满语和鄂伦春语同属阿尔泰语系满一通古斯语族,但由于分化的年代久远,两种语言的类型已经有了差异,满语从粘着语逐渐走向分析语,而鄂伦春语仍然是典型的粘着语。由粘着语到分析语,是语言进化的表现,是语言发展的普遍规律。  相似文献   

14.
根据课本基础知识,逐层深入地探究矩阵A与对角矩阵相似的条件定理,利用此类定理对研究特殊矩阵的相关问题非常重要,对相关问题的解决也显得简捷.  相似文献   

15.
本文主要利用线性变换的方法研究了对合矩阵的相似标准型.并在此基础上推导出了对合矩阵的迹,证明了任意一个对合矩阵都可以分解为两个对称矩阵的乘积.  相似文献   

16.
模糊语言学的创立为诸多学科的进一步发展奠定了极其重要的理论基础.自然语言模糊性的重要性不言而喻,对模糊语言的客观基础和心理因素的探求,对进一步提高语言模糊性研究层次具有重要意义.文章通过对比的方式,从不同的角度,对模糊语言的客观性和心理因素进行了探讨,旨在为提高语言模糊性的研究层次铺设道路.  相似文献   

17.
当前,河南省红色旅游景区的语言文本在红色文化述介中存在不正确、不规范、不标准等问题,主要是语言文字不规范,文本内容缺乏应有的吸引力,思想道德教育信息挖掘整理不足,英汉双语建设中的跨文化失体,以及管理与监督机制不健全等。这些都直接关涉红色景区开发与利用的有效性,最终将影响到红色景区的可持续发展。因此,必须加强红色旅游景区语言文本的规范性建设。  相似文献   

18.
岩石相似材料配比中水敏材料的合理选择是开展水岩劣化作用下岩体工程大型物理模型实验研究的重要基础与前提。从研制适用于开展水岩作用相关物理模型试验相似材料的角度出发,以石英砂、重晶石粉为骨料,水泥、石膏为胶结材料,分别添加膨润土、伊利石粉、高岭土作为水敏性调节剂来制作岩石相似材料,开展了单轴压缩、直剪以及水理性试验,获得了不同配比相似材料的物理力学参数和水理性质指标,并采用单因素控制法深入分析了不同黏土矿物类型与不同掺入量对相似材料试样物理力学性质与水理性质的影响。结果表明:(1)添加黏土矿物的相似材料,其物理力学参数分布范围广,能满足岩石相似材料的需求;(2)黏土矿物的添加显著改变了试样的物理力学性质,随着其掺入量的增加,试样密度、抗压强度、弹性模量以及黏聚力整体呈下降趋势,内摩擦角呈增大趋势,其中膨润土的影响程度强于伊利石粉和高岭土;(3)含有膨润土的相似材料相对于其他黏土矿物吸水率更大,更易于发生崩解,更适合作为研究水岩相互作用的物理模型试验相似材料的水敏性添加剂。该研究成果可为研制适用于开展水岩相互作用的物理模型试验相似材料提供参考。  相似文献   

19.
刑事类案不同判的现象从个别开始转向普遍,可以说这种现象的存在严重地侵害了司法权威。文章以现实案例分析司法审判中存在的"类案不同判"的问题和原因,并提出解决方案,即根据具体的方案改善现有法律的不足之处,弥补案例指导的缺陷,更新典型案例数字平台,规范法官自由裁量权,防止地方保护和舆论的干扰,强调司法独立的重要性。最后,结合现有的指导性案例和量刑指导意见提出了自己的完善建议,以求类案同判的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号