首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
基于词联接的语义分析原理及其算法   总被引:2,自引:0,他引:2  
现有自然语言处理方法主要采取自下而上的由词到句、由句到篇的语言分析过程,而且语义分析能力有限,因此难以对大规模真实文本进行语义处理.笔者提出了一种基于词联接的语义分析方法.该方法以词联接的语义知识为基础,采取整句切入、先下后上的语义分析过程,核心算法是句子最优树搜索和词联接语义符合度计算.目前该方法已应用于国家自然科学基金资助的计算机辅助诗词创作研究项目.  相似文献   

2.
针对当前中文词嵌入模型无法较好地建模汉字字形结构的语义信息,提出了一种改进的中文词嵌入模型.该模型基于词、字和部件(五笔编码)等粒度进行联合学习,通过结合部件、字和词来构造词嵌入,使得该模型可以有效学习汉字字形结构所蕴含的语义信息,在一定程度上提升了中文词嵌入的质量.  相似文献   

3.
提出了一种基于不同语义单元度量的句子相似度计算方法.将句子按词块分割为对应的公共词块和非公共词块,利用外部语义资源进行同义词替换和语义消歧处理.分别用词、词块和字为语义单元度量句子相似度,以不同的权重调节各语义单元对句子相似度的贡献.实验结果表明,该方法综合考虑的因素更加全面,有较高的准确率.  相似文献   

4.
提出了一种基于不同语义单元度量的句子相似度计算方法.将句子按词块分割为对应的公共词块和非公共词块,利用外部语义资源进行同义词替换和语义消歧处理.分别用词、词块和字为语义单元度量句子相似度,以不同的权重调节各语义单元对句子相似度的贡献.实验结果表明,该方法综合考虑的因素更加全面,有较高的准确率.  相似文献   

5.
彝语词法分析是计算机彝文信息处理中一项不可缺少的基础性工作,计算机彝文信息处理只要涉及到信息检索、机器翻译、语法分析、语义分析等方面的应用,就都需要以词为基本的处理单位.简要介绍了彝语语法结构,信息处理用彝语分词的主要任务,提出一种基于层叠隐马尔科夫模型的彝语词法分析方法.  相似文献   

6.
自然语言是由语言、语法、语义构成的.语义常常会产生不一致,这些不一致往往需要借助语境也即语音、语法结构和上下文进行理解.本文分析了计算机处理的信息中存在的语义不一致现象,并提出了语义冲突的处理模型.  相似文献   

7.
以认知语言学的原型理论、隐喻、转喻为基础,分析了英汉语言中基本颜色词"红"的认知语义共性及差异。人类共通的认知方式是形成其语义共性的主要原因,英汉民族不同的社会文化因素造成了"红"在两种语言中的语义差异。  相似文献   

8.
“拼音-量示”中文计算机键盘输入方法是一种适合于广大的非专职(键盘操作)人员向电子计算机输入中文信息的“普及型”方法。该方式的基本思想是:根据国家正式颁布的《汉语拼音方案》,对所要输入的中文的字(词)按其拼音字符进行击键输入,依靠计算机屏幕提示出一系列具有同样拼音字符的字(词),键盘操作者则可以根据屏幕提示的同音字(词)的不同尾码再击表示尾码的键,从而完成对字(词)的输入。本文介绍了“拼音-提示”输入的Ⅰ型至V型等五种输入方法,编码以及相应的汉语拼音键盘盘面布局设计。这五种方法分别是:  相似文献   

9.
从信息编码的角度研究汉语字和词的构成及其组合规律,界定汉语编码系统的三级基码及各级基码之间的关系,分析汉语从笔画到词十四级编码过程,从中探索汉语字词的编码构成及规律,阐释汉语的信息编码系统。  相似文献   

10.
美国版《甄嬛传》字幕中称谓词的翻译存在语义的流失与补偿现象.流失是由于英汉两种语言之间存在语义不对应的称谓词.在翻译称谓词时,有意识地补偿语义,可以展现出称谓词蕴含的语义信息和使用者的价值观,补偿的方法有对源语称谓词的内涵信息进行保留、对源语称谓词的直译信息进行增译、转化源语称谓词等.  相似文献   

11.
民族文字信息处理研究对于保护民族文化遗产和弘扬民族文化有重要意义.字符的计算机编码及字库创建是民族文字信息处理研究工作的基础内容.在分析湘西板塘苗文的字形特点和简单介绍字符编码标准及字体技术的基础上,提出了Windows环境下基于Unicode标准的板塘苗文在计算机中的编码方案,给出了板塘苗文基于Photoshop技术的字模制作方法及基于Truetype技术的字库创建步骤.  相似文献   

12.
本研究提出了一种锡伯文、满文、传统蒙古文和托忒文的多语种统一字符编码方案。该方案的编码字符集是对应文种的规范字符,且采用统一的拉丁字母顺序排列,更适合国际化的发展趋势。采用这一方案的计算机处理系统与基于名义字符编码的系统相比,就锡伯文、满文而言,完全不需要自由变体选择符,对传统蒙古文等其他语种也能极大的减少自由变体选择符的使用,更符合一般用户的使用习惯,方便文字信息的查询、搜索和处理。  相似文献   

13.
Microblog is a social platform with huge user community and mass data. We propose a semantic recommendation mechanism based on sentiment analysis for microblog. Firstly, the keywords and sensibility words in this mechanism are extracted by natural language processing including segmentation, lexical analysis and strategy selection. Then, we query the background knowledge base based on linked open data(LOD) with the basic information of users. The experiment result shows that the accuracy of recommendation is within the range of 70%-89% with sentiment analysis and semantic query. Compared with traditional recommendation method, this method can satisfy users’ requirement greatly.  相似文献   

14.
朱杰 《实验室科学》2011,14(5):183-187
物资管理过程中因一物多名造成的编码管理混乱至今没有发现有效解决办法.通过分析提出了冗余码编码系统这种新的编码方法,并从编码系统的逻辑结构、编码方案、编码的计算机处理过程及应用等方面进行了论述.这套编码方案使用简单方便,与原有的编码系统容易转换,并且通过这种编码方案设计的编码容易维护而且数据稳定性好,可以有效解决原有的编码系统使用过程中存在的信息管理混乱、统计数据可靠性差等多数问题.  相似文献   

15.
OpenType技术在藏文字库中的应用   总被引:2,自引:0,他引:2  
格桑多吉  强巴 《西藏大学学报》2006,21(3):129-132,126
用传统的字库技术进行藏文文字处理时,遇到了最终显示字形不存在确定码位、文字字库具有文件大、编码混乱、系统间互不兼容、不支持Internet藏文信息交换等诸多的问题。在实践的基础上,文章介绍了一种能克服这类问题,满足藏文处理需求的字库技术——OpenType,并针对藏文处理系统的现状,提出了藏文字库和文字处理程序等方面整字编码方案和国际编码标准兼容的方法。  相似文献   

16.
针对位置语言模型没有考虑词与词之间语义关系的问题, 提出一种结合语义的位置语言模型。首先采用高斯核函数来度量词与词之间的位置关系; 然后提出一种平滑互信息的技术来度量词与词之间的语义关系, 证明了平滑互信息能够有效解决大量词对之间无法通过互信息来计算转移概率的问题; 还证明了位置语言模型是结合语义位置语言模型的一个特例; 最后将结合语义的位置语言模型应用于信息检索, 得到一个基于该模型的检索模型。实验结果表明, 基于该模型的检索模型在性能方面要优于基于位置语言模型的检索模型。  相似文献   

17.
《藏汉双语信息处理系统》基于藏文编码国际标准 ISO/IEC 10646-1和藏文三项国家标准建立了藏语言构件集,解决了藏文编码字符集的开放性问题,完善了自行开发的藏汉桌面印刷系统。在此基础上,开发出了9个藏文信息处理子系统,大面积地填补了现代化藏学研究的空白。  相似文献   

18.
汉字编码是中文信息处理的关键之一,也是最棘手的问题。手工编码工作量大,周期长,一个方案的实现要耗费大量的时间和人力。本文介绍一个根据汉字编码的PTIC模型开发的计算机辅助汉字编码系统——“CC-1”机助编码软件包。“CC-1”软件包的实现所涉及的三个关键问题:汉字信息基元库、编码语言和生成矩阵的优化在文中给予了较详细的论述。在机助编码系统中,使用了一些新的算法。在“CC-1”软件包的支持下,从编码方案规则的输入到正码表的产生,绝大多数工作都由计算机在十小时内完成。这个软件包可以处理种类繁多的汉字输入方案。它是优化汉字编码实现标准化的强有力工具。  相似文献   

19.
回顾藏文信息处理技术的发展   总被引:3,自引:1,他引:2  
藏文有着悠久的历史,藏文字包含着丰富的信息。信息时代,对藏文的处理提出了新的研究课题——用计算机来处理藏文信息。八十年代中后期开始了藏文信息的研究工作,并且取得了较好的成绩。文章详细回顾了藏文的字处理、藏语自然语言处理、藏文软件本地化以及藏文信息处理在应用领域中的研究。  相似文献   

20.
基于语义的汉语文献主题词提取算法研究   总被引:10,自引:0,他引:10  
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号