首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 625 毫秒
1.
基于特定领域的语料库,利用统计和语言学规则相结合的方法提取多字词表达(Multiword expressions)。首先利用领域高频词作为种子词提取候选串,进一步利用各种统计量、多字词表达边界过滤规则对候选串进行噪声剔除,得到多字词表达。实验结果表明,该方法对于处理大规模真实文本效率很高,可以有效提高多字词表达的获取,可以更有针对性地在特定领域提取多字词表达。  相似文献   

2.
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句中抽取候选多字词表达的基础上,将候选多字词表达分为正确串、残缺串、冗余串和错误串4类,借助搜索引擎对查询串的优化和候选多字词表达在互联网上的检索结果,设计候选多字词表达校正方法,实现对多字词表达的提取.以新浪爱问知识人问题库中的问句进行实验,结果表明,多字词表达抽取的准确率、召回率和F值分别达到84%,52%和0.64,验证了该方法的有效性.  相似文献   

3.
观点挖掘技术旨在面向更为广阔的产品领域,从文本中自动获取观点所评价的对象,并有针对性地分析评论的倾向性.本文通过建立ChunkCRF模型对观点表达句中显式观点评价对象的识别;借助句法关系对句中出现多个评价对象的问题进行处理;利用语义搭配习惯对隐式评价对象进行填充生成.在此基础上,本文实现了基于观点评价对象的观点抽取与观...  相似文献   

4.
分析了Horspool算法的原理及特点,提出了一种适用于方块苗文环境的字符串模式匹配算法.该算法结合方块苗文的编码方式及字符串查找的特点,通过对Horspool算法中的字符处理单位进行扩展来适应方块苗文的字符串匹配.实验结果表明,在单字词、双字词和多字词的方块苗文字符串匹配过程中,该算法均呈现出较好的性能,能够用于解决方块苗文的快速检索问题.  相似文献   

5.
为了提高中文分词算法的切分速度和存储效率,提出一种基于对偶编码的特征匹配算法。由中文分词的字符集和字符相邻关系提取特征值,根据此特征值在中文分词词典中进行快速匹配,基于字符的位置相邻关系提取特征值,支持模糊匹配,因此无需对多字词进行单独匹配,从而有效节省匹配时间。实验仿真表明,该算法可以降低特征存储空间,有效提高中文分词精度和效率。  相似文献   

6.
以中国(重庆)园博园中城市展园为主要研究对象,就其地域文化的表达内容与景观设计的表现方法进行实地调查和归类.首先,分析了地域文化的提取方式、转化技巧及地域材料的应用,得出城市展园地域文化的营造方法.其次,在深入挖掘地域文化的基础上,从城市展园景观设计表达的角度,结合典型案例,分析了城市展园的主题立意、主题表达方式、造园手法、空间处理和技术运用等,强调景观设计语言的运用对地域文化表达的重要性,探讨了城市展园景观设计表达的主要策略.  相似文献   

7.
基于语义的汉语文献主题词提取算法研究   总被引:10,自引:0,他引:10  
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.  相似文献   

8.
低温胁迫下棉花子叶蛋白质差异表达的双向电泳分析   总被引:8,自引:0,他引:8  
采用TCA-丙酮沉淀法,改良优化了棉化蛋白质组研究中的双向电泳技术.通过对根和子叶全细胞蛋白的提取、蛋白的溶解、胶条的选择及电泳等环节的优化,得到了重复性很高、分辨率很好的蛋白质图谱.进一步对5 d苗龄的棉花进行4℃低温处理12 h后,提取子叶的蛋白质,利用双向电泳技术分离全细胞蛋白.并用PDQuest软件分析比较棉花子叶在低温处理下的蛋白表达谱,得到了49个有显著差异的蛋白点.其中,低温处理上调表达的蛋白点有27个,减弱表达的蛋白点有22个,推测这些差异蛋白点可能与低温胁迫相关.  相似文献   

9.
在故障诊断领域,时延自相关已是一种重要的信号处理工具,而变模态分解则是新兴起的信号处理方法.文中利用时延自相关函数对信号进行降噪处理,再对提取的时延自相相关函数进行变模态分解,选择有效本征模态函数提取出故障频率.模拟仿真与故障实验结果表明:该方法更能有效地抑制噪声,凸显故障特征信息,在旋转机械故障诊断领域具有广泛的应用前景.  相似文献   

10.
提出了一种基于仿射变换自适应的形状和骨架特征的手绘草图检索算法.首先采用一种基于傅里叶变换的降维滤波方法对对象进行规范化处理,并以此为基础提取对象轮廓和区域特征;然后提出一种仿射变换自适应骨架提取算法提取对象骨架、得到骨架树特征描述子,并提出一种骨架树匹配算法;最后结合对象轮廓区域和骨架特征来实现草图检索.实验结果表明,该方法对对象仿射变换(平移、缩放、旋转)有很强的适应性,对噪声有较强的鲁棒性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号