期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	3篇
免费	0篇

专业分类

综合类

3篇

出版年

2016年	1篇
2014年	1篇
2009年	1篇

排序方式： 共有3条查询结果，搜索用时 0 毫秒

基于后缀树的网页聚类算法性能改善研究

维尼拉·木沙江买买提依明·哈斯木《新疆大学学报(自然科学维文版)》2014,(1):20-28

网页聚类技术是快速定位搜索引擎返回结果中用户最需要资料的方法。基于后缀树聚类算法是利用网页集中共享的短语来对网页集进行聚类。本文研究怎样充分利用后缀中的共享短语之间的关系提高后缀树性能的方法。相似文献

基于词间关联度度量的维吾尔文本自动切分方法

吐尔地·托合提维尼拉·木沙江艾斯卡尔·艾木都拉《北京大学学报(自然科学版)》2016,52(1):155-164

提出一种基于词间关联度度量的维吾尔文本自动切分方法。该方法从大规模生语料库中自动获取维吾尔文单词Bi-gram及上下文语境信息, 在充分考虑维吾尔文单词间结合规则的前提下, 将相邻单词间的互信息、t-测试差及双词邻接对熵的线性融合作为组合统计量(dmd), 度量文本中相邻单词之间的关联程度。以dmd度量的弱关联的词间位置作为切分点进行自动切分, 得到语义及结构完整的词串, 而不仅仅是以空格隔开的单词。在大规模文本语料上进行的测试表明, 该方法的切分准确率达到88.21%。相似文献

基于重定位的维、哈、柯文Unicode 编码及多文种索引技术研究

维尼拉·木沙江吐尔地·托合提吐尔洪·吾司曼《郑州大学学报(理学版)》2009,41(1)

没有语言ID的维、哈、柯文部分字母在Unicode代码区域中共享字符代码,因此在信息交换、自动分词和检索应用中,很难区分维、哈、柯文字母.存在语言上的二义性.另外,该区域中字母的顺序符合阿拉伯字母表,维、哈、柯文字母的顺序非常混乱,这对于维、哈、柯多文种数据的索引、排序和查询处理带来了很大困难.针对以上问题,研究了一种内部Unicode编码方法和基于词根的多文种索引技术.研究结果表明,这种方法完全解决了多文种信息的存储、排序等数据库管理问题,大大简化了索引技术及实现难度. 相似文献