排序方式: 共有7条查询结果,搜索用时 15 毫秒
1
1.
在对词典的查找算法作了回顾基础上,根据跨语言信息检索系统的要求,提出了一种词典查找的新机制,与其他查找算法的不同之处在于本方法支持模糊查找.查找机制结合Trie树和单字倒排的方法,既实现了查找的高效率又实现了模糊查找的算法,实验证明这种方法能够满足实际系统的需要. 相似文献
2.
Incorporating Linguistic Rules in Statistical Chinese Language Model for Pinyin-to-character Conversion 总被引:1,自引:0,他引:1
An N-gram Chinese language model incorporating linguistic rules is presented. By constructing elements lattice, rules information is incorporated in statistical frame. To facilitate the hybrid modeling, novel methods such as MI-based rule evaluating, weighted rule quantification and element-based n-gram probability approximation are presented. Dynamic Viterbi algorithm is adopted to search the best path in lattice. To strengthen the model, transformation-based error-driven rules learning is adopted. Applying proposed model to Chinese Pinyin-to-character conversion, high performance has been achieved in accuracy, flexibility and robustness simultaneously. Tests show correct rate achieves 94.81% instead of 90.53% using bi-gram Markov model alone. Many long-distance dependency and recursion in language can be processed effectively. 相似文献
3.
基于LSTM的大规模知识库自动问答 总被引:1,自引:0,他引:1
针对大规模知识库问答的特点, 构建一个包含3个主要步骤的问答系统: 问句中的命名实体识别、问句与属性的映射和答案选择。采用别名词典结合LSTM语言模型进行命名实体识别, 使用双向LSTM模型结合两种不同的注意力机制进行属性映射, 最后综合前两步的结果进行实体消歧和答案选择。该系统在NLPCC-ICCPOL 2016 KBQA任务提供的数据集上的平均F1值为0.8106, 接近评测的最好水平。 相似文献
4.
5.
为了通过预测分析检索量数据来指导商家调整产品开发及经营策略,将检索量数据组织为时间序列,对其用自回归滑动平均(ARMA)模型进行建模预测.先将时间序列进行聚类,仅对聚类中心序列进行ARMA模型识别,同类序列用该模型进行近似建模预测:经过数据预处理、相似性分析、基于相似度的聚类、时间序列预测等过程,得到检索量数据的预测值... 相似文献
6.
术语自动抽取是信息处理领域的基础性课题,日益受到研究者的关注。似然比方法能有效抽取低频词汇,但抽取准确率偏低。为了解决这个问题,将似然比的抽取结果用C-value进行改进。实验证明,两者相结合,在保证似然比方法高召回率的前提下,比单纯依靠似然比方法抽取准确率提高了约8%。 相似文献
7.
1