全文获取类型
收费全文 | 250篇 |
免费 | 10篇 |
国内免费 | 10篇 |
专业分类
系统科学 | 3篇 |
丛书文集 | 9篇 |
教育与普及 | 4篇 |
理论与方法论 | 3篇 |
现状及发展 | 1篇 |
综合类 | 250篇 |
出版年
2024年 | 1篇 |
2023年 | 2篇 |
2022年 | 2篇 |
2021年 | 4篇 |
2020年 | 3篇 |
2019年 | 3篇 |
2018年 | 3篇 |
2017年 | 3篇 |
2016年 | 5篇 |
2015年 | 8篇 |
2014年 | 5篇 |
2013年 | 9篇 |
2012年 | 19篇 |
2011年 | 25篇 |
2010年 | 25篇 |
2009年 | 27篇 |
2008年 | 22篇 |
2007年 | 28篇 |
2006年 | 13篇 |
2005年 | 14篇 |
2004年 | 9篇 |
2003年 | 3篇 |
2002年 | 13篇 |
2001年 | 3篇 |
2000年 | 1篇 |
1999年 | 5篇 |
1997年 | 2篇 |
1996年 | 2篇 |
1995年 | 2篇 |
1994年 | 2篇 |
1993年 | 2篇 |
1989年 | 2篇 |
1986年 | 1篇 |
1983年 | 2篇 |
排序方式: 共有270条查询结果,搜索用时 15 毫秒
111.
Lucene自身提供的StandardAnalyzer虽然已经具备中文分词的功能,但是其分词正确率和切分速度不能够满足大多数应用的需要。为更好处理中文信息,必须引用独立的外部中文分词器。基于这种需求,文章对ChineseAnalyzer、CJKAnalyzer、IKAnalyzer、mmseg4j、imdict-chinese-analyzer和庖丁解牛6种主流中文分词器分别进行测试,并根据测试结果对分词效果做出评估。 相似文献
112.
一、引言搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎可分为全文索引、目录索引、元搜索引擎、垂直搜索引擎等。全文搜索引擎是目前广泛应用的主流搜索引擎,国外代表有Google,国内则有百度。 相似文献
113.
郭文龙 《齐齐哈尔大学学报(自然科学版)》2012,28(5)
数据清洗中,中文地址类信息对于重复记录的检测起着非常重要的作用。中文地址按照行政归属可划分为五级,通过组建地址信息数据库对中文地址进行匹配,提出基于地址树的中文地址分词技术,构建了中文地址的分词算法流程并设计了算法。 相似文献
114.
提出一种基于动态规划算法单字估价值的中文自动分词的研究方法,使用该方法对大量语料进行统计,通过分析四字词及四字词以下词单字的出现位置和出现次数,把出现概率转换为估价值.根据单字的出现位置和该位置的估价值,将分词问题转换为决策树求最优解问题,采用动态规划选取最优路径,从而确保切分结果的整体估价值最优. 相似文献
115.
116.
针对目前少按键设备搭载的汉语输入法多数输入效率较低的现状,在对现在方法进行考察的基础上,提出一种能够自动适应用户输入习惯的笔画输入方法.方法对笔画按键进行了合理的键盘布局并充分利用输入候补的屏幕显示功能,引入分词技术和自动学习机制,使输入法能够通过机器学习自动调节输入词典和联想信息,自动登录新词和删除不用的词汇,使输入法能够随着用户的使用输入效率不断提高.在PC机环境下编程实现了仿真系统,并通过输入实验验证了方法在较小输入词典的状态下,具有较好的输入效率和用户自适应性. 相似文献
117.
针对汉语自动分词后词条的特征信息缺失的问题,本文提出把整个分词过程分解为三个子过程,以词串为分词单位对文本进行分词:首先,采用逆向最大匹配法对文本进行切分;第二,对切分结果进行停用词消除;第三,计算第一次分词得到的词条互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串。实验结果表明,词条组合后的词串的特征信息更丰富,改善了文本特征选择的效果,提高了文本分类性能。 相似文献
118.
FTP(file transfer protcol)搜索引擎的重点在于中文分词技术和检索技术.使用了一种面向FTP搜索优化的最大前向匹配分词算法,并将用户查询作为反馈来更新分词算法中所使用的字典,结合倒排索引技术实现了一个高性能的FTP搜索引擎的原型系统.压力测试结果表明此FTP搜索引擎具有很高的性能. 相似文献
119.
基于延迟决策和斜率的新词识别方法 总被引:1,自引:0,他引:1
采用词典分词时会遇到未登录词的识别问题.本文提出一种新的中文新词识别方法,用于全文信息检索系统索引的建立.在索引切分过程中遇到无法切分字串时,暂存为未切分串,并生成统计信息.待未切分串达到一定数量时,再利用生成的统计信息结合斜率(加速度)的方法来切分暂存的未切分串.切分的结果可以进入索引,对于出现频率高的切分片段可以提取加入词典. 相似文献
120.