首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   250篇
  免费   10篇
  国内免费   10篇
系统科学   3篇
丛书文集   9篇
教育与普及   4篇
理论与方法论   3篇
现状及发展   1篇
综合类   250篇
  2024年   1篇
  2023年   2篇
  2022年   2篇
  2021年   4篇
  2020年   3篇
  2019年   3篇
  2018年   3篇
  2017年   3篇
  2016年   5篇
  2015年   8篇
  2014年   5篇
  2013年   9篇
  2012年   19篇
  2011年   25篇
  2010年   25篇
  2009年   27篇
  2008年   22篇
  2007年   28篇
  2006年   13篇
  2005年   14篇
  2004年   9篇
  2003年   3篇
  2002年   13篇
  2001年   3篇
  2000年   1篇
  1999年   5篇
  1997年   2篇
  1996年   2篇
  1995年   2篇
  1994年   2篇
  1993年   2篇
  1989年   2篇
  1986年   1篇
  1983年   2篇
排序方式: 共有270条查询结果,搜索用时 15 毫秒
111.
黄翼彪 《科技信息》2012,(12):246-247
Lucene自身提供的StandardAnalyzer虽然已经具备中文分词的功能,但是其分词正确率和切分速度不能够满足大多数应用的需要。为更好处理中文信息,必须引用独立的外部中文分词器。基于这种需求,文章对ChineseAnalyzer、CJKAnalyzer、IKAnalyzer、mmseg4j、imdict-chinese-analyzer和庖丁解牛6种主流中文分词器分别进行测试,并根据测试结果对分词效果做出评估。  相似文献   
112.
胡嘉海 《安徽科技》2012,(12):46-47
一、引言搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎可分为全文索引、目录索引、元搜索引擎、垂直搜索引擎等。全文搜索引擎是目前广泛应用的主流搜索引擎,国外代表有Google,国内则有百度。  相似文献   
113.
数据清洗中,中文地址类信息对于重复记录的检测起着非常重要的作用。中文地址按照行政归属可划分为五级,通过组建地址信息数据库对中文地址进行匹配,提出基于地址树的中文地址分词技术,构建了中文地址的分词算法流程并设计了算法。  相似文献   
114.
提出一种基于动态规划算法单字估价值的中文自动分词的研究方法,使用该方法对大量语料进行统计,通过分析四字词及四字词以下词单字的出现位置和出现次数,把出现概率转换为估价值.根据单字的出现位置和该位置的估价值,将分词问题转换为决策树求最优解问题,采用动态规划选取最优路径,从而确保切分结果的整体估价值最优.  相似文献   
115.
针对汉语自动分词后词条的特征信息缺失的问题,提出以词串为分词单位的中文文本分词方法,将整个分词过程分解为三个子过程:首先,采用逆向最大匹配法对文本进行切分;第二,对切分结果进行停用词消除;第三,计算第一次分词得到的词条互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串。实验结果表明,词条组合后的词串的语义信息更丰富,有助于文本特征选择效果的改善和文本分类性能的提高。  相似文献   
116.
针对目前少按键设备搭载的汉语输入法多数输入效率较低的现状,在对现在方法进行考察的基础上,提出一种能够自动适应用户输入习惯的笔画输入方法.方法对笔画按键进行了合理的键盘布局并充分利用输入候补的屏幕显示功能,引入分词技术和自动学习机制,使输入法能够通过机器学习自动调节输入词典和联想信息,自动登录新词和删除不用的词汇,使输入法能够随着用户的使用输入效率不断提高.在PC机环境下编程实现了仿真系统,并通过输入实验验证了方法在较小输入词典的状态下,具有较好的输入效率和用户自适应性.  相似文献   
117.
针对汉语自动分词后词条的特征信息缺失的问题,本文提出把整个分词过程分解为三个子过程,以词串为分词单位对文本进行分词:首先,采用逆向最大匹配法对文本进行切分;第二,对切分结果进行停用词消除;第三,计算第一次分词得到的词条互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串。实验结果表明,词条组合后的词串的特征信息更丰富,改善了文本特征选择的效果,提高了文本分类性能。  相似文献   
118.
FTP(file transfer protcol)搜索引擎的重点在于中文分词技术和检索技术.使用了一种面向FTP搜索优化的最大前向匹配分词算法,并将用户查询作为反馈来更新分词算法中所使用的字典,结合倒排索引技术实现了一个高性能的FTP搜索引擎的原型系统.压力测试结果表明此FTP搜索引擎具有很高的性能.  相似文献   
119.
基于延迟决策和斜率的新词识别方法   总被引:1,自引:0,他引:1  
采用词典分词时会遇到未登录词的识别问题.本文提出一种新的中文新词识别方法,用于全文信息检索系统索引的建立.在索引切分过程中遇到无法切分字串时,暂存为未切分串,并生成统计信息.待未切分串达到一定数量时,再利用生成的统计信息结合斜率(加速度)的方法来切分暂存的未切分串.切分的结果可以进入索引,对于出现频率高的切分片段可以提取加入词典.  相似文献   
120.
根据词典的设计分类等主要描述了词法分析的词性分类与词典的分类和结构;在分词算法的基础之上讨论了分词中存在的问题及分词思想.  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号