首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   922篇
  国内免费   10篇
  完全免费   25篇
  综合类   957篇
  2018年   1篇
  2017年   2篇
  2016年   2篇
  2015年   10篇
  2014年   46篇
  2013年   40篇
  2012年   76篇
  2011年   64篇
  2010年   81篇
  2009年   89篇
  2008年   74篇
  2007年   79篇
  2006年   67篇
  2005年   45篇
  2004年   56篇
  2003年   69篇
  2002年   51篇
  2001年   51篇
  2000年   42篇
  1999年   7篇
  1998年   5篇
排序方式: 共有957条查询结果,搜索用时 31 毫秒
1.
模板化网页主题信息的提取方法   总被引:34,自引:0,他引:34  
为了消除网页噪音,有效地提取基于模板的网页主题信息,提出了一种新的信息提取方法.该方法采用机器自动学习方式生成网页集的模板;以网页链接关系中的锚点文本作为提取目标对模板进行标记,生成对应模板的提取规则;依据模板的提取规则对网页主题信息进行提取.对国内2 588个新闻网页进行了检测.实验结果表明,该方法可以快速、有效地提取模板生成的网页集主题信息,准确率达99.5%.将该方法应用于搜索引擎系统(木棉检索)中,与原来的检索系统相比较,索引文件的大小减少约50%,检索的速度和精确度也得到提高.  相似文献
2.
语义Web的研究与展望   总被引:28,自引:5,他引:23  
对一系列Web新技术的总称--语义Web进行了综述,在分析语义Web的研究背景、研究价值及现有语义Web模型的基础上,对W3C组织的语义Web研究现状和语义Web研究领域当前的研究状况进行了分析;对其今后的研究工作进行了展望;总结了未来语义Web基础研究和应用研究的方向:语义Web的基础研究主要包括本体的发展、语义Web语言的形式语义和确信(Trust)与证据(Proof)模型的开发;应用研究主要集中在Web-services、基于代理的分布式计算、基于语义的网页搜索引擎和基于语义的数字图书馆几个方面.  相似文献
3.
对网页PageRank算法的改进   总被引:19,自引:0,他引:19  
分析了著名搜索引擎Google采用的PageRank算法,指出其偏重旧网页,忽视专业站点以及对网页中的超链接评估不恰当等不足之处。改进算法考察了网页日期这一重要因素,并重新计算网页中超链接对网页的影响。网页结构中蕴涵着丰富的信息,在href,title等标记中文字对网页主题有重要作用,利用结构标记可以辅助判断网页的主题内容。试验结果表明,采用改进的算法可以提高判断网页重要性的准确度。  相似文献
4.
网页分类技术   总被引:16,自引:0,他引:16  
网页分类是使用机器学习的方法实现网页类别的自动标注.回顾了文本分类技术的研究状况,分析了网页的结构特征,难点在于结合网页的结构信息选择合理的表示方式和分类算法.使用纯文本分类技术处理网页是不合理的.基于概率模型的方法和关系学习方法计算量大,关系学习方法学习结果的可解释性好,支持向量机方法分类准确率高,但核函数的构造和大规模数据集的训练都是该算法的难题.应该采用多种指标对网页分类算法进行评价.  相似文献
5.
基于可视布局信息的网页噪音去除算法   总被引:14,自引:1,他引:13  
主要探讨了网页中的噪音去除问题.针对单一页面中包含的丰富的可视信息,提出了一个更加精确的噪音去除算法首先获得页面中各元素标记的布局信息,然后利用布局信息对页面进行划分,最后在此基础上去除噪音.与采用"布局信息"的算法相比.本文提出的算法对页面布局信息的提取更加准确,并能处理动态HTML页面.实验结果表明,该算法优于同类算法,可有效地去除网页噪音.  相似文献
6.
Web内容抽取及其数据管理方法   总被引:13,自引:0,他引:13  
随着Internet及其相关技术的飞速发展,WWW已成为最大的信息集散地,无论对企业还是个人,Web逐渐成为最主要的信息来源,然而由于网站数量过多以及由此带来的信息泛滥,使得有用信息的获取越来越困难,搜索引擎只能提供信息的查找范围,而具体的内容还是要靠详细搜查,而且网页信息都是非结构化或半结构化的,无法直接利用分析工具进行分析,所以有必要提供一种网页内容自动抽取及使网页数据结构化的方法,来简化信息获取的过程和方便信息分析处理。  相似文献
7.
基于Web分布式网络CAPP系统的开发   总被引:12,自引:0,他引:12  
为满足工艺设计的协同工作、知识积累和快速复用的实际需求,在总结网络数据库查询方法的基础上,提出分布式网络CAPP系统结构,包括数据层、数据处理层、表达层和应用层;论述了系统的主要功能和基于Web的工艺数据查询的实现方法。  相似文献
8.
面向主题的网页搜索系统   总被引:12,自引:0,他引:12  
论述了一个面向主题的网页搜索系统(SATWP),该系统与智能代理的辅助下具有搜索,导航,以及信息反馈等功能。在判断网页与查询主题的相关度时改变了单纯的从网页内容上考虑的方法,即从网页自身的URL,网页间的关系以及网页的内容来判断。SATWP采用在客户端的智能代理记录用户的浏览行为,并把有关信息反馈给服务器,服务器根据这些信息随时调整数据库中相关网页的重要性顺序,增加了自身的学习功能,试验结果表明,该系统具有较高的准确度。  相似文献
9.
PageRank-Pro--一种改进的网页排序算法   总被引:9,自引:1,他引:8  
根据网页点击信息改进了原有的PageRank算法,利用Seidel迭代算法加快了迭代收敛过程.实验结果表明,改进后的迭代算法效率提高23%左右.  相似文献
10.
新浪微博数据挖掘方案   总被引:9,自引:0,他引:9  
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号