首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
作为Web内容挖掘的重要组成部分,基于Web的命名实体提取与实体关系发现,以海量Web网页中蕴涵的海量实体及丰富的实体间关系为对象,充分利用Web数据本身的特点,发展一整套方法和技术,力求高效、准确地提取Web网页中的实体与关系.  相似文献   

2.
web中海量信息源的组织是异构的、多元的和分布的,这给信息检索系统提出了巨大的挑战.本文结合本体论和个性化搜索引擎技术,以现有搜索引擎为基础,利用Ontolog工具,提出了基于内容的个性化Web检索系统的设计思想.  相似文献   

3.
Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更新问题.于是研究语义Web并行搜索引擎成了一个重要的研究方向.介绍了如何设计一个基本的面向语义Web的并行爬虫系统.该系统由一个中央控制器和若干个子爬虫组成.中央控制器负责为爬虫分配抓取任务,并汇总抓取的数据;子爬虫负责抓取并抽取URLs的工作.而对于每个子爬虫除了处理RDF文档之外,还试图从传统HTML网页中通过强化学习的方法发现更多RDF文档链接.  相似文献   

4.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法.  相似文献   

5.
基于Web挖掘的个性化服务   总被引:3,自引:0,他引:3  
协同过滤和基于内容的过滤等传统个性化服务技术存在不能处理大规模数据、需要用户输入主观的评价信息、只能利用静态的统计特征等缺陷.最近提出基于Web使用挖掘和Web内容挖掘的个性化服务体系结构,在此基础上进一步引入了Web结构挖掘,统称为基于Web挖掘的个性化服务体系结构;给出了通过聚类算法获取总体使用特征、内容特征和结构特征及其一致化表示的方法;提供了通过总体使用特征、内容特征和结构特征实现个性化服务的途径.  相似文献   

6.
中文命名实体识别(named entity recognition, NER)字符级别模型会忽略句子中词语的信息,为此提出了一种基于知识图谱中实体类别信息增强的中文NER方法。首先,使用分词工具对训练集进行分词,选出所有可能的词语构建词表;其次,利用通用知识图谱检索词表中实体的类别信息,并以简单有效的方式构建与字符相关的词集,根据词集中实体对应的类别信息生成实体类别信息集合;最后,采用词嵌入的方法将类别信息的集合转换成嵌入与字符嵌入拼接,以此丰富嵌入层生成的特征。所提出的方法可以作为嵌入层扩充特征多样性的模块使用,也可与多种编码器-解码器的模型结合使用。在微软亚洲研究院提出的中文NER数据集上的实验展现了该模型的优越性,相较于双向长短期记忆网络与双向长短期记忆网络+条件随机场模型,在评价指标F1上分别提升了11.00%与3.09%,从而验证了知识图谱中实体的类别信息对中文NER增强的有效性。  相似文献   

7.
一、Web应用程序开发阶段 1.利用Servlet阶段,使用request和response对象接收和反馈客户端的请求.它是开发Web应用程序的基石,在Web应用程序中,Servlet是一个基本的Web组件,开发Web应用的许多技术,如JSP及一些Web层的框架都是建立在其基础之上.Servlet的缺点是在Java代码中兼有业务和逻辑,不利于程序设计和界面开发.  相似文献   

8.
链接分析技术是优化信息搜索速度与利用价值的网络结构优化发展途径,在以往更加倾向于关键内容的数据信息特征归类,而对于Web信息内容的特征属性要求较低,因此会产生搜索主题不鲜明、搜索内容针对性差等问题。基于此,本文针对链接分析技术提出了聚类算法的应用模式,以便为Web信息内容的归类推荐提供理论参考。  相似文献   

9.
Web2.0与Ajax技术解析   总被引:1,自引:0,他引:1  
近来很多成功的Web应用都有一个共同特点,就是依赖于大量用户来丰富其内容,这种特点被称为Web2.0.伴随着Web2.0的出现,一种新型的Web应用程序也很快地流行起来,这就是Ajax应用程序,这种应用程序通过对服务器的异步请求调用,极大地改善了Web的响应速度和用户的交互体验.  相似文献   

10.
张丽  王莉莉 《松辽学刊》2009,30(3):107-109
在空间数据互操作领域,基于OGC规范的公共接口访问模式的互操作方法是一种基本的操作方法,实现空间数据互操作是当前的一个很有潜力的研究方向,主要涉及Web Service的一些相关技术.本研究是基于OGC规范的全国产空间信息服务系统,实现了市区两级空间信息共享,建立了统一、完备的政务地理空间信息资源数据平台和海量、动态的政务地理空间信息资源数据库,实现与市级政务地理空间信息资源共享服务体系基于网络的异质异构地理空间数据对接与共享,达到空间数据与市级的同步更新.  相似文献   

11.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率.  相似文献   

12.
传统文化算法的知识对于进化过程的影响是统一进行的,而知识的趋同性导致算法易早熟收敛于局部最优解. 为此,提出一种新的由当前种群最优个体及其所在区域,以及当前个体共同确定的对偶知识. 当对偶知识指导个体进化时,不同个体的进化方向由相对应的对偶知识所确定. 对复杂函数进行了测试,所得数据表明该算法有良好的全局收敛能力及解决高维优化问题的能力.  相似文献   

13.
作为广播戏曲栏目的主持人,不仅要掌握播音主持的基础知识、戏曲基础知识,还要有现场组织能力、统筹能力等,充分调动各个方面的积极性,使节目更具有群众性、互动性和欣赏性.  相似文献   

14.
探讨了本体技术和Web服务技术对试题库系统的支持,并提出了基于本体和Web服务的试题库应用框架结构,目的是为了让试题知识库能提供概念共享模型,建立概念语义空间,并用本体标准语言OWL进行形式化描述,从而解决知识共享和语义互操作问题,同时也为解决机器理解问题提供了一种办法.  相似文献   

15.
付炜 《应用科学学报》2004,22(3):291-297
介绍了地理专家系统的知识化数据模式的设计原理与实现方法,采用知识表示的框架网络结构描述地理环境的实体单元,将各级专家知识的表示以指针链接,形成了由知识到语义的框架网络.采用了基于知识的扩展R-F关系数据模式进行专家知识的表示,并讨论了系统知识库的组织结构和推理机的设计原理.该数据结构可以实现地理实体及其相互关系的完整性描述,并使系统知识库的操作简便易行,保证了推理机的实现.并以乌鲁木齐河流域为试验区,阐述了流域土地合理利用规划决策专家知识的表示方法,以及专家知识表示的基本规则和系统专家知识的组织方式.此外,还讨论了系统推理机推理规则的设计原理与组织方法及推理算法.  相似文献   

16.
以美国物理学会旗下期刊2000—2019年发表的论文和Web of Science论文摘要为基础,用模因短语刻画知识,构建模因关系网络并引入跨学科测度Rao-Stirling指数以计算模因的跨领域分数,从而追踪物理学中的跨领域模因。分别从网络拓扑结构指标、跨领域测度指标和专业术语对比3个方面进行验证,证明了所提的模因关系网络和模因的跨领域分数可以有效反映知识在不同领域间的扩散现象。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号