首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于分块的网页主题信息自动提取算法   总被引:3,自引:0,他引:3  
对互联网上大量存在的基于模板的网页,根据其半结构化的特点,提出了一种网页分块和主题信息自动提取算法.该算法利用网页标记对网页进行分块,改进了传统的文本特征选择方法,把网页块表示成特征向量,并根据有序标记集识别主题内容块.用该算法改进了网页分类的预处理过程,提高了分类的速度和准确性.实验表明,对网页进行主题信息提取后再进行分类,可以提高分类系统的查全率和查准率.  相似文献   

2.
一种个性化的主题提取和层次发现算法   总被引:3,自引:0,他引:3  
从语义相关性角度分析超链归纳主题搜索(HITS) 算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此提出了一种个性化的主题提取和层次发现算法(PTDHE),通过个人查询日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的.PTDHE采用基于最小最大原则的图划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面.在14个查询上的实验结果表明,与HITS算法相比,PTDHE算法不仅可以减少2%~66%的主题漂移率,而且可以发现与查询相关的多个主题.  相似文献   

3.
4.
张佳  梁少华 《科技信息》2007,(2):20-20,53
Web结构挖掘是对Web页面之间的结构进行挖掘。挖掘对象主要是页面的超链接结构,这种结构为人们增强对网页的分析处理提供了极大的帮助。本文对基于超链接的Web结构挖掘进行了概述,并对其主要算法PageRank进行了研究。  相似文献   

5.
基于统计学和语义信息的中文文本主题识别技术   总被引:3,自引:0,他引:3  
由于中文分词处理的复杂性在一定程度上限制了中文信息抽取技术的发展,因此,快速有效地抽取中文文本主题的需求越来越突出.该文主要通过中文分词技术、频繁词查找和词性组合计算来分析词与词之间的关联并最终提取出能够表达文章内容的主题词汇,同时还对这些词汇作了记分和排序.读者能够通过这些词汇来判定文章的主题和重要内容.通过对人民日报语料进行实验表明,该方法正确率能够保持在66%以上,同时对于网页邮件等真实文档也有较好的测试结果.  相似文献   

6.
基于主题分析的网络信息资源聚焦服务方法   总被引:1,自引:0,他引:1  
聚焦服务是解决网络中海量信息资源的个性化精确服务的主要途径之一.给出了一种基于主题分析的信息聚焦服务方法,将用户兴趣度与文档分类技术结合起来,提出了改进的TF-IDF-IM算法,并构建了主题树与主题关系图,为实现精确的信息聚焦服务提供了有效的途径.  相似文献   

7.
介绍了Web挖掘的有关理论.着重分析了结构挖掘中基于页面链接结构的PageRank算法和对其有改进意义的HITS算法,进而介绍了内容挖掘常用的一些算法以及使用记录挖掘应考虑的问题.  相似文献   

8.
本文首先介绍了文本分类算法,并针对基本粒子群算法在收敛性能上的缺陷, 提出了具有量子行为的粒子群优化算法, 把它应用于文本主题挖掘和文本分类. 实验结果显示,这种文本分类方法和基本粒子群算法比较, 提高了文本分类的准确率、召回率, 具有很好的性能.  相似文献   

9.
中文新闻事件检测的主要任务是从大量新闻中自动检测出潜在的新事件。人工构建事件特征词进行检测费时费力。单纯依靠密度聚类或谱聚类方法进行事件检测,存在不同事件的触发词相关性高时,容易误判为同一事件。为此,提出基于卷积神经网络和K-means结合的中文新闻事件检测与主题提取,将新闻中的文本向量化,通过深度学习抽取文本深层特征。实验结果表明:所提方法构建的模型准确率、召回率优于单一聚类方法,可对中文新闻事件准确识别,快速检测新事件,提取新事件主题。  相似文献   

10.
基于主题划分的有组织P2P搜索算法   总被引:9,自引:0,他引:9  
提出一种基于主题划分的P2P搜索算法———主题覆盖网络搜索算法(TONS).TONS在有组织P2P网络基础上,将结点按主题组织成覆盖网络,使含有相似主题的结点链接在一起,因此可以根据内容将查询限定在P2P网络的局部范围内.通过在覆盖网络中随机添加一些长距离链接,使覆盖网络具有Small-World特性.TONS为有组织的P2P系统提供了一种能依据部分匹配、多关键词等复杂条件搜索结点数据对象的有效方法,与现有的有组织P2P系统相比,它可以将搜索的查全率提高74.7%,并减少P2P网络信息搜索的平均路径距离和平均消息数目.  相似文献   

11.
针对虚拟网络(virtual network,VN)请求的动态性和时变性,并充分考虑网络动态性导致物理资源出现碎片化或负载不均的情况,提出了基于频谱资源共享的动态分配算法(dynamic allocation algorithm based on spectrum resource sharing,DAA-SRS),该算法结合虚拟请求的生命周期,进行子信道分配和重分配,使不同虚拟网络以一种机会共享的方式占用相同的物理资源.针对无线虚拟网络资源请求接受率、物理网络收益等性能指标进行仿真分析,仿真结果显示,该算法可显著提高虚拟网络请求的接受率.  相似文献   

12.
在网络虚拟化过程中,当前大多数物理资源分配算法,主要考虑了资源利用率和网络收益,而忽略了虚拟网络请求的服务质量,从而在不同用户之间造成不公平。针对该问题,提出基于服务质量的动态资源分配算法。该算法在空闲时频资源非连续情况下,只有当虚拟网络请求的生命周期足够长,满足重分配影响因子情况下,才优先为资源量小的虚拟网络请求重分配物理资源;在空闲时频资源连续情况下,综合考虑优先级、时间容忍和网络收益因素影响,为虚拟网络请求分配相适应的物理资源。仿真结果表明,该算法相对于传统基于生命周期的动态资源分配算法和贪婪动态分配,在实现物理资源高效利用的前提下,不但保障了虚拟网络请求的服务质量,而且降低了该算法的运行时间。  相似文献   

13.
在P2P网格环境下,针对分层次网格资源发现机制过分依赖资源路由节点的弱点,提出了一种基于最小代价函数的网格资源发现算法.算法引入最小代价函数作为资源路由节点的选择标准,采用欧式坐标空间映射方法将网格资源和资源请求映射到了同一个欧式空间中进行资源发现.实验表明,算法代价低、响应快,能获得更好的查找成功率.基于最小代价函数的网格资源发现算法支持多种查询,具有良好的用户满意度和资源搜索性能.  相似文献   

14.
针对企业的员工雇佣计划的优化问题,根据实际中遴选雇佣员工存在一定程度的随机性特点,以按期完成项目、消耗成本最低为目标,采取优胜劣汰策略,利用随机规划方法构建雇佣计划的优化模型;将遗传算法与多阶段决策相结合设计了模型的求解算法;最后通过算例对模型及算法的有效性进行了验证.计算结果表明:提出的方法能够通过合理控制不同时段聘用,及解聘的数量逐步提高雇佣员工的平均工作能力,员工平均工作能力提高幅度达到41%,从而实现了针对项目的人力资源优化.  相似文献   

15.
利用流程模拟软件Aspen Plus建立常减压装置稳态模型,以经济效益和CO_2排放量为目标,提出基于遗传算法NSGA-Ⅱ的优化方法,利用该方法求解常减压装置多目标优化问题,从而得到一组最优混炼比和操作条件的Pareto解集。结果表明,在保证产品规格的前提下,经济效益和CO_2排放量呈正比;增大轻油比例可以提高经济效益,但也必然会导致CO_2排放量的增大。  相似文献   

16.
为了提高在线学习平台教学资源推荐的有效性,通过数据挖掘方法对OBE教学资源进行特征提取,分别生成教学资源和用户个性推荐库,采用核典型相关分析算法对教学资源特征和用户个性特征进行分析,选择相关系数高的教学资源推荐给用户.实例仿真证明,相比于常用的教学资源推荐算法,本文算法的准确度更高,推荐资源更精准.  相似文献   

17.
针对当前网格资源管理中作业与资源匹配的缺陷,基于信任效益函数和作业响应比,提出了同时兼顾性能QoS和信任QoS的资源调度算法.不仅考虑到作业资源对的信任考虑,还考虑到每个作业的性能QoS,解决了长时间等待作业不断被推迟运行的问题.实验表明,该算法较传统的Min-Min算法在总信任效益函数、总执行时间和作业提交失败率方面有较好的综合性能.  相似文献   

18.
Fabric作为超级账本的核心项目,以其多通道的设计为用户提供更为隐私的交易空间,为了解决基于分布式架构下的多通道资源负载均衡问题,提出了基于NJ W谱聚类的区块链即服务(BaaS)负载均衡调度算法SC-channel.该算法将平台子节点的数量作为划分类簇数量的依据,首先,基于通道采用peer之间的Jaccard系数构造相似矩阵;其次,计算拉普拉斯矩阵,求取前k个特征值和特征向量并将特征向量单位化;最后,用基于数量加权的k-means算法完成聚类.在Kubernetes平台上对这种方法进行验证,并与采用经典k-meansi的NJW算法默认调度算法下的资源负载均衡度做了比较分析.结果表明,采用基于谱聚类的BaaS资源负载均衡调度算法可提高资源利用的均衡程度,增强了平台的可用性与可靠性.  相似文献   

19.
基于BP网络算法的矿产资源评价方法   总被引:1,自引:0,他引:1  
介绍了将BP网络算法应用于矿产资源评价的基本原理和算法步骤,通过对研究区单元的划分和选择,并根据对已知成矿模式的类比研究,确定影响成矿的特征变量因子,利用BP网络算法对训练样本进行学习达到变量间的非线性映射,确定评价模型,进而对评价样本进行评价,得出预测单元的评价效果。  相似文献   

20.
针对虚拟仿真运行环境的动态构建问题,通过分析一些改进的资源分配算法解决了传统算法在仿真云环境下资源利用率低和不支持动态构建的问题.首先,通过在蚂蚁算法的初始值设置中增加指引因子并改进信息素的更新策略来提高云环境中资源分配的效率;其次,分析了被改进的蚂蚁算法在动态构建虚拟仿真环境中的可行性,并对此构建了虚拟仿真环境的过程模型;最后,通过仿真对比实验发现,改进的算法能够有效提高蚂蚁算法的计算速度和收敛速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号