首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
为了阻止网上非法信息现象发生,提出了一种同一认定Web信息作者的方法,通过分析中文Web信息作者的写作风格,提取能表达Web信息作者写作特点的三种特征,包括词汇特征、结构特征和格式特征,利用支持向2机分类学习算法,同一认定Web信息的作者,为计算机取证提供证据.在Blog、电子邮件数据集上实验的分类识别正确率超过8000,表明所提出的方法是有效的,用于计算机取证是切实可行的.  相似文献   

2.
研究了Web服务合成问题,解决该问题的关键是对候选Web服务的输入输出数据关系进行建模,以及有效地利用这些已有的数据依赖关系实现服务合成请求.通过从Web服务规范语言中提取Web服务的语义信息,构建Web服务的依赖图;提出了一种基于搜索算法的Web服务合成算法,获取满足特定服务请求的Web服务合成.  相似文献   

3.
自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.  相似文献   

4.
自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.  相似文献   

5.
为解决船舶综合监控系统中海量无序数据信息的有效利用问题,以中央冷却系统为研究对象,提出D-S证据理论结合粗糙集的信息融合方法对系统运行中的故障隐患状态进行识别.分别定义了等价属性和证据决策系数的概念,给出快速约简方法及基于证据信任度的证据合成方法,明确了证据基本可信度分配的求解过程.基于实际船舶典型状态数据的测试评估结果表明,所得结论与基于先验知识的判断基本一致,验证了所提方法对系统隐患故障状态评估的有效性.  相似文献   

6.
互联网上信息是海量的,并且还在快速的发展.面向主题的Web信息检索已成为当前研究的热点之一.将语义网技术同传统的信息检索技术相结合,给出一个利用本体判断主题相关度的判断算法,通过实验验证了算法的有效性.  相似文献   

7.
为了让用户从海量知识信息中精确、快速地获取到感兴趣的信息内容,综合考虑文档的头部信息(标题、摘要、关键词)和重点主体内容,采用基于主题词迭代提取的信息检索算法,使得主题词的提取在兼顾效率的同时准确率达到83%以上,主题信息检索的性能也随之增加.实验结果表明,在文档查询词频和倒排文档频率(TF-IDF)的基础上对候选主题词相关度权值的计算进行合理化调整,并利用所提出的主题词迭代提取算法,主题信息检索的有效性将显著增加.  相似文献   

8.
针对现有行为建模方法难以描述行为语义的问题,提出了一种分层次的用户行为元模型以及一种基于页面元数据的Web用户行为建模方法.该方法从URL的访问、活动、事务3个层次建立Web用户的行为模型,并对页面元数据获取以及在URL的访问、行为、事务之间转化等问题进行了说明.方法及模型不仅描述了用户访问序列信息,还增加了访问内容的局部主题和关键词等信息,为进一步获取Web用户的行为语义特征奠定了很好的基础.通过西安交通大学的Web教学系统验证表明,利用所提方法获得的序列划分准确率达86%以上.  相似文献   

9.
提出一种基于开放网络环境和用户协同过滤的可信Web服务推荐方法TWSRCF(trustworthywebservicerecommendationbasedoncollaborativefiltering).首先根据用户的查询请求得到一组功能相同或相似的候选Web服务集合,然后基于用户的历史共同评价得到目标用户的偏好相似用户集合,并求得候选Web服务集合中每个服务的可推荐用户集合,并根据可推荐用户的相似度、评价值和可信度计算各候选服务的推荐度,按照推荐度对各候选服务进行排序并向目标用户推荐.实验结果表明,随着用户评价数量的增加,该方法所获得的服务推荐效果也逐渐明显.  相似文献   

10.
提出了一种验证图像中候选目标的新方案.综合目标的先验知识,将目标验证转化为给定候选目标的条件下,图像特征观察集合的条件概率问题.同时,提取图像的短线段特征,利用短线段特征的观察,给出了一种目标验证方法排除复杂场景图像中虚假建筑物目标.在自然图像集上进行的实验表明,所提出的方法能有效排除虚假目标,满足处理自然图像的要求.  相似文献   

11.
互联网学术信息可信性评价判据研究   总被引:1,自引:0,他引:1  
利用观察、有声思考、搜索日志和内容分析法,探讨了用户在实际的互联网学术信息查寻中评价信息可信性的判据。研究发现,信息内容和来源等外部特征两个方面的判据是用户评价互联网学术信息可信性的常用判据。用户主要使用哪个方面的判据受评价动机的影响,高动机和低动机情景下的评价判据存在差异。实践层面上,研究结论对提高学术信息服务质量具有现实意义;理论层面上,为下一步实际的信息查寻环境下互联网学术信息可信性的影响因素研究提供指导。  相似文献   

12.
D-S证据理论可应用于多源数据融合领域,但在处理高度冲突的证据时,可能会出现反直觉的结果.为解决这一问题,本文提出了差异信息量的概念及融合方法.首先,通过信息熵表明证据的相对重要性,采用散度获取证据可信度.然后利用证据可信度优化证据差异度以得到差异信息量,经过计算获取数据的最终权重,并将其作为D-S证据理论中的基本概率分配进行决策.在处理冲突证据、一致证据及不同数量证据等方面的数据融合问题时与其他方法对比,所提方法收敛更快,准确度更高.故障诊断的应用实例表明,所提方法的不确定性更小,优于现存的其他方法.  相似文献   

13.
针对方案属性值为Vague值且考虑专家评分可信度的多属性群决策问题,提出了一种基于Vague集模糊熵和D-S证据理论的多属性群决策分析方法。该方法充分考虑各专家给出的Vague值评价信息中所蕴含的模糊性与不确定性,借助模糊熵来获取与专家自身意见相匹配的评分可信度序列,其完全由数据驱动,弥补了传统方法对可信度主观统一设定的不足。首先,基于各专家原始决策矩阵获得各属性下的Vague集模糊熵,以构建与专家集相对应的评分可信度矩阵;其次,对经可信度调整后的各专家决策矩阵使用证据合成进行信息集结,利用Vague集记分函数并经可信度调整得到属性权重;最后,将专家群体集结信息经属性权重加权修正后算出各方案最终的Vague评价值,进而使用记分函数获得各方案综合得分,筛选出最优方案。利用证据理论在不确定信息融合方面的优势和Vague集记分函数的信息转化功能,通过证据合成和记分函数集结专家群体的评价信息,所得出的决策结果更加客观、合理,并通过一个具体算例验证了所提方法的可行性和有效性。  相似文献   

14.
网页正文信息抽取新方法   总被引:6,自引:0,他引:6  
基于包装器的信息抽取方法只能处理一种特定的信息源,而且对网页结构的依赖性强.基于此提出了一种将中文标点符号和HTML树结构作为识别网页正文内容重要特征的网页分析方法,通过统计中文标点符号确定部分正文信息,然后根据正文信息在结构上的相似性确定其他正文信息内容.实验结果表明该方法能有效地剔除网页噪音并提取网页正文,具有较好的通用性和较高的准确性.  相似文献   

15.
为了实现网络信息审计系统中的实时网页分类,提出了一种基于Dempster-Shafer证据理论的分类新方法.其基本思路是:不进行IP分片包重组,直接将网页地址特征和分片数据包作为分类的证据,计算各个证据对类的支持度,然后利用Dempster证据组合规则将各种证据提供的信息进行不断地在线融合判决,并最终给出网页的分类结果.当已有证据可以对网页进行有效分类时,对后续数据包不再做进一步处理.实验结果表明,所提方法的查准率大于83%,查全率大于90%,在分类性能和运行时间上均优于已有的基于分片的模糊K最近邻分类算法.  相似文献   

16.
结合故障诊断工作的实际场景,通过计算故障信息观测值与参考值之间的差异,生成对应的故障信度分配函数。然后基于证据分类的思想,将故障证据分为可信证据和冲突证据,并定义每个证据的可信度。最后,利用证据可信度修正最初的信度分配,再利用证据融合公式得到综合的故障诊断结果。电机转子故障诊断的实例表明本文提出的方法能够准确快速地识别产品故障,基于证据分类的修正方法能够加速故障信度分配的收敛。  相似文献   

17.
针对D-S证据理论处理高冲突证据时会出现于直觉相悖结论的问题,提出了一种基于证据权重组合的方法。首先通过引入Jousselme距离函数来确定证据权重。然后冲突证据由平均证据代替;且其权重也赋给平均证据。最后对修正后的证据加权平均后再用Dempster组合规则实现数据融合。与其他改进方法通过实例比较,表明该方法在有冲突证据时更能有效快速地识别出目标。  相似文献   

18.
数字化校园发展迅速,同时带来了海量的网络信息.本文针对校园网信息传播及其监控的有效性问题,设计并实现了基于Web日志分析的校园网受众分析系统,通过挖掘Web日志中的相关数据并进行统计、分析、综合,得到了特定信息在特定时期内的传播范围及其用户分布情况,同时基于访问量特征提出了校园网信息的3种基本类型.本文还结合实际校园网的运行数据进行了实验和相应的分析,显示出所建立模型的合理性和有效性.  相似文献   

19.
如何有效地构建面向领域的垂直搜索引擎,是信息检索领域众多研究者关注的问题.本文提出了一种通用的基于专业词汇表构建垂直搜索引擎的方法,通过分析网页特征,提出了基于链接结构和文本内容的启发式网页爬取策略.该策略结合网页的结构信息特征,在网页和主题相关度计算中考虑了特征词汇在网页中的权重,有效地提高了专业搜索引擎的查询效率.通过具体实现一个面向医疗领域的垂直搜索引擎,验证了本文所提出的方法的有效性.  相似文献   

20.
针对目前Web信息庞杂无序和半结构化特征所带来的信息检索质量低下的问题,在基于查询意图分类研究的基础上,提出了一种结合定题检索的启发式Web信息检索方法;在该方法中,Web信息检索采用一次预处理两次检索机制,根据该机制设计了Web信息检索模型,详细讨论了该模型的设计思想、关键技术和算法描述;通过仿真实验对该方法进行了测试和分析,测试结果表明该方法能够有效提高信息检索性能,在一定程度上满足用户个性化的查询需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号