首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对现有火焰前景提取算法提取前景不完整、轮廓失真严重、对复杂环境适应性差等问题,提出一种采用机器学习的火焰前景提取算法。该算法结合使用监督学习方法和无监督学习方法,训练了两级专用的分类器用于确定疑似目标区域;根据Real AdaBoost分类器的输出结果计算聚类算法的初始中心,并使用计算出的聚类中心对目标区域进行聚类分割,以得到最终的前景区域。实验结果表明:该算法对强光环境、夜间环境、静态或动态干扰环境等复杂场景均具有较好的适应性,得到的前景提取误差率在2%~28%之间,低于现有其他算法,且帧运算耗时小于50ms,能够很好地完成多种场景下的火焰前景提取工作,为图像型火灾检测系统中后续的特征提取与识别奠定了基础。  相似文献   

2.
3.
广义Web内容挖掘模型算法   总被引:2,自引:0,他引:2  
在信息时代的今天,网络以几何速度飞速发展,成为现代人获取信息的主要来源之一.也正因为网络信息增长太快,人们反而面临“信息爆炸”与“知识贫瘠”共存的局面.数据挖掘(DM)是通过数据获取知识的最佳工具,由此,产生了Web数据挖掘,即KDW的概念.本文重点论述广义Web内容挖掘的特点与发展、狭义的内容挖掘中页面内和页面间挖掘的区分及应用的主要算法、结构挖掘中的两大算法及其优劣.  相似文献   

4.
文本挖掘技术研究   总被引:28,自引:0,他引:28  
文本挖掘是数据挖掘的重要内容之一,其应用十分广泛.对文本挖掘技术的基本概念和理论进行系统地归纳总结,首先给出了数据挖掘、文本挖掘和Web文本挖掘的基本概念及主要研究方向,然后分析了文本挖掘的过程和关键技术,最后对文本挖掘技术进行总结和展望.  相似文献   

5.
为了对复杂文本挖掘进行聚类分析,提出了一种基于动态ISODATA的聚类算法,详细介绍了此算法的基本思想和具体的算法步骤,并最终给出了试验结果。  相似文献   

6.
文本挖掘中的姓名特征具有很强的文本表达能力,本文设计的姓名特征提取算法是利用词与词的上下文关系及中文姓名本身的统计信息对文本中的姓名特征进行提取,通过对样本的测试,表明该项技术能比较准确地提取文本中的姓名特征,基本达到了预期的目标.  相似文献   

7.
社会网络分析中的机器学习技术综述   总被引:1,自引:0,他引:1  
机器学习是智能数据分析的有力工具,可以对社会网络数据进行建模。文中讨论了机器学习技术在社会网络分析(Social Network Analysis,简称SNA)领域中的应用,尤其综述了对象分类、链接预测、群体检测等SNA子任务中的机器学习技术。此外,还分析了在SNA中使用机器学习技术所面临的若干问题和挑战,最后给出了SNA中机器学习技术的研究前景。  相似文献   

8.
为提高短文本语义相似性度量准确性,设计一种基于混合机器学习模型的短文本语义相似性度量算法.先对短文本实施预处理,基于混合机器学习模型构建短文本的字词向量模型,对短文本进行特征扩展;然后组合短文本的多样度量特征,对多样度量特征进行维度规约;最后通过构建一个集成学习模型,计算语义相似性结果,实现语义相似性的度量.使用“Quora Question Pairs”比赛数据集测试该方法的性能,测试结果表明,该方法的准确性较高,对数损失和度量均方差均较低,说明该方法的相似性度量准确性较高.  相似文献   

9.
提出一种增量式混合型分类挖掘算法,将基于概率论的符号学习与神经网络学习相结合,能够对既包含离散属性又包含连续属性的多个概念进行有效的分类处理,且具有较强的增量挖掘能力。该算法在法院决策支持系统中得到了运用,取得了较好的效果。  相似文献   

10.
针对网络文本信息的安全性判别问题,采取改进的邻近分类算法挖掘文本.该改进邻近分类方法在传统方法定义分类特征的同时,起用共线性判别矩阵,对具有共线属性的特征合并处理.这种改进策略,不仅可以增加分类特征的准确性,也可以加快文本信息的分类进程.对Spambase语料库开展实验研究,从精度、召回率、联判度、误差4个维度对分类效果进行评价.结果显示:改进的邻近分类方法具有明显的优势,可以更加准确地区分安全文本和危险文本.  相似文献   

11.
文本挖掘技术的研究   总被引:3,自引:0,他引:3  
本文对文本挖掘的过程极其关键技术进行了系统的分析,并探讨了其应用趋势。  相似文献   

12.
文本挖掘中的特征表示及聚类方法   总被引:1,自引:0,他引:1  
文本挖掘中特征表示函数的选择影响到特征词表达文本的能力 ,文中设计的评判函数可以比较准确地表达特征词的重要程度。采用K邻近算法对文本集进行聚类 ,产生了较好的聚类效果  相似文献   

13.
14.
一种网络日志挖掘的高效算法   总被引:1,自引:1,他引:0  
提出了一种网络日志挖掘算法PWU,其采用了异构树结构。通过对异构树叶子节点进行编号,使得对候选集计数时只需对具有相同编号的叶子节点进行计数,极大地简化了候选集计数过程。在此基础上,算法还具有增量挖掘功能。最后,从理论分析和实验两方面证明了算法的高效性以及增量挖掘功能的高效性和完备性。  相似文献   

15.
针对机器学习聚类模型在特征选择时存在的问题,首先,对特征选择在聚类模型中的适用性进行分析并对其进行调整和改进.然后,基于R语言中的递归特征消除(RFE)特征选择方法和Boruta特征选择方法进行特征选择算法设计.最后,应用聚类内部有效性指标,对在线品牌忠诚度聚类模型优化结果进行分析,进而对特征选择方法进行比较研究.结果表明:Boruta特征选择方法更具优势.  相似文献   

16.
李翠霞  林楠 《科技信息》2007,(10):37-37,98
本文介绍了文本挖掘的过程和分类。通过对其挖掘过程的详细研究,分析了文本挖掘进一步发展所面临的困难和挑战。  相似文献   

17.
关联规则算法在中文文本挖掘中的应用研究   总被引:4,自引:0,他引:4  
本文介绍了关联规则的主要概念及关联规则的经典算法,并将关联规则算法应用于中文文本挖掘中,目的是通过计算文本特征词间的支持度、可信度关系了解文本间的关联关系.  相似文献   

18.
Boosting算法在文本自动分类中的应用   总被引:7,自引:0,他引:7       下载免费PDF全文
随着网络信息的迅猛发展,如何快捷、准确地识别和获取有用信息显得更为重要。文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。Boosting算法是一种新兴的机器学习算法。在文本分类中应用Boosting算法经过试验证明是有效的,并且优于目前的大多数分类算法。  相似文献   

19.
将Web使用挖掘应用到网络教育领域,分析了其挖掘过程,包括数据采集、数据预处理、模式发现和模式分析;通过建立网络教育资源导航模型,并利用蚁群算法对Web日志数据中使用者的浏览行为进行挖掘;提出一个新的导航路径挖掘算法,可以发现有价值的用户浏览模式,指导用户对教育资源作进一步的搜索,还可以将训练好的网络图用于用户的个性化定制服务。  相似文献   

20.
LTE用户向网络反馈的MR测量报告,可以为无线网络分析与优化提供海量的基础测试数据.设计高精度的MR定位信息重构算法,对发展数据驱动的网络优化技术至关重要.本文首先对几种传统的基于终端测量信息的定位算法及其优缺点进行分类介绍,进而提出一种基于机器学习方法设计高精度混合定位算法的思想.基于该思想,采用了AdaBoost算法对同区域具备定位信息标签的MR数据进行模型训练,得到的模型可对定位信息缺失的MR数据进行较高精度的定位信息重构.以中国联通某业务区本地网LTE-MR数据为例,对所提算法性能进行了仿真及误差分析,讨论了算法的优缺点,测试了算法运行的速度,并通过具体案例展示了算法应用于中国联通RNExp无线网络专家系统进行网络覆盖评估的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号