首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
为解决油层识别中存在的获得有标记数据的代价过高,有标记数据稀少的问题,提出一种新的基于分支定界的半监督支持向量机(branch and bound for semi-supervised support vector machine,BBS3VM)的油层识别方法。此方法主要将半监督学习(semi-supervised learning, SSL)和分支定界的思想引入到支持向量机(support vector machine, SVM)分类算法中。通过半监督学习的思想,使用大量未标记的样本来改善学习性能,利用分支定界算法提高半监督支持向量机(semi-supervised support vector machine,S3VM)算法的分类精度,将此改进算法应用于测井数据挖掘中的油层识别。经过对某油田的实际测井资料进行处理,实验结果表明,半监督油层识别方法要优于传统的S3VM分类算法,识别率更高,分类效果更显著,与全监督的SVM算法相比较,得到相差不大的分类精度的同时,速度更快。  相似文献   

2.
在分析网络舆情基本内涵的基础上,采用生命周期方法探索了网络舆情的演变机制,并对网络舆情发展过程中所表现出的特征和规律进行了归纳和总结.在此基础上,以BBS为标的对网络舆情的分析技术进行了探究,建立了以BBS为基础的网络舆情技术分析模型,通过BBS舆情热点事件实验,验证了网络舆情的演变机制,揭示了网络舆情的内在衍生规律.  相似文献   

3.
微博、微信等自媒体服务兴盛,危险预测成为微信息舆情管理的难题之一.基于SDN和MapReduce概念架构,结合虚拟蜜网技术,设计舆情倾向性检测模型;针对前端蜜罐机,设制舆情监测任务指令集,布局检测策略,完成分布式流量检测任务;通过虚拟嫌疑主题,针对大数据稀疏性困难,设计用户敏感行为特征集,实现微信息圈危害兴趣倾向的先验算法;最后对算法模型进行实践检验.实验表明,基于流量级和进程级关联的倾向性主题检测,检验效率较高,针对性强,能获得较好的监测效果,能为微信息舆情的主动性防范和舆情调节控制,提供重要的支持,所以,我们提出微信息进程与流量检测指令分布的倾向甘检测模型,以满足细粒度舆情监测与防御的需要.  相似文献   

4.
基于自组织映射网络的流量分类算法   总被引:2,自引:0,他引:2  
网络流量分类在QoS、流量控制及网络安全等领域发挥了重要作用. 有监督型的机器学习方法对新流量的识别往往依赖于先前的人工分析;自组织映射网络算法模拟生物神经元,通过自组织行为对数据进行分类学习;实验表明,该无监督型算法能够对新流量进行自动识别,提高了流量识别的准确率.  相似文献   

5.
为提高高校网络舆情的可识别性和预警实时性,提高网络舆情热点分析的准确性,论文设计了一个高校网络舆情热点发现模型.包括网络舆情信息采集、预处理、中文分词、特征选择、文本分词和聚类分析.考虑到网络舆情的不确定性和模糊性,提出了一种基于信息熵和密度改进的K-Means聚类算法的网络舆情相似度分析方法,此方法可以对网络热点和危机事件进行聚类和识别.实验结果表明,该方法能够快速获得网络舆情,具有较高的聚类准确率,证明了论文提出的模型的可行性与有效性,可为高校网络舆情监测和识别提供重要的技术支持.  相似文献   

6.
基于模糊聚类的网络论坛热点话题挖掘   总被引:3,自引:0,他引:3  
为解决单个帖子线索的多话题性问题,识别聚类中的孤立点,提出一种基于模糊聚类的网络论坛(BBS)热点话题挖掘算法.采用模糊聚类进行话题识别,使得一个帖子线索可以隶属于多个话题,而对于隶属度远小于类内平均隶属度的帖子线索,则当作孤立点来处理.此外,还给出了一种面向BBS文本的特征表示方法,并结合隶属度给出基于模糊划分的话题热度评分公式.实验结果验证了该算法的有效性.  相似文献   

7.
针对库区巡检图像采集设备对图像目标智能识别需求,进行基于视觉的远距离可疑目标识别算法设计与实现. 采用目标检测算法对图像进行目标识别并采集,通过基于卷积神经网络的深度学习模型卷积层对目标图像提取特征,采用基于机器学习传统方法的浅层网络对特征进行可疑目标分类. 根据算法设计实验,实验结果表明本算法模型识别效果良好,可有效减少人工识别工作量,能满足实际应用需要要求.   相似文献   

8.
为获得具有强推广能力、高效的识别算法 ,提出了基于模糊超椭球聚类的模糊超椭球分类算法 ,并且用于无约束手写体数字的识别。模糊超椭球聚类能充分利用训练样本集的分布信息 ,运用较少的类别个数来表征复杂的样本分布 ,获得良好的识别效果和推广能力。在此基础上 ,模糊超椭球分类算法加入了有监督的控制 ,使算法在聚类过程中可以确定合适的类别数 ,使学习结果能更好地反映训练集的概率分布。然后 ,采用学习矢量量化等算法对其进行进一步有监督训练 ,从而取得更好的训练效果。在国际通用的 NIST字库和实际采集的手写体数字集进行的实验中 ,模糊超椭球分裂算法获得了令人满意的结果 ,而且具有进一步发展的潜力。  相似文献   

9.
针对油井功图识别中存在的一些问题,提出了一种基于深度信念网的油井功图识别方法。首先通过实验对比的结果确定网络结构,然后使用无监督学习的手段初始化网络权值,最后用有监督的误差反向传播算法微调整个网络,从而实现功图图像到油井工况之间的映射关系。实验结果表明:深度信念网能够自动学习功图特征,提高识别效率;与传统分类模型相比,使用深度信念网进行油井功图识别的过程更简便,更能够达到理想的效果。  相似文献   

10.
基于传统关联规则分析技术的舆情分析系统难以反映网络数据模式的行为特征,利用动态的数据流关联规则技术构建舆情分析系统更有意义。文章提出了一种基于数据流频繁模式的舆情分析入侵检测系统模型(BBS public opinion analysis system based on MSW algorithm,BPOAS-MSW),依据滑动窗口频繁模式(mining sliding window,MSW)算法,挖掘经过训练学习后的合法言论模式、异常言论模式和当前言论模式频繁项集,建立系统的合法言论模式、异常言论模式和当前言论模式,达到提高系统的响应速度和系统的检测精度。理论与实验结果表明,BPOAS-MSW舆情分析系统具有较好的性能。  相似文献   

11.
针对目前多数表情识别算法都是基于浅层特征的,很难达到良好的识别效果,并且核主成分分析网络(PCANet)网络存在提取到的表情特征维数比较高致使识别时间较长和分类效率较低的问题,受到深度学习模型PCANet的启发,提出了一种结合核主成分分析网络(KPCANet)和线性判别分析(LDA)的表情识别算法.首先,利用基于KPCANet模型获取训练样本及测试样本的深层特征;然后,用LDA监督层对KPCANet模型获取的深层特征对表情图像特征进行监督投影,从而使表情特征具有类别区分性;最后,将经LDA投影的特征矩阵输入支持向量机(SVM)中对表情特征进行训练和分类.提出的KPCANet-LDA算法模型在人脸表情数据库CK+和JAFFE上进行实验,实验结果表明提出的算法具有良好的鲁棒性且识别率高于其他对比算法.  相似文献   

12.
连续属性离散化是数据预处理的关键步骤之一,在实际应用中往往通过高效的启发式算法来计算离散化结果.对基于辅助矩阵和信息熵的两类启发式离散化算法进行实验研究,分别选取每类算法中的5种典型方法,通过系列实验,对两类算法的性能进行对比研究,结果表明:辅助矩阵类算法具有相对较高的样本识别能力,但算法复杂度较高,运行时间更长,较适...  相似文献   

13.
基于粒子群优化和SOM网络的聚类算法研究   总被引:2,自引:0,他引:2  
利用改进的粒子群优化算法(PSO)的优化性能,结合SOM网络模型,提出了一种基于粒子群优化算法和SOM网络的聚类算法(PSO/SOM),使用PSO对SOM网络进行训练来代替SOM的启发式训练方法.将PSO/SOM算法用于对Wine和Iris等数据集进行模式聚类识别,可以得到较优的聚类识别效果.相比标准SOM算法能有效提高网络映射的准确程度,降低网络的量化误差和拓扑误差,同时也降低了错聚率,实验结果验证了本算法的有效性.  相似文献   

14.
从网络舆情中获取评价以支持决策是旅游管理部门和企业关注的重要问题.为此,本文提出情感倾向计算的新方法以便于网络舆情的理解与分析.首先构建反映酒店评论语义特征的情感词库,然后从句法特征的角度对情感词进行扩充,最后采用深度学习得到情感倾向的分类结果.通过湘潭市旅游酒店评论的舆情分析实验,发现该方法能够得到更为真实的消费者对旅游酒店的情感倾向.从3个竞争酒店评论的舆情分析应用实例上可以得出:情感倾向能够挖掘出酒店的各自特色与管理上的短板,从而进行决策支持.  相似文献   

15.
对BBS的数据结构进行了分析研究,并根据BBS特点设计了一种用于BBS信息检索的主题网络爬虫算法.通过主题网络爬虫能够提高抓取网页的效率,同时又可以保证较高的召回率.实验表明,该算法大幅提高了信息检索的效率,改善了信息检索的效果.  相似文献   

16.
随着在线视频平台的快速发展,弹幕逐渐成为人们表达观点的一个重要途径,尤其受到年轻人的欢迎.与常规的文本不同,弹幕文本普遍较短,表达随意,网络词汇较多,一些常规的停用词被用于表达情感.提出了一种基于弹幕数据的舆情分析模型,针对弹幕数据生成和存储特点,提出了热点检测循环自适应弹幕数据获取算法;扩充了情感词典来区分弹幕中情感倾向数据和中性数据,以解决弹幕中出现的网络词汇较多的问题;基于卷积神经网络(Convolutional Neural Network, CNN)建立了情感褒贬分类模型,用来区分情感倾向弹幕的正负情感倾向,在此基础上得到了舆情分析的结果.实验表明,本文的舆情分析模型能有效地表达新闻类弹幕数据的舆情分析结果.  相似文献   

17.
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.  相似文献   

18.
基于无监督学习的数据清洗算法   总被引:2,自引:0,他引:2  
为了解决数据仓库中相似重复记录的数据问题,提出了基于无监督学习的数据清洗算法.该算法采用基于Hebbian假设的自适应学习方法,并通过相似度确定奖励和惩罚等级.在学习过程中根据需要增加新的聚类,在学习结束后,通过分析聚类情况删除错误的聚类,从而避免了死神经元问题并使聚类更加准确.实验表明,该算法能准确地完成实体识别.  相似文献   

19.
BBS是网络舆情产生和传播的主要场所之一,由于研究手段的匮乏,预测和引导BBS舆情的研究工作仍处于探索阶段.考虑到网络舆情具有突现性,以突现计算的观点将发帖人抽象成Agent.通过设定Agent参数和交互规则,利用小世界网络建立了BBS舆情预测模型.仿真结果表明,在日增回帖数和个人发言数比例这2个重要统计指标上与真实情况同时吻合,说明了模型的合理性和有效性.  相似文献   

20.
基于粗糙集和集成学习的BBS网络舆情分类   总被引:1,自引:1,他引:0  
BBS是网络舆情突发事件产生和传播最重要的场所之一,如何提前发现突发网络舆情是目前网络舆情研究的一个难点和热点问题,目前的研究仍处于探索阶段.利用粗糙集结合集成学习的方法建立网络舆情分类模型,能够在短时间内发现突发网络舆情,为用户和论坛管理人员及时、准确和方便地提取重要的主题信息,以便更好地对论坛进行管理.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号