首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
为了解决和突破现阶段重复数据删除方法大多只能针对特定领域,孤立地解决问题的某个方面所带来的不足和局限,提出了基于Markov逻辑网的统计关系学习方法。该方法可以通过计算一个世界的概率分布来为推理服务,从而可将重复数据删除问题形式化。具体采用了判别式训练的学习算法和MC-SAT推理算法,并详细阐述了如何用少量的谓词公式来描述重复数据删除问题中不同方面的本质特征,将Markov逻辑表示的各方面组合起来形成各种模型。实验结果表明基于Markov逻辑网的重复数据删除方法不但可以涵盖经典的Fellegi-Sunter模型,还可以取得比传统的基于聚类算法和基于相似度计算的方法更好的效果,从而为Markov逻辑网解决实际问题提供了有效途径。  相似文献   

2.
基于后验概率的Markov逻辑网参数学习方法   总被引:1,自引:0,他引:1  
通过介绍统计关系学习方法Markov逻辑网的理论模型和参数学习方法, 提出一种基于后验概率的参数估计方法, 该方法采用正态先验分布, 用伪似然概率替代似然概率, 通过最大化伪后验概率来学习模型参数. 实验结果表明, 该方法能够有效地学出模型参数, 且所得模型推理能力优于现有的参数学习方法.  相似文献   

3.
基于Markov逻辑网的句子压缩方法   总被引:1,自引:0,他引:1  
提出了一种基于Markov逻辑网通过删除单词进行英文句子压缩的方法。通过一阶逻辑公式表示单词的局部特征以及单词之间的相互依赖关系,确定单词是否应该删除。与现有方法相比,该方法把判别式学习和整数规划的优点相结合,既融合了丰富的句子特征,又以逻辑公式方便地表示全局约束。在书面和口语两个新闻数据集上的实验结果表明:该方法与L3和SVTL系统相比具有明显优势,在压缩率接近时,以人工压缩结果为评测标准,压缩后句子的依存关系F-score有较大提高。  相似文献   

4.
基于Markov网络的信息检索扩展模型   总被引:6,自引:0,他引:6  
为了解决信息检索性能较差的问题,查询扩展将索引项之间的关系以及文档之间的相似度引入到检索中,这个过程可以通过构造知识网络来进行.Markov网络是一种有效的知识关联图形表示方法,可以从实例数据训练获得.本研究提出并实现了基于Markov网络的信息检索扩展模型,通过对文档集的学习,构造了关于索引项和文档的Markov网络,将有利于检索的信息加入到检索中.实验表明,基于Markov网络的信息检索扩展模型优于BM25模型.  相似文献   

5.
提出一种基于马尔科夫逻辑网的句子情感分析方法. 与深度学习方法相结合实现跨领域的知识迁移,同时采用马尔科夫逻辑网将句子的上下文信息与其它情感特征相结合实现句子情感分析. 在COAE评测数据上的实验结果表明,该方法与SVM分类方法相比,准确率达到70.02%,并且在跨领域的情感分析任务中也得到了较好的结果.   相似文献   

6.
通过利用Markov网络团的方法来对查询意图识别.首先从人工标注搜狗查询日志中约2 250个查询作为测试数据,采用搜狗提供的分类语料(共10类)来建立Markov网络,用建立的Markov网络来对查询进行扩展,得到相关的返回结果列表,运用在分类语料训练好的分类器来对返回结果进行分类,从而完成对查询意图识别的过程.实验中采用的评价指标是11_avg和3_avg,实验结果表明该方法能够有效地提高检索效率.  相似文献   

7.
可用性已经成为评价一个网络质量好坏的一个重要标准.由于移动自组网的网络拓扑结构易变、无线通信可靠性差和带宽受限、移动主机能源受限等不足,使得对其可用性的分析变得相当困难.为了能更好地分析移动自组网的可用性,构造了一个齐次的连续时间Markov链模型,并且通过该模型能够很好地求解系统在正常情况下稳态的概率,即稳态的可用性.图2,参9.  相似文献   

8.
建立了并行开发过程模型,构造了对应的随机Petri网模型及与之同构的Markov链,基于马尔科夫过程的稳态概率求解了系统的性能参数,分析比较了两系统资源利用合理性及系统的平均延迟时间.  相似文献   

9.
利用一种新方法--网微分法及无穷乘积定理,将Bernoulli序列赌博系统的极限定理推广到Markov值随机序列情形,进一步允许随机选择函数取值于有限区间,扩展了随机选择概念.  相似文献   

10.
近年来,概率系统在实际中应用越来越广泛,其中模型检测基于概率系统的反例生成问题,已引起人们的广泛关注,现有的工作主要围绕模型检测Markov链反例生成展开.概率时间自动机(PTA)是Markov链的不确定性和系统时钟的扩展,针对模型检测PTA的反例表示问题,首先将PTA的语义表示为Markov决策过程(MDP),通过策略解决MDP不确定性,将MDP转换为离散时间Markov链(DTMC);然后将DTMC转换为带权有向图,则PTA中最小反例问题转化为带权有向图中最短路径问题;最后采用正则表达式表示求得的反例.  相似文献   

11.
针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM (bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征;然后,利用训练的Labeled-LDA(labeled latent dirichlet allocation)模型获取所有词与标签之间的词-标签概率信息;接着,使用Bi-LSTM网络和CNN网络提取当前预测文本中每个词的词-标签信息特征;最后,结合提取的文本特征,预测与当前文本相关联的标签集.实验结果表明,使用词-标签概率获取文本中词与标签之间的相关性信息,能够有效提升模型的F1值.  相似文献   

12.
针对面向实际应用场景中数据标签易残缺导致有监督多标签分类方法可用训练数据量减少,未能利用大量标签缺失数据中蕴含的样本特征空间关联知识以最大化判别间隔,限制多标签分类效果等问题,本文提出一种融合样本相似性的弱监督多标签分类方法.该方法利用标签相关性和样本相似性恢复标签以提高数据利用率,并将标签恢复嵌入到训练过程中以便挖掘标签相关性,通过近端加速梯度法进行参数优化,建立弱监督学习场景的多标签分类模型.在真实数据集上的实验结果表明,该方法能够利用样本相似性有效提升模型在标签残缺时的分类能力,实用价值大.   相似文献   

13.
分类器链是利用标签间相关性实现挖掘特定对象多维标记信息的重要多标签分类方法.面向现有分类器链算法,针对各标签的基学习器均在完整特征空间中训练导致学习特征冗余,以及因标签学习顺序随机且分类器链训练过程单向无反馈导致的标签间相关信息利用不充分等问题,本文提出一种结合类属特征及因果发现的序列优化分类器链.该方法采用类内仿射传播聚类为每个基学习器构建高级结构化特征,减少冗余信息;利用条件熵准则挖掘标签间因果关系,优化学习序列提高对标签间相关信息的利用程度.在多个公开数据集的实验结果表明,序列优化分类器链有效增强了单节点学习效果以及对多标签间关联信息的利用,有效提升了多标签分类效果,实用价值高.   相似文献   

14.
在监督学习实际任务中,特征的高维性、标记的动态性和缺失性为监督学习带来严峻的挑战。为解决这些不足,提出流缺失标记环境下的多标记特征选择算法。首先,为解决缺失标记的影响,通过学习标记相关性填补不完整的标记矩阵。其次,利用稀疏学习方法为每个新到达的标记选择类属属性。然后,根据已到达标记的类属属性,通过计算得分选取一个有代表性的特征子集。最后,在11个基准数据集上进行一系列实验表明,所提算法能选择有代表性的特征子集,且分类性能较优。  相似文献   

15.
多标签流形学习(multi-label manifold learning, ML$^{2}$)基于特征流形构建标签流形, 将标签逻辑值转换为实数值, 能更好地反映标签相关性, 提高分类性能. 但是, ML$^{2}$ 与多数多标签分类方法一样, 是基于数据的全部特征进行标签预测, 没有考虑不同特征对不同类别标签的鉴别能力. 因此, 提出一种基于类属特征的多标签流形学习分类(label specific feature based multi-label manifold learning, LSF-ML$^{2}$)方法. 首先, 利用标签数据优化类属特征重要度矩阵, 确定类属特征子集; 再将子集的特征流形映射到标签空间, 使标签从离散型变为数值型; 最后, 通过多输出回归实现分类. 实验结果表明, 所提方法性能优于多种多标签分类方法.  相似文献   

16.
地震破坏预测研究对于建筑结构减灾规划、震前风险预测、震后应急评估有着重要意义。传统的方法因为受到震害资料数量的限制以及计算精度和能力的制约,一般基于经验只考虑少数因素对结构破坏的影响。通过使用随机森林算法,设计了一个综合考虑地震动、结构和场地等多维度信息的分类方法,用以预测建筑物的地震破坏程度。本文研究框架基于新西兰国家地震委员会所收集的27次地震详细破坏资料,处理得到14.2万条高质量建筑物损失数据,考虑了谱加速度、建筑形状、层数等16个影响因素,将4种不同的损伤状态作为模型的学习标签进行地震破坏预测训练。结果表明,随机森林算法在6种分类算法中性能最佳,经过学习曲线法调参、代价敏感学习之后,经过优化得到的随机森林模型对于测试集的整体预测精确率可以达到75.4%,对4种损伤标签的召回率分别达到了88.2%、55.0%、60.7%和70.8%,远好于其他方法。当只考虑对结果影响最重要的前12个因素,该模型的预测精度仍然能够达到73.7%。可见,基于此框架所训练的预测模型具有良好的精度与适用性,同时该框架对于中国震害资料大数据库的研究具有较高的参考价值。  相似文献   

17.
皮肤镜是辅助皮肤科医生诊断的有效途径,但是人工分类高度依赖医生的临床经验,并且皮肤镜图像本身的复杂性给分类提出了巨大的挑战.为了解决皮肤镜图像分类问题,基于集成学习提出了一种集成投票块的皮肤镜图像分类方法.首先,针对ISIC 2019提供的皮肤镜图像进行预处理,为了缓解数据集较少且分布不均的问题,使用生成对抗网络和旋转图像进行数据增强.然后基于迁移学习的思想训练多个卷积神经网络,从中挑选出分类效果较好的多个卷积神经网络组成投票块,进而集成投票块,最终实现皮肤镜图像的分类.实验结果表明,该方法的准确率、敏感度、特异度可分别达到0.925、0.563、0.927,相比单一的卷积神经网络模型,各个评价指标均有所提高,为皮肤镜图像分类提供了一种有效方案.  相似文献   

18.
针对多类别的社交媒体短文本分类准确率较低问题, 提出一种学习多种句式的元学习方法, 用于改善Twitter文本分类性能。将Twitter文本聚类为多种句式, 各句式结合原类标签, 成为多样化的新类别, 从而原分类问题转化为较多类别的few-shot学习问题, 并通过训练深层网络来学习句式原型编码。用多个三分类Twitter数据来检验所提Meta-CNN方法 , 结果显示, 该方法的学习策略简单有效, 即便在样本数量不多的情况下, 与传统机器学习分类器和部分深度学习分类方法相比, Meta-CNN仍能获得较好的分类准确率和较高的F1值。  相似文献   

19.
在讨论了CAI学习理论的基础上,给出了一个CAI认知学习模型,详细介绍了为实现模型而设计的一种超文本课件的组织。此模型的CAI系统可以为教师一个方便的教学设计环境,有助于解决现有CAI软件教学设计不足的问题。  相似文献   

20.
为了取得精确的图像分类效果,一方面需要提取大量的图像特征数据进行样本分析,另一方面大量的数据又造成了维数灾难.因此,为了解决信息全面与维数灾难的矛盾,引入了深度学习.深度学习利用分层结构处理复杂的高维数据,可以完成复杂函数的逼近,是一类具有多层非线性映射的学习算法,但深度学习模型优化困难且对隐层参数敏感.针对上述问题,将无监督算法引入深度学习,这种学习方法无须人工设计特征提取数据,训练过程中样本标签是未知的.实验表明,该算法在不影响图像分类效果的前提下,可以大大降低计算复杂度,具有一定的时效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号