首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 80 毫秒
1.
基于用户查询日志的命名实体挖掘的目标是从用户查询日志中挖掘一组具有指定类别的命名实体。为解决已有用户查询日志实体挖掘研究工作中的种子实体不充分的问题,提出了一种基于二部图的半监督排序方法,利用实体之间的关系(实体共享查询模板)来改善实体排序效果。该方法首先基于候选实体和查询模板构建一个二部图,然后基于二部图将种子实体的类别相关性传播到其他候选实体,最后按照类别相关性得分对候选实体进行排序,并进一步给出方法中迭代过程的等价优化框架。实验结果表明本文提出的方法优于基准方法,具有较好的挖掘效果。  相似文献   

2.
为实现不同数据管理系统之间的互通,提出一种基于半监督学习算法的多源异构数据治理框架,并由此设计、实现和测试了一套非结构化数据与结构化数据的自动化对齐方法。利用命名实体识别(NER)技术,将非结构化数据转化为结构化数据,再分别利用基于字符串相似度的方法和基于监督学习的方法,对结构化数据进行模式匹配;通过半监督学习方法,在结构化数据与数据库记录实体之间进行实体匹配与融合;利用自然语言处理(NLP)技术及深度学习方法,对融合后的数据集进行缺失值填补。结果表明:在论文数据集和视频元数据集上进行对齐处理后,两者的F1值分别达到89.70%及96.50%;在不同属性上进行缺失值填补后,整体填补准确率达到78%以上,大大优于基线方法的准确率。  相似文献   

3.
近年来,深度学习方法被广泛地应用于命名实体识别任务中,并取得了良好的效果.但是主流的命名实体识别都是基于序列标注的方法,这类方法依赖于足够的高质量标注语料.然而序列数据的标注成本高昂,导致命名实体识别训练集规模往往较小,这严重地限制了命名实体识别模型的最终性能.为了在不增加人工成本的前提下扩大命名实体识别的训练集规模,本文分别提出了基于EDA(Easy Data Augmentation)、基于远程监督、基于Bootstrap(自展法)的命名实体识别数据增强技术.通过在本文给出的FIND-2019数据集上进行的实验表明,这几种数据增强技术及其它们的组合能够低成本地增加训练集的规模,从而显著地提升命名实体识别模型的性能.  相似文献   

4.
针对面向中文网络百科条目文章的属性和属性值抽取,提出一种无监督方法。此方法将属性值看做命名实体,利用频繁模式挖掘和关联分析,从文本中抽取类别属性;采用自扩展方法为属性建立触发词表;基于属性触发词和属性值实体标注挖掘属性值抽取模式,利用层次聚类算法获取高质量的模式。在互动百科中采集的数据集上进行实验,结果表明所提方法行之有效。  相似文献   

5.
针对利用远程监督标注文本实体过程中存在实体类别标注错误问题导致模型难以有效区分各实体的类别特征,影响模型精准度的问题,本文提出一种利用原型网络过滤训练语料中标注错误样本的远程监督命名实体识别方法,利用预训练的原型网络编码正确标注实体生成类别原型表示,过滤语料中距类别原型较远的样本.实验表明,使用原型网络有效地提高了语料的标注质量,提升了模型性能.  相似文献   

6.
查询推荐是一种帮助搜索引擎更好的理解用户检索需求的方法.基于查询的上下文片段训练词汇和查询之间的语义关系,同时结合查询和URL的点击图以及查询中的序列行为构建Term-Query-URL异构信息网络,采用重启动随机游走(Random Walk with Restart,RWR)进行查询推荐.综合利用语义信息和日志信息,提高了稀疏查询的推荐效果.基于概率语言模型构造查询的词汇向量,可以为新的查询进行查询推荐.在大规模商业搜索引擎查询日志上的实验表明本文方法相比传统的查询推荐方法性能提升约为3%~10%.  相似文献   

7.
网络教育的飞速发展,使得网络学习的效果越来越受到重视.主要介绍了基于Web日志挖掘技术的网络学习行为建模的过程.通过数据收集和预处理、模式发现及模式分析等过程,构建了基于Web日志挖掘的网络学习行为模型.  相似文献   

8.
梁燕红 《科技信息》2011,(22):I0244-I0245
本文介绍了数据挖掘及Web数据挖掘的含义、Web数据挖掘的分类、过程,阐述了Web数据挖掘技术在网络教学中的应用,并将Web日志挖掘技术运用到实例,采用Apriori算法,分析学生的学习需求趋势。  相似文献   

9.
阐述了在远程教育系统的研究和应用中,利用Web挖掘技术,有效地将学生学习过程中的数据记录到日志文件中,并对日志文件进行有效地分析和挖掘;利用Apriori改进算法FT-树增长算法,找出对远程教育系统及基于Web的其他教学和管理工作有指导作用的关联规律。  相似文献   

10.
本文介绍了数据挖掘及Web数据挖掘的含义、Web数据挖掘的分类、过程,阐述了Web数据挖掘技术在网络教学中的应用,并将Web日志挖掘技术运用到实例,采用Apriori算法,分析学生的学习需求趋势。  相似文献   

11.
混合算法实现的RBF神经网络及在模式辨识中应用   总被引:1,自引:0,他引:1  
把模糊聚类算法和RBF神经网络结合起来,得到一种基于混合算法的RBF神经网络.首先由改进的FCM算法确定神经网络结构;然后利用监督学习对网络参数进一步优化,并对输出权值调整.使网络不仅具有最优的拓扑结构,而且又具有较强的映射能力.对驾驶员的疲劳程度进行识别,得到了满意的结果.  相似文献   

12.
行人检测是计算机视觉领域中的研究热点,其实质是一个二分类问题.目前基于统计的行人检测技术已取得了一定进展,但大都需要大量的训练数据.针对这一问题,提出了一种基于迁移学习的半监督行人分类方法:首先基于稀疏编码,从任意的未标记样本中,学习到一个紧凑、有效的特征表示;然后通过迁移学习,将学习到的特征表示方法迁移到行人分类中.在MIT行人数据库上的实验结果表明:该方法能有效地刻画出行人的特征,提高行人分类的性能,在标记样本少的情况下仍具有良好的分类效果,因此可应用于行人检测中.  相似文献   

13.
通过采集可穿戴运动传感器信号,并利用迁移学习克服数据分布不一致来识别人体日常行为成为当下主流.利用可穿戴传感器采集信号,会产生影响迁移效果的噪声样本,传统的算法缺少对这部分样本的处理.针对这一问题,在传统算法的基础上进行改进,引入了基于马氏距离的样本筛选算法,提出了可用于人体活动识别的迁移学习算法T-WMD,并在两个公开的人体活动识别数据集上与其他5种算法进行对比实验.结果表明提出的算法可以有效地提升迁移学习效果.  相似文献   

14.
In the conventional CMAC learning scheme, the correcting amounts of errors are equally distributed into all addressed weight, regardless the temporal credibility of those weights. In order to solve the temporal credit assignment problem of the CMAC, an improved CMAC neural network based on replacing eligibility learning concept was designed. The proposed improved leaning approach uses the replacing eligibility learning concept of the reinforcement learning to improve the prediction capability. The simulatio...  相似文献   

15.
In the conventional CMAC learning scheme, the correcting amounts of errors are equally distributed into all addressed weight, regardless the temporal credibility of those weights. In order to solve the temporal credit assignment problem of the CMAC, an improved CMAC neural network based on replacing eligibility learning concept was designed. The proposed improved leaning approach uses the replacing eligibility learning concept of the reinforcement learning to improve the prediction capability. The simulations for chaotic system identification show that the improved CMAC neural network is effective.  相似文献   

16.
针对双关语样本短缺问题,研究提出了基于伪标签和迁移学习的双关语识别模型 (pun detection based on Pseudo-label and transfer learning)。该模型利用上下文语义、音素向量和注意力机制生成伪标签;然后,迁移学习和置信度结合挑选可用的伪标签;最后,将伪标签数据和真实数据混合到网络中进行训练,重复伪标签标记和混合训练过程。一定程度上解决了双关语样本量少且获取困难的问题。使用该模型在SemEval 2017 shared task 7以及Pun of the Day 数据集上进行双关语检测实验,结果表明模型性能均优于现有主流双关语识别方法。  相似文献   

17.
针对传统两级车辆路径优化过程,存在的精度不高,收敛时间过长的问题,提出一种基于Q学习理论和差分进化的Memetic算法。首先,对两级车辆路径优化问题进行研究,利用最优分割法获得第一级配送方案,以此确定中转站配送数量,然后求解第二级多配送中心车辆路径问题配送方案,获得两级优化问题的总里程及总配送车辆数量;其次,针对第二级MDVRP配送方案求解,利用Q学习理论和差分进化算法,设计新的Memetic算法,来实现对多配送中心车辆路径问题配送方案的全局优化;最后,通过仿真验证了所提算法的有效性。  相似文献   

18.
针对T-S模糊系统的终端控制问题,提出了一种基于正交多项式的迭代学习算法.该算法把待求控制量表示为一组正交多项式的线性组合,将求控制量问题转化为求正交多项式系数问题.在此基础上,用迭代学习的方式来修正控制量的正交多项式系数,并采用LMI方法求解学习增益矩阵.最后,以单关节机器人为例说明了所提算法的有效性.  相似文献   

19.
基于模糊神经网络分类器的精馏塔温度控制器设计   总被引:1,自引:0,他引:1  
文章对精馏塔温度控制中所遇到的参数耦合严重、非线性高、数学模型难以建立的问题,提出了一个基于模糊神经网络分类器的控制方案,以精馏塔温度、流量、液位作为输入,导热油阀门开度作为输出,通过对人工操作的自适应学习和模糊化处理,实现对精馏塔温度的智能控制。实验结果表明,该方案能够模仿人工操作,智能学习的精度很高。  相似文献   

20.
如何将组织学习从意识形态转换为组织中的学习的现实方法和工具,是学习型组织成功的关键环节。通过对组织知识转移过程中的学习方式和相应的组织学习机制的分析,探讨了组织如何根据不同的知识转移方式设计相应的组织学习机制的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号