首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
由于众包模式中存在人才盲目参与任务竞争的问题,故需要分析众包环境下人才所需要具备的能力。同时,众包平台上出现很多人才之间进行经验交流的网上社区,面对海量的人才众包经验数据,急需通过有效的方法来获取众包人才能力。针对网上众包社区中的经验沟通交流信息,通过文本挖掘技术来分析众包人才的能力。为了从众包人才交流社区的非结构化文本中识别出能力特征,基于文本聚类的主题识别方法,将人才交流文本内的句子按其不同主题进行聚类,每一个结果簇表示某一种能力特征,采用基于关键词的聚类结果表示方法来解析每一个簇。通过对聚类结果的分析,分别确定了众包人才能力的5个方面:学习与创新能力、服务意识、在线社交能力、成就导向和竞争意识。通过实验检验了所提出方法的有效性。最后,分别分析了程序开发人才和标志设计人才的能力差异化原因。  相似文献   

2.
《系统管理学报》2015,(4):623-623
2015年第24卷第3期,论文《基于文本挖掘的众包人才能力分析》添加如下参考文献:[14]麦林.虚拟社区热点话题意见挖掘模型研究[D].合肥:中国科技大学,2009.[15]张丽.一种中文文本聚类方法的研究[D].哈尔滨:哈尔滨工程大学,2009.[16]吕英杰,张朋柱,刘景方.众包模式中面向创新任务的知识型人才选择[J].系统管理学报,2013,22(1):60-66.  相似文献   

3.
更正     
<正>2015年第24卷第3期,论文《基于文本挖掘的众包人才能力分析》添加如下参考文献:[14]麦林.虚拟社区热点话题意见挖掘模型研究[D].合肥:中国科技大学,2009.[15]张丽.一种中文文本聚类方法的研究[D].哈尔滨:哈尔滨工程大学,2009.[16]吕英杰,张朋柱,刘景方.众包模式中面向创新任务的知识型人才选择[J].系统管理学报,2013,22(1):60-66.  相似文献   

4.
应用隐马尔可夫模型是文本信息抽取的一种重要方法。对于网上不同来源的文本,由于其格式很不相同,进行混合训练,一般难以得到较优化的模型。将聚簇应用到文本信息抽取中,首先通过一种改进的k-平均方法对训练文本的Markov链模型进行聚簇,然后训练各簇的隐马尔可夫模型,提出了一种基于聚簇隐马尔可夫模型的文本信息抽取算法(C-HMM)。对700篇网上不同来源的文本进行信息抽取仿真实验,结果表明,新的算法能有效地提高抽取性能。  相似文献   

5.
群体研讨支持系统(Group Argument Support Systems, GASS)的匿名、并行输入及自动化记录群体发言的特征,在辅助群体产生大量有价值观点的同时,也常常导致"信息过载"和"知识断层".介绍了一个自动化聚类工具来增强群体的认知能力并提高电子会议的效率.首先识别了GASS环境下自动化主题聚类的一些挑战并回顾了相关研究,结合GASS的研讨模式、研讨文本特征及中文文本分析的要求,给出了中文分词、停词表处理以及有效词语识别的文本分析技术.提出基于主题分析的特征向量选择方法,并基于自组织映射的神经网络思想,用Java语言设计并开发了一个自动聚类工具.实验表明,该工具可以达到0.28的聚类准确率,0.35的聚类全面率,产生0.83的聚类错误率.  相似文献   

6.
由于网上创新服务存在双方缺乏互信、人才过度竞争的问题,迫切需要建立网上创新任务与人才的匹配机制来增强发包方的积极性,减少接包方的无效劳动,从而保障双方的权益,提高市场效率。借助Spencer的人才胜任力模型,结合网上创新服务环境特点,构建并得到包含3个维度10个指标的网上创新人才胜任力模型。为了提高匹配过程的客观性和准确性,以创新人才的实际任务经历记录作为匹配指标水平的数据来源,努力挖掘客观信息的价值,并定量和定性信息进行综合,实现了平台客观数据与人才指标的相互对应,通过项目能力记录来体现人才指标。分别针对程序开发类任务和设计类任务,提出了基于网上创新人才信息的任务-人才的辅助匹配方法。最后,通过案例应用分析体现该方法的科学合理性和实用性。  相似文献   

7.
网络众包作为企业开放式创新的一种崭新模式,近年来得到迅速发展,然而,信用体系不健全、过度竞争等问题成为制约其快速发展的瓶颈。为此,建立了面向众包任务的知识型人才选择机制,构建了知识型人才指标评价体系,采用基于TOPSIS的多指标决策算法,对人才的任务完成能力进行有效的评估,从而为企业选择适合的人才提供支持。这样既增强企业参与众包的意愿,同时有效避免了人才的过度竞争,减少人力资源浪费,保障了众包这种开放式创新模式得以持续健康发展。  相似文献   

8.
对众包环境下供应方进行关键事件访谈,依据扎根理论,对访谈文本进行编码分析,构建供应方胜任力模型。基于扎根理论,借助系统规范的编码规则,对访谈文本进行提取、分析、总结,发现众包环境下,供应方胜任力模型由25个胜任特征构成任务研发能力、社交能力、项目管理能力、成就导向和个性品质5大维度。  相似文献   

9.
对众包环境下供应方进行关键事件访谈,依据扎根理论,对访谈文本进行编码分析,构建供应方胜任力模型。基于扎根理论,借助系统规范的编码规则,对访谈文本进行提取、分析、总结,发现众包环境下,供应方胜任力模型由25个胜任特征构成任务研发能力、社交能力、项目管理能力、成就导向和个性品质5大维度。  相似文献   

10.
提出了一种新的聚类评价方法,该方法以聚类的代表点表示法为基础,在经典方法上做出了改进.首先将聚类结果对应于模态逻辑中Kripke结构;然后利用模态逻辑中语法与语义之间的对应性选取了相应的公理系统.通过公式之间的蕴涵关系,选择一组极少的数据点来表示聚类结果的各种信息,形成聚类的模态代表点.在此基础上,给出了相应的聚类评价方法.这种方法除了可以评价聚类结果的优劣,还可以分析出簇的形态.实验表明,与一些常用聚类评价指标相比,这种评价方法更具通用性.  相似文献   

11.
竞争式众包中,有效的任务推荐成为亟欲解决的问题.传统任务推荐仅依据工人对任务的投标记录构建任务推荐方法,但工人对任务的投标与否本质上是由工人的参与意愿决定.针对竞争式众包特性,本文提出一种考虑工人参与意愿影响因素的竞争式众包任务推荐方法.该方法基于工人参与意愿影响因素研究,从工人维度和发包方维度将工人的参与意愿影响因素表示为工人的收益偏好、素质能力以及对发包方的信任,并结合工人历史行为记录以及相关描述信息对各维度影响因素进行衡量.在此基础上构建工人模型,并综合各维度影响因素相似度借助协同过滤算法生成推荐列表.通过一品威客众包平台中真实数据的实验表明,本文提出的推荐方法能够更有效地对竞争式众包任务做出推荐.  相似文献   

12.
针对非均匀类簇密度聚类问题,从商空间粒度理论出发,提出一种多粒度自学习聚类算法 (multi-granularity self learning clustering algorithm, MSCA)。算法通过构造聚合树结构和定义粒度函数对问题逐层求解,并在每层聚合过程中根据聚合区间以自学习的方式动态确定聚合粒度,解决了传统聚类算法从非均匀类簇密度数据中无法得到不同层次的聚合特征且参数对经验依赖性过高的问题。理论和实验表明,MSCA算法可以发现任意形状类簇,有效处理噪声,并能发现关键聚合层,具有较好的计算复杂性。  相似文献   

13.
特征加权是聚类算法中的常用方法,决定权值对产生一个有效划分非常关键。基于模糊集、粗糙集和阴影集的粒计算框架,本文提出计算不同簇特征权重的聚类新方法,特征权值随着每次迭代自动地计算。每个簇采用不同的特征权重可以更有效地实现聚类目标,并使用聚类有效性指标包括戴维斯-Bouldin指标(Davies-Bouldin,DB)、邓恩指标(Dunn, Dunn)和Xie-Beni指标(Xie-Beni, XB)分析基于划分的聚类有效性。真实数据集上的实验表明这些算法总是收敛的,而且对交叠的簇划分更有效,同时在噪声和异常数据存在时具有鲁棒性。  相似文献   

14.
使用中文文本挖掘方法来分析中国高校网页中各专业培养方案和培养目标的非结构化数据集。以K-means文本聚类算法和聚类结果归纳的各专业类别的技能关键词为基础,在集成了所有专业领域的专有特征和专家审核并结合了频率计算方法后,定义了技能指标与相应各个专业的重要性程度。最后,建立了专业和技能之间的关联知识库,为构建网络化创新外包人才技能模型建立了基础。通过实验评估发现,与基于基本中文语料库的分词方法相比较,在中文分词过程中引入专业专有特征的方法能够提供更加精确和合理的聚类结果。因此,本文提出的方法能够高效地构建专业技能关联知识库。  相似文献   

15.
为了提高虚拟实践社区用户浏览和搜索知识对象的效率,促进社区内的知识共享,提出了一种虚拟实践社区知识地图构建方法.该方法首先改进了成长单元结构算法,利用层级成长单元结构算法对社区内的知识对象进行聚类,然后基于标签自组织映射算法自动确定出每一类所代表的主题,构造出层级知识地图.实验结果表明,所提出方法的聚类效果要优于凝聚层次聚类和增长层级自组织映射算法,能够在虚拟实践社区中构造出合理、有效的知识地图.  相似文献   

16.
特征表示和相似性度量是时间序列数据挖掘的基础工作, 其质量好坏直接影响后期的挖掘结果. 利用正交多项式回归模型对时间序列进行多维形态特征表示, 分析特征维数对时间序列拟合效果的影响, 选取部分特征来描述序列的主要形态趋势, 提出了一种鲁棒性较强的形态特征相似性度量方法来近似度量时间序列, 且具有较高的相似性度量质量. 实验结果表明, 基于多维形态特征表示的时间序列相似性度量方法不仅满足下界要求, 具有较好的下界紧凑性和数据剪枝能力, 而且在时间序列聚类和分类等数据挖掘任务中取得了良好的效果.  相似文献   

17.
基于谱图理论的形状聚类仿真   总被引:1,自引:0,他引:1  
谱图理论已经广泛的应用于形状表示、匹配和聚类。主要研究两个方面的问题:1、通过提取形状的骨架特征点和图谱分析,建立形状的数学模型;2、通过分析模型的数学特征,将形状投影到低维空间中。利用上述方法实现了形状的聚类仿真。针对公共数据集的仿真实验证明了该聚类算法能有效的实现形状聚类。  相似文献   

18.
陈晓红  秦杨 《系统工程》2004,22(7):80-83
传统特征选择算法在多维Web数据中由于其数据对象自身固有的稀缺性而常常失效。在典型多维Web数据挖掘应用中,不同数据对象集合对于不同雏度集合而言可能聚类会更好,且在每个簇的具体子空间中维度数将可能非常大。事实上,为所有簇查找出单个的小雏度集合是不可能的。本文应用映射簇的概念来明确簇与雏度的关系,将聚类问题转化为映射簇问题,从而简化计算提高挖掘效率。最后给出相应的算法。  相似文献   

19.
双聚类算法是一类新型数据挖掘聚类算法,通常以均方残差为评价指标.基于均方残差的双聚类算法,大多采用贪婪策略求解,通常不能得到大小适中且结果准确的簇.而在联合聚类中,模糊理论能改善这种基于均方残差的算法,得到大小适中且结果准确的簇.为了提高基于均方残差双聚类算法的性能,本文结合模糊理论提出一种求解单一簇的模糊双聚类算法....  相似文献   

20.
球型模糊c均值算法在中文文本聚类中的应用   总被引:3,自引:1,他引:2  
一般的聚类算法只能将给定的文本归到一个类,但实际的文本往往属于多个类。提出一种基于球形的模糊c-均值算法的中文文本聚类方法。聚类方法仅考虑文本向量的方向而不考虑文本向量的大小。同时,聚类方法能充分考虑文本隶属于类的程度,并能通过用户给定的阈值将给定的文本归到多个类。实验表明,球形的模糊c-均值算法不仅具有好的聚类精度,而且能找出属于多个类的文本。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号