首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 843 毫秒
1.
群体研讨支持系统(Group Argument Support Systems, GASS)的匿名、并行输入及自动化记录群体发言的特征,在辅助群体产生大量有价值观点的同时,也常常导致"信息过载"和"知识断层".介绍了一个自动化聚类工具来增强群体的认知能力并提高电子会议的效率.首先识别了GASS环境下自动化主题聚类的一些挑战并回顾了相关研究,结合GASS的研讨模式、研讨文本特征及中文文本分析的要求,给出了中文分词、停词表处理以及有效词语识别的文本分析技术.提出基于主题分析的特征向量选择方法,并基于自组织映射的神经网络思想,用Java语言设计并开发了一个自动聚类工具.实验表明,该工具可以达到0.28的聚类准确率,0.35的聚类全面率,产生0.83的聚类错误率.  相似文献   

2.
在技术供需文本匹配视角下,提出了一种基于语义相似聚类的技术需求识别模型.首先,采集网络中技术需求文本提取关键短语;然后,建立领域专利技术转让索引库,基于需求关键短语检索出高相关专利,构建专利技术供给背景库,并对背景库中专利标题与摘要进行分词;第三,提出基于词向量的供需文本语义匹配度算法,筛选有效技术需求并进行语义相似聚类;最后,考虑技术需求对应的需求量和专利技术转让量,对聚类结果进行二维分类.以新能源领域为例进行实证,识别出有效技术需求195个,基于语义相似聚成12类,结合需求量与专利转让量,将12类技术需求分为“高需求、高转让”、“高需求、低转让”、“低需求、高转让”、“低需求、低转让”四大类.该研究为网络技术需求挖掘及供需匹配提供一种新思路.  相似文献   

3.
球型模糊c均值算法在中文文本聚类中的应用   总被引:3,自引:1,他引:2  
一般的聚类算法只能将给定的文本归到一个类,但实际的文本往往属于多个类。提出一种基于球形的模糊c-均值算法的中文文本聚类方法。聚类方法仅考虑文本向量的方向而不考虑文本向量的大小。同时,聚类方法能充分考虑文本隶属于类的程度,并能通过用户给定的阈值将给定的文本归到多个类。实验表明,球形的模糊c-均值算法不仅具有好的聚类精度,而且能找出属于多个类的文本。  相似文献   

4.
初次建立基于神经网络方法的大体积混凝土裂缝控制 ES的框架结构 ,对框架的设计思路、总体结构、知识库的构建、神经网络应用模式的具体实现等展开了描述 ,重点对神经网络聚类方法在神经网络知识库和自学习功能中的应用进行了研究 ,并且通过计算机模拟进行了可行性验证 ,从中得出了一些有益的结论和新的理论设想.  相似文献   

5.
汉语自动分词的研究现状与困难   总被引:31,自引:0,他引:31  
张春霞  郝天永 《系统仿真学报》2005,17(1):138-143,147
汉语自动分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础研究课题。尽管已被研究了二十多年,分词仍然是中文信息处理的瓶颈问题。基于对汉语自动分词研究的现状分析,构建了自动分词的形式化模型,论述了影响分词的诸多因素,分析了分词中存在的两个最大困难及其解决方法。最后指出了目前分词研究中尤其是在分词评测方面存在的问题以及未来的研究工作。  相似文献   

6.
由于众包模式中存在人才盲目参与任务竞争的问题,故需要分析众包环境下人才所需要具备的能力。同时,众包平台上出现很多人才之间进行经验交流的网上社区,面对海量的人才众包经验数据,急需通过有效的方法来获取众包人才能力。针对网上众包社区中的经验沟通交流信息,通过文本挖掘技术来分析众包人才的能力。为了从众包人才交流社区的非结构化文本中识别出能力特征,基于文本聚类的主题识别方法,将人才交流文本内的句子按其不同主题进行聚类,每一个结果簇表示某一种能力特征,采用基于关键词的聚类结果表示方法来解析每一个簇。通过对聚类结果的分析,分别确定了众包人才能力的5个方面:学习与创新能力、服务意识、在线社交能力、成就导向和竞争意识。通过实验检验了所提出方法的有效性。最后,分别分析了程序开发人才和标志设计人才的能力差异化原因。  相似文献   

7.
由于众包模式中存在人才盲目参与任务竞争的问题,故需要分析众包环境下人才所需要具备的能力。同时,众包平台上出现很多人才之间进行经验交流的网上社区,面对海量的人才众包经验数据,急需通过有效的方法来获取众包人才能力。针对网上众包社区中的经验沟通交流信息,通过文本挖掘技术来分析众包人才的能力。为了从众包人才交流社区的非结构化文本中识别出能力特征,基于文本聚类的主题识别方法,将人才交流文本内的句子按其不同主题进行聚类,每一个结果簇表示某一种能力特征,采用基于关键词的聚类结果表示方法来解析每一个簇。通过对聚类结果的分析,分别确定了众包人才能力的5个方面:学习与创新能力、服务意识、在线社交能力、成就导向和竞争意识。通过实验检验了所提出方法的有效性。最后,分别分析了程序开发人才和标志设计人才的能力差异化原因。  相似文献   

8.
针对航空发动机气路部件故障样本特点,提出了一种基于灰色关联聚类的特征提取算法.论述了邓氏、相对变率和斜率三种灰色关联度分析方法,并以利用灰色关联度作为动态聚类欧氏距离的思想,构建灰色关联聚类特征提取模型.以某型涡扇发动机常见气路部件故障为例,利用ESVR算法验证特征提取能满足故障诊断要求. 仿真结果表明:该方法可以提取特征传感器, 使核与约简更精确.  相似文献   

9.
谱聚类作为一种建立在谱图理论基础上的聚类方法,具有能够处理任意空间形状数据且收敛于全局最优解的优点,但其对参数非常敏感,参数值微小的变化都会影响聚类精度.提出一种将基于差异信息理论的灰关联分析结合到谱聚类中的新方法,利用序列的均衡接近度描述数据点的相似程度,在克服参数影响的同时提高了传统谱聚类算法的性能.实验结果证明了新方法的有效性.  相似文献   

10.
用K均值算法进行文本聚类通常只能以局部最优结束,很难找到全局最优.文章提出了一种基于混沌社会演化算法的文本聚类新方法.在该方法中提出了认知主体在聚类中对范式继承的方式,在认知主体对范式的背叛中提出一种混沌变异算子.实验证明该方法不但能有效地提高文本聚类的效率而且能有效地提高文本聚类的精度.  相似文献   

11.
自适应特征熵权模糊C均值聚类算法的研究   总被引:1,自引:0,他引:1  
特征权重算法对聚类效果有很大的影响,而传统的特征权重算法忽略了特征项在类间和类内的分布情况.因此,研究聚类后样本特征属性表现的有序性程度对聚类结果的影响,分析聚类后样本特征属性的分布情况,提出了一种自适应特征熵权模糊C均值聚类算法.该算法以聚类后的特征熵和信息增益作为准则调整特征权值,通过聚类与权重更新逐步迭代优化,直至获得最优的特征权值.实验表明,自适应特征熵权模糊C均值聚类算法能够有效地区分各个特征属性对聚类效果的重要程度;较于其它加权模糊C均值聚类算法,该算法能够得到更高的聚类准确率.  相似文献   

12.
从装备故障知识库构建的重要性和现有故障知识表示方法存在的不足出发,将本体概念引入到装备故障知识库的构建中,分析了本体与知识库的关系以及装备故障知识的特点,提出了装备故障知识库的结构组成,设计了完整的知识库构建方法,描述了各步骤的具体构建过程,并详细阐述了基于规则的语义推理关键技术,实现了装备故障知识库的构建,也为其他领域知识库的构建提供了方法和技术路线。  相似文献   

13.
为解决使用聚类方法实现三维流线可视化时,存在特征提取不全面、可视结果破坏流场连续性、聚类簇划分不稳定导致流线代表性差等问题,提出了基于聚类融合的三维流线可视化方法。该方法由特征间距离度量方法和聚类融合方法两部分组成,将特征间距离和空间距离分别作为流线间的相似度进行聚类,对得到的聚类结果进行加权合并后再划分。将该方法在具有多个不同特征的数据集上进行了实验,并与现有方法进行了定性、定量比较。结果表明,与现有方法相比,该方法能够较好地平衡特征提取和流线分布之间的关系,聚类簇划分的稳定性提高了2%~5%,矢量场重构的精度提高了3%~5%。  相似文献   

14.
灰色关联聚类在面板数据中的扩展及应用   总被引:6,自引:2,他引:4  
首先分析面板数据格式,探讨其几何特征的曲面簇描述方法.进而依据灰色关联分析原理,在三维空间中讨论面板数据各指标的几何特征相似性,提出基于矩阵的扩展灰色绝对关联度,保持与原关联度公式一致,并定义了矩阵始点零化算子和关联度参数.在此基础上,说明扩展关联度矩阵构造方法和面板数据聚类分析过程.最后通过实例验证该方法的有效性,结果表明扩展灰色关联聚类方法具有良好效果.  相似文献   

15.
采用复合结构神经网络对数据概率分布模式进行了仿真识别。首先提取数据的样本峰度、偏度、分位数和累积概率等数字特征 ,构建数据概率分布模式和仿真识别训练样本 ,然后采用Kohonen网络对概率分布进行聚类 ,接着运用BP网络对各聚类分别进行分类识别 ,最后对任意数据流进行了仿真识别。仿真识别结果表明 ,同其它模式识别方法相比 ,该方法更能够反映数据流概率分布的特征 ,从而得到了满意的模式识别效果。  相似文献   

16.
当前全球创新方向正在向开放式团队创新转变。开放式团队创新环境中,基于网络的电子研讨成为最基本、最重要的创新活动,及时准确地识别海量电子研讨信息的研讨主题,并通过可视化形象地展示给创新团队成员,对提高开放式团队创新的效率和质量至关重要。针对传统主题挖掘研究中存在的主要问题,提出了开放式团队创新研讨主题识别方法。该方法在文档建模阶段提出并建立了基于团队创新研讨信息本体和研讨树结构的研讨文本语义计算方法;在研讨主题聚类阶段,针对开放式团队创新研讨的短文本特征,运用AntSA算法对研讨文本进行聚类分析;并通过计算聚类结果中每个节点名词的研讨主题标签贡献率,识别每个类别的研讨主题。最后,根据所提出的开放式团队创新研讨主题识别方法,设计和开发了开放式团队创新研讨主题可视化系统,识别并直观显示各研讨主题间的语义关系和结构关系,并对其进行了实验研究。  相似文献   

17.
SLAM数据关联方法的比较分析   总被引:1,自引:0,他引:1  
针对同时定位与地图构建中数据关联的效果好坏易受特征状态影响的问题,建立了两种仿真场景,在此基础上布置了不同间隔的特征对,分别采用最近邻算法、连续兼容最近邻算法、联合兼容算法、联合最大可能性算法进行特征关联的比较分析。结果表明:特征间隔对数据关联的结果有很大影响,对于大部分数据关联方法来说,在小的特征间隔时关联结果较差,在大的特征间隔时关联结果较好。结合特征在仿真场景中不同的位置,数据关联方法也各自显示出优劣之处以及在不同特征状态下的适用性。得出的结论将对SLAM中数据关联方法的理解与选择有积极意义。  相似文献   

18.
建立了多维属性样本的模糊聚类目标函数.构建了引导进化算法收敛的指数函数曲线模型,给出了模型的参数计算方法.设计了一种具有全局变异和局部变异算子的进化模糊聚类算法,根据全局变异前后个体适应度值和分量值的变化趋势,实现定向变异,并给出了算法的种群进化策略.选择文本分类和点聚类计算实例,实验表明,设计的引导函数是有效的.进化模糊聚类算法具有较强的局部寻优能力,在收敛速度和聚类精度方面优于比较的遗传模糊C-均值聚类等算法.  相似文献   

19.
针对机群编队分组问题,提出了一种加权双质心支持向量聚类算法。所提算法在支持向量训练时引入最大熵原理,快速求解Lagrange乘子;针对样本特征对聚类结果的贡献不同,在聚类标识过程中,引入加权密度质心,提出了加权双质心聚类标识,并在典型数据集上验证了所提算法的有效性。通过对机群编队分组模型的描述,建立了机群聚类时一个目标点需要的特征集,完成了编队分组的仿真实验。仿真结果表明了所提算法能够针对应用的具体样本集实行快速聚类分析,并保证聚类结果的有效性。  相似文献   

20.
提出一种基于改进稀疏子空间聚类的图像分割方法。首先将图像进行过分割得到一些均匀区域称为超像素,并提取超像素的颜色直方图作为其特征;然后建立特征数据的改进稀疏子空间表示并由此构造图相似度矩阵,最后利用谱聚类算法得到超像素的聚类结果并作为图像分割结果。实验结果表明,本文提出的改进稀疏子空间聚类方法具有良好的聚类性能,对噪声具有一定的鲁棒性;用于自然图像能够得到更好的分割效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号