首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
面向以自然语言描述的生物领域实例,基于自然语言的向量表示模型,研究与设计相关的生物领域实例获取问题,提出了基于文本挖掘的生物领域实例获取方法.通过对语料库文本向量空间的构建和知识挖掘,研究生物领域文本的特征选择、相似性度量和实例检索方法,为设计需求驱动的生物领域实例获取提供技术支持.实例分析表明:一方面,基于向量空间模型的生物领域文本挖掘方法在精度和召回率两方面均较基线法具有较大的优势;另一方面,基于向量空间的文本检索机制具有很好的适应性和扩展性,可以满足不同环境下语义检索的需要.  相似文献   

2.
网络图像的文本和图像之间有较强的相关性,传统基于内容的图像检索方法往往忽视文本和图像的相关性,而跨模态检索中,文本和图像的底层特征独立获得,并未有效利用两模态之间的语义关联性,基于此,本文提出了一种跨模态语义增强的图像检索方法(CSR),协同约束文本底层特征的线性判别分析项及两模态的典型相关分析项,使得文本语义增强的同时其强语义性通过协同约束迁移到图像特征中,最后通过多类逻辑回归获得文本和图像语义特征,用文本语义特征正则化图像语义特征,进一步提高图像特征的语义判别性。在Wikipedia和Pascal Sentence数据集上进行实验,显示本文方法能有效提高图像检索的平均查准率。  相似文献   

3.
提出一种基于变精度粗糙-模糊集模型的诊断知识获取算法,利用相似性聚类方法自动获取模糊隶属函数,将连续属性表示成模糊值,通过定义模糊相似关系和模糊相似类给出了变精度粗糙-模糊模型的近似表示,并引入蚁群算法求取模糊相似关系下的属性约简,进行诊断知识的获取。将其应用于精对苯二甲酸生产过程尾氧浓度故障诊断知识获取中,结果表明:该算法可以从故障数据中提取更客观有效的诊断规则,在实际故障诊断中具有很好的应用价值。  相似文献   

4.
根据自然语言语义特征提取、匹配的实时性和准确性要求,提出模糊聚类、单亲遗传搜索匹配算法相结合的新方法,通过对候选特征点进行模糊聚类处理,使其分布在高斯差分图像的灰度轮廓线边缘,利用单亲遗传算法找到满足约束条件全局最优语义特征,并把所有语义特征进行分类,给出分类依据.试验证明,此语义特征匹配算法在未知语境环境、语义特征频繁变化的环境具有很强的鲁棒性,能够在自然语言处理过程中实时准确识别段落中的语义特征.  相似文献   

5.
针对复杂语境下自然语言语义特征提取、匹配精度和实时性较差的问题,提出了模糊聚类、单亲遗传搜索匹配算法相结合的新方法,通过对候选特征点进行模糊聚类处理,使其分布在高斯差分图像的灰度轮廓线边缘,利用单亲遗传算法找到满足约束条件全局最优语义特征,把所有语义特征进行分类,并给出分类依据.研究结果表明:此语义特征匹配算法在未知语境环境、语义特征频繁变化的环境具有很强的鲁棒性,能够在自然语言处理过程中实时准确识别段落中的语义特征.  相似文献   

6.
提出一种基于预聚类的潜在语义文献检索算法.首先,对待检索文档集进行预聚类,在潜在语义分析方法的基础上采用k-means聚类算法,寻找出各聚类簇的中心点;其次,在检索时,通过计算查询向量与各聚类簇中心点的相似度来进行检索.此方法有效解决了现有潜在语义文献检索算法在检索时需耗费大量时间计算查询向量与各文本向量之间的相似度的不足.另外还针对文献检索的特点,重新给出特征权重计算方法.实验结果表明,该方法缩短了检索的时间,提高了检索的效率.  相似文献   

7.
为了解决基于内容的图像检索(content-Based Image Retrieval,CBIR)中存在的“语义鸿沟”问题,本文提出了一种CBIR检索模型,在模型中使用了基于近邻传播的半监督聚类算法和语义传播的算法,通过近邻半监督算法对图像库中的图像进行聚类,根据示例图像的视觉特征相似度在对应的聚类图像中进行相似度检索,在检索的结果中根据用户提供的关键字进行关键字标注检索,最后根据用户的反馈,通过语义传播算法对图像库中的图像进行自动语义标注.实验表明丈中的模型是可行的,其检索效果受到反馈次数的影响.  相似文献   

8.
针对现有跨模Hash检索方法不能有效消除不同模态数据间语义差异的问题,提出一种新的基于稀疏编码Hash的检索方法,解决了图像低层视觉特征和高层语义之间的语义差异,改善了跨模检索的效果.使用稀疏编码进行跨模相似性检索,首先使用稀疏编码获取图像与文本的显著特征和隐含概念,然后将学习到的隐含语义特征映射到共同的抽象空间中,再通过迭代机制找到多模态数据特征表示间的相关性,最后通过高层语义抽象空间的量化得到统一的Hash编码.  相似文献   

9.
目前的高属性维稀疏数据算法大多面向二态数据,而且没有聚类结果的评价方法,给应用带来很大局限.针对这些问题,文中提出了一种基于知识粒度的高属性维聚类算法.首先通过设计面向数据稀疏特征的半模糊聚类算法对数据进行离散化,并基于此给出稀疏相似度和初始等价关系的定义;然后设计可变精度的二次聚类模型对初始聚类结果进行修正,使算法具有较强的抗噪声能力;最后结合应用领域定义一种新的聚类质量评价模型.实验证明,该算法可提供多粒度分析结果,准确度更高,得到的聚类结果能真实反映数据的特征.  相似文献   

10.
基于潜在语义分析的领域知识地图构建技术   总被引:1,自引:0,他引:1  
信息过载现象普遍存在于产品设计过程中,而提升信息和知识检索的准确性是解决该问题的主要手段. 领域知识地图能够为知识检索引擎提供领域知识关联信息,以提升知识检索的准确性. 针对领域知识地图的构建,提出了一种半自动化的领域知识地图构建过程. 该过程采用领域专家定义领域特征集的方法来提升领域特征集的全面性和独立性,进一步采用潜在语义分析技术(LSA)消除领域特征集中存在的语义交叉. 通过分析领域知识相似度的分布,采用优先去除中距离的策略构建最终的知识地图. 最后给出数控领域知识地图的构建过程,证明了该方法的有效性.   相似文献   

11.
针对基于流形正则化自表示(MRSR)的无监督特征选择算法直接从原始的样本空间构造相似矩阵可能会 导致重构空间中样本的相似性描述得不够准确的问题,提出了基于自适应流形正则化自表示的无监督特征选择 (AMRSR)算法。 基于自适应流形正则化自表示的无监督特征选择算法在 MRSR 算法的基础上通过对相似矩阵施 加概率最近邻约束将相似矩阵的学习嵌入到优化过程中,在重构空间中自适应地学习样本的相似性,使得在每一 次迭代中获取更加精确的样本局部几何流形结构,从而选择具有代表性且保持局部几何流形结构的特征。 最后, 在四个公开数据集上进行了大量的对比实验,通过将算法的特征选择结果用于 K-means 聚类并采取两种常见的聚 类评价指标:聚类精确度和归一化互信息评价聚类效果。 实验结果表明,AMRSR 算法与现有的一些算法相比有更 高的聚类精确度和归一化互信息,进一步表明该算法特征选择效果更好。  相似文献   

12.
一种基于语义距离的高效文本聚类算法   总被引:6,自引:0,他引:6  
摘 要:提出了一种基于语义进行文本聚类的新方法。该方法从语义上具体分析文档,利用文档具体语义计算文档间的相似度,使得文档聚类结果更合理。文本聚类主要采用最近邻聚类算法,并提出第二次聚类算法改进最近邻算法对输入次序敏感的问题。类特征词的选择上根据相似度权重优胜略汰类特征词,使得最后类特征词越来越逼近类的主题。实验结果表明本文所提出的算法在聚类精度和召回率上均优于基于VSM的K-Means聚类算法。  相似文献   

13.
一种提高文本聚类算法质量的方法   总被引:1,自引:0,他引:1  
针对基于VSM(vector space model)的文本聚类算法存在的主要问题,即忽略了词之间的语义信息、忽略了各维度之间的联系而导致文本的相似度计算不够精确,提出基于语义距离计算文档间相似度及两阶段聚类方案来提高文本聚类算法的质量.首先,从语义上分析文档,采用最近邻算法进行第一次聚类;其次,根据相似度权重,对类特征词进行优胜劣汰;然后进行类合并;最后,进行第二次聚类,解决最近邻算法对输入次序敏感的问题.实验结果表明,提出的方法在聚类精度和召回率上均有显著的提高,较好解决了基于VSM的文本聚类算法存在的问题.  相似文献   

14.
提出一种新的基于WordNet和文本集语义参数IC的计算方法,通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息,即概念的自信息,同时利用新的参数考虑概念对在WordNet中的共享信息,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题,可以应用在信息抽取、信息检索、文档分类及本体学习中.领域通用的数据集RB数据实验结果表明,该方法在计算语义相似度问题上有效。  相似文献   

15.
Single-pass is commonly used in topic detection and tracking( TDT) due to its simplicity,high efficiency and low cost. When dealing with large-scale data,time cost will increase sharply and clustering performance will be affected greatly. Aiming at this problem,hierarchical clustering algorithm based on single-pass is proposed,which is inspired by hierarchical and concurrent ideas to divide clustering process into three stages. News reports are classified into different categories firstly.Then there are twice single-pass clustering processes in the same category,and one agglomerative clustering among different categories. In addition,for semantic similarity in news reports,topic model is improved based on named entities. Experimental results show that the proposed method can effectively accelerate the process as well as improve the performance.  相似文献   

16.
基于知识的模具并行工程系统方法   总被引:7,自引:3,他引:4  
提出了基于知识的模具计算机辅助并行设计系统方法,并对并行工程系统开发过程、传统过程分析、过程重组、系统功能分析、系统建模和系统框架设计等关键技术进行研究,提出采用模糊设计结构矩阵进行产品开发过程建模和通过对模糊设计结构矩阵按信息度进行模糊排序来指导过程分解与重组,提出了基于特征的产品/模具信息模型,通过基于规则与基于事例相结合的推理机制实现知识、数据、事例等各种信息的动态集成与应用,以支持并行设计机制的实现。  相似文献   

17.
针对产品设计过程中,分散异构知识融合不足导致知识检索准确性不高、知识重用效率低等问题,提出一种知识融合模型.利用知识需求模型传递知识需求信息,采用知识元对各类异构知识进行统一表示,通过概念本体对语义概念进行有序组织,与知识元之间形成映射关系.通过语义距离计算获取候选知识元集,并采用基于贝叶斯和遗传算法的知识融合方法将分散的关联知识元融合成知识单元,实现知识重用.以覆盖件模具结构设计为案例验证了所提出方法的可行性和有效性.  相似文献   

18.
提出一种基于语义关联性特征融合的大数据挖掘算法.对云存储大数据分布式信息流进行高维相空间重构,在重构的相空间中提取大数据的语义关联维特征量,以提取的特征量为测试集进行自适应学习训练.采用模糊C均值算法进行大数据语义关联特征的稀疏性融合和聚类处理,在聚类中心实现对挖掘目标数据的指向性聚敛,输出数据挖掘结果,并采用特征压缩器进行降维处理,降低计算开销.仿真结果表明,采用该方法进行大数据挖掘的特征提取准确性较好,挖掘数据的聚类能力较强,在实时性和准确性方面具有优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号