排序方式: 共有15条查询结果,搜索用时 171 毫秒
1.
多模态融合旨在将多个模态信息整合以得到一致、公共的模型输出,是多模态领域的一个基本问题。通过多模态信息的融合能获得更全面的特征并且提高模型鲁棒性,目前多模态融合技术已成为多模态领域核心研究课题之一。本文基于ImageNet、HowNet和CCD,通过人工标注构建了一个新的多模态知识库,已完成校准ImageNet中21 455个名词及动词概念的映射,有效地将HowNet以及CCD中概念映射到ImageNet中。该数据集能够应用于自然语言处理任务和计算机视觉任务,并通过图片信息和概念信息提高任务效果。在图片分类中,通过增加HowNet和ImageNet概念能够融合更多的图片特征来辅助分类;在语义理解中,通过映射增加图片信息可以更好地理解语义。 相似文献
2.
相对于模糊C均值算法,可能性C均值(PCM)聚类方法具有更好的抗干扰能力.提出一种基于二维直方图的改进的PCM聚类图像分割方法,该方法除了考虑图像的点灰度信息外,还考虑像素点的邻域相关信息,利用改进的PCM聚类算法得到各象素点的隶属度对图像进行分割.实验表明,该方法能够对噪声图像有效地进行分割,具有较高的鲁棒性. 相似文献
3.
针对二维Tsallis熵阈值分割法中参数q的选取问题,提出一种粒子群优化算法自适应选取参数q的方法.该方法基于一种图像分割质量评价指标—均匀性测度,利用粒子群优化算法对参数q在参数空间进行优化搜索,从而实现了二维Tsallis熵阈值分割法的自动阈值选取.实验表明,所提出的方法可以根据具体的图像有效地选取参数q,获得理想的图像分割结果. 相似文献
4.
以产科专业叙词表、临床路径和诊疗规范等为数据来源构建了中文产科知识图谱(Chinese obstetric knowledge graph, COKG)。以产科疾病为核心,依据术语标准及已有主题词表,确立了概念分类体系及关系描述体系,形成了COKG模式层;在Bi-LSTM-CRF和PCNN模型的基础上,通过医学专家的指导对多来源的200余万字非结构化文本进行人工校对,并对多源数据进行知识融合,形成了COKG数据层。所构建的COKG包括2 343种疾病、15 249个实体关系,可以为医疗问答系统和智能辅助诊疗等应用提供结构化的知识支持。 相似文献
5.
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全部词语总数等6种单位作为句子长度的计算方法进行汉英句子对齐研究.针对传统基于长度对齐算法消耗内存大、效率低的特点,提出了不受文本大小限制的分组对齐算法.实验结果表明,汉英句子对齐以词语作为长度计算单位的算法性能较高,准确率达到99.01%,召回率达到99.50%. 相似文献
6.
助词"的"用法自动识别研究 总被引:1,自引:0,他引:1
在“三位一体”虚词用法知识库的基础上, 分别采用基于规则、基于CRF模型和神经网络模型的门循环单元, 对助词“的”用法进行自动识别, 识别的准确率分别为 34.4%, 77.5%和81.3%。在对助词“的”用法进行分析的基础上, 合并了部分用法, 并采用CRF模型和神经网络模型进行粗粒度用法识别, 准确率分别达到81.8%和 84.5%, 得到较明显的提高。期望识别结果可以应用于其他自然语言处理任务中。 相似文献
7.
副词"也"在现代汉语中的使用频率很高,用法也较为复杂,其用法的自动识别对语义理解及句法分析有着重要意义.在已构建的副词"也"用法词典、规则和用法标注语料的基础上,分别采用了规则和统计的方法对副词"也"的用法进行了自动识别,实验结果显示微平均准确率分别为55.20%、62.48%;进而对规则识别结果和统计识别结果进行分析,采用多种方式,依据用法在语料中分布率、规则方法及统计方法识别的准确率以及分布率和准确率的综合等多种方式,将规则和统计结合起来进行用法自动识别,多种结合方式中最高微平均准确率达到了69.95%. 相似文献
8.
在基于规则介词用法自动识别中,使用规则的不同顺序可以得到不同的用法识别准确率.对规则进行全排序并进行用法自动识别可以得到用法识别准确率最高的最佳排序方案,但是时间复杂度较高.首先对全排序的结果进行筛选,然后用筛选之后的结果进行用法自动识别则可以大大降低时间复杂度.实验结果表明,这种方法可以以较小的代价找到接近最佳排序的方案. 相似文献
9.
垃圾短信已日益成为影响人们日常生活的严重问题,由于短信属于短文本,长度较短,特征稀疏,尤其是垃圾短信为逃避过滤机制,其结构和内容常常不规范,所以传统的文本特征提取方法并不能完全适用于短信分类。从短信的结构及语义两个角度提取特征项,并建立语义特征词表,采用基于多特征融合的方法来向量化表示短信文本。针对短信数据集中存在的噪声及数据不平衡问题,分别比较了NB、SVM、DT、LR、MLP、RF分类器的性能差别。实验表明,采用RF分类算法,能有效减弱噪声干扰及数据不平衡性所带来的影响。通过在CCF 2015中国好创意竞赛题目“垃圾短信基于文本内容识别”所提供的数据集上进行验证,取得了很好的效果。 相似文献
10.
命名实体在文本中是承载信息的重要单元,而微博作为一种分享简短实时信息的社交网络平台,其文本长度短、不规范,而且常有新词出现,这就需要对其命名实体进行准确的理解,以提高对文本信息的正确分析。提出了基于多源知识的中文微博命名实体链接,把同义词词典、百科资源等知识与词袋模型相结合实现命名实体的链接。在NLP&CC2013中文微博实体链接评测数据集进行了实验,获得微平均准确率为92.97%,与NLP&CC2013中文实体链接评测最好的评测结果相比,提高了两个百分点。 相似文献