首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了提高中文地名字段匹配的准确度,提出中文地名的相似重复检测与清洗策略和矩阵相似重复匹配方法. 该清洗策略采用矩阵相似重复匹配方法,通过矩阵运算计算中文地名数据之间相同字符或者词语出现的频率,利用频率计算两者之间的语义相似度和结构相似度,然后将语义和结构相似性有机结合,作为相似性判断和重复数据清洗的依据. 实验验证了该方法的可行性和有效性. 结果表明,该方法对于中文地名字段匹配在查准率和召回率方面优于已有的其他算法.  相似文献   

2.
一种改进的基于代价函数的地图匹配算法   总被引:1,自引:0,他引:1  
为了提高基于代价函数的地图匹配算法的效率,提出了一种减少算法计算量的方法.该方法结合地图匹配算法中的数据滤波等判决法则,合理利用已有的匹配信息,能在更小的范围内选择待匹配路段,达到减少计算量的目的.该方法在导航定位系统中具有实用意义.  相似文献   

3.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

4.
本文针对当前异构系统中存在的数据孤立问题,在对多源异构数据集成技术以及基于XML文档的异构数据集成、交换技术进行研究的基础上,设计了基于XML的异构数据集成的流程和技术路线,针对数据库与XML文档的异同,分析并设计了数据库与XML文档之间的映射和转换模型,通过应用实例描述了基于XML-QL查询语言的异构数据集成算法。  相似文献   

5.
基于概念选择和重要性度量的多模态语义融合   总被引:1,自引:1,他引:0  
根据人类认知过程的特性,提出语义选择和重要性度量的多模态融合算法. 分别在单个模态下获取语义概念,并利用相关性检测得到用于融合的语义概念,从而减少误检语义带来的扩散误差. 考虑到概率融合无法体现语义的时间特性,提出重要性度量的概念进行融合以获取高级语义. 实验结果表明,该方法能准确提取视频的高级语义信息,与其他融合算法相比时体现出良好的性能.  相似文献   

6.
针对基于稀疏扩展信息滤波的同步定位与地图创建(simultaneous localization and mapping,SLAM)问题,分析并比较了最近邻数据关联、极大似然数据关联以及联合相容性检验数据关联的原理,阐述了边缘协方差矩阵恢复的必要性.在此基础上提出一种利用Cholesky分解由信息矩阵准确恢复协方差任意元素的方法,该方法具有较高的计算效率.在仿真实验中将该方法与协方差边界估计法比较,并分别用于3种数据关联算法的比较分析,表明所提出的方法适用于多种数据关联方法,能在保证定位精度的同时有效控制算法复杂度.最后对各种数据关联算法在稀疏扩展信息滤波SLAM中的性能进行了讨论.  相似文献   

7.
针对解决具有区间语言评价信息的多属性群决策问题,提出一种基于区间二元语义信息处理的群决策方法.给出区间二元语义的定义,提出几种新的集结算子,并分析了算子的优良性质.通过定义区间二元语义比较的可能度公式,对集成结果进行排序择优,最后通过一个实例,说明该方法的可行性和有效性.  相似文献   

8.
给出了一种自然语言语义形式计算的新方法.给出了基于SNN的表层语义分析的算法,以及深层语义的定义和在SNN上的操作,并简要地介绍了其实现.实验表明这种方法是可行的.这种方法将符号主义和连接主义有机地结合在一起,是研究自然语言语义的一个新的途径.  相似文献   

9.
以BIM与3DGIS数据映射转换集成方法为主要研究内容,分别论述IFC与CityGML的语义解析描述、两者的差异以及两者间的映射转换原理,形成基于IFC向CityGML映射转换的BIM与GIS集成方法。通过测试,验证了该集成方法的可行性,实现了BIM与3DGIS间的数据共享。  相似文献   

10.
概念相似度评估广泛应用于概念分类、概念聚合、概念合并等工作中.以往面向单本体概念相似度计算模型的工作虽然集中在概念特征匹配和语义分析之上,但考虑的要素单一或考虑要素的内容不全,所以计算结果精度不高,不利于概念关系的深层挖掘.该文完善概念的共性匹配,把概念间同时不具备的特征作为共性的一部分,并对概念格中不同层次的语义特征进行加权,从而提出一种具有高精度的面向单本体的概念相似度计算模型.实验数据表明该模型具有较高的精度.  相似文献   

11.
基于粗集理论不完备数据的改进算法   总被引:1,自引:0,他引:1  
刘伟 《松辽学刊》2007,28(3):113-114,130
由于经典的粗糙集理论不能处理原始数据中的遗漏信息,需要对这些数据进行补齐才能用于知识获取.因此数据预处理在粗糙集理论应用中非常重要的一环,其结果将直接影响到粗糙集理论应用的效率、准确度.所以有关基于粗集理论的数据挖掘中数据预处理的方法研究具有非常重要的意义.本文分析了当前主要数据补齐算法的特点和不足,并针对已有的基于粗糙集理论的不完备系统补齐算法ROUSTIDA的缺陷,提出了改进的数据补齐算法,使更多的缺损数据得到填补,尽量避免可能导致的决策规则矛盾问题.  相似文献   

12.
中国资源与环境数据集成示范研究   总被引:3,自引:0,他引:3  
资源与环境数据是关于人类生存环境优劣和资源丰度、分布、利用等方面的数据,属于地球空间数据。随着社会经济的发展,对资源环境数据信息的需求与使用在不断增加,然而已存的资源与环境数据在使用上存在许多问题。该文首先分析了资源与环境数据集成一些基本问题,然后以具体示例说明了资源与环境数据集成的方法和过程。  相似文献   

13.
集成学习是一种受到广泛认可和使用的机器学习算法.为此提出一种新的多类集成学习算法,即AdaBoost belief.此算法改进多类集成学习算法AdaBoost·SAMME,使每个基分类器对于每个类别都有权重信息.这种类别上的权重被称为类别信念,可通过计算每次迭代中各个类别的正确率得到.将所提出的算法与原有的AdaBoost·SAMME算法从预测准确率、泛化能力以及理论支持等方面进行比较发现:在高斯数据集、多种UCI数据集以及基于日志的多类别入侵检测应用中,该算法不但具有更高的预测准确率和泛化能力,而且当类别数目增加,即类别更难以预测时,其分类错误率较原有AdaBoost·SAMME算法上升得更缓慢.  相似文献   

14.
描述逻辑是本体的基础,在实际应用中,描述逻辑可被扩展.介绍了描述逻辑的一种新的扩展——带比较表达式的模糊描述逻辑(FCDLs)来表示和推理语义网的模糊知识.FCDLs的语法和语义以及公理和断言也有明确的定义.FCDLs是模糊描述逻辑(FDLs)的模糊概念和扩展的模糊描述逻辑(EFDLs)的剪集概念的结合.FCDLs和FDLs一样,它也可以使用语义网上的模糊知识来表示、推理模糊本体.  相似文献   

15.
针对基于图像高层语义的检索方法问题,提出了一种基于自然场景图片语料库下的图片本体检索框架.该方法通过考虑图像内容之间的对应关系,引入人类正常图像检索过程.利用对图像内容的分块语义注释的描述,该框架解决了目前图像检索中的问题.构建好的领域本体可以用来完成定性语义描述和检索,实现了包含语义概念和空间关系的自然语言查询.最后,对该应用的有效性进行了评估,实验结果表明,该框架在检索的精确度和相关度上都表现得非常好.  相似文献   

16.
针对移动计算资源有限性、移动通信的频繁断接性和通信带宽的有限性、不同移动数据库产品之间的异构性,鉴于目前移动同步复制技术存在的缺陷,提出一种新的事务级同步复制模型,重点分析了该模型的冲突处理策略,并给出了具体的实现算法.该模型在冲突检测和消解之前加入冲突预处理机制,通过引入用户关心数据、事务相关集等概念,有效节省了移动客户端的存贮资源和移动通信带宽,减少了服务器的工作负荷和出错概率,降低了冲突检测和消解算法的复杂度.采用基于规则的冲突检测和消解策略,简化了冲突处理过程,提高了同步效率.此外,基于SyncML同步协议的实现算法具有对多种异构主流数据库产品良好的通用性和适应性.  相似文献   

17.
李成林 《河南科技》2000,(9):22-22,26
一、数据与数据处理 数据库技术是计算机软件的一个重要分支,是当代先进的数据管理技术。计算机处理的对象是数据或信息。从这个意义上说,计算机科学就是研究数据或信息的传输、存储、组织和处理的科学。 数据是一种能够由计算机处理的符号序列,它用来表示或描述客观事物或概念。为了使计算机能够对事物进行分析处理,必须将客观世界中的各种对象表示为计算机可接受的形式,即数据。也就是说,数据是客观事物的符号表示。数据一般可以分为两大类:一类是表示量值的数据,称为数值型,诸如价格、工资、长度、年龄等都属于数值型数据;另一…  相似文献   

18.
针对传统粗糙集理论难以处理数值型数据的特点,提出基于邻域熵的决策表特征约简方法.该方法通过引入邻域关系进行信息粒化,定义邻域熵概念,用来度量数值型数据的不确定性,证明邻域熵的单调性原理,提出基于邻域熵与分类精度加权的特征重要度概念,基于邻域熵单调性原理设计了两种启发式特征约简算法.理论分析与实例表明该方法是有效可行的.  相似文献   

19.
介绍了数据仓库技术的概念、特点,描述了数据仓库的关键技术,在此基础上,对数据仓库在电子商务中的地位及作用进行了探讨。  相似文献   

20.
探讨了本体技术和Web服务技术对试题库系统的支持,并提出了基于本体和Web服务的试题库应用框架结构,目的是为了让试题知识库能提供概念共享模型,建立概念语义空间,并用本体标准语言OWL进行形式化描述,从而解决知识共享和语义互操作问题,同时也为解决机器理解问题提供了一种办法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号