首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 687 毫秒
1.
在当前互联网大数据时代,网络文本中蕴含着丰富的地理位置信息,能为智能位置服务等应用提供了重要的数据来源.因此如何从非结构化的网络文本中自动化识别和提取地理位置信息,实现文本到地图的空间化,是传统空间测绘的重要补充.综述了从文本位置信息提取到空间化过程中关键任务的研究进展,包括地理实体识别、空间关系识别、地名消歧和空间关系可视化等,对比分析各个关键任务中的重要方法及模型的优缺点.  相似文献   

2.
针对传统的基于向量的中文文本表示方法预处理过程比较复杂,应用于高维数据容易产生维数灾难的局限性,文章提出了一种基于张量空间模型的中文文本分类方法,用三阶张量表示文本集,将基于向量的kNN分类器扩展到张量上以构建分类器。该方法简化了预处理过程,提高了准确率,并使得更多张量学习方法能够在中文文本分类中得以应用。实验证明其具有较高的分类准确率,有一定的实用价值。  相似文献   

3.
针对垃圾文本识别计算的需求特性,应用VSM文本聚类算法思想,综合现有TFIDF算法特点,提出一种基于VSM和改进的TFIDF特征项提取算法.本方法在对垃圾文本高聚类特征项权值进行放大的同时,有效减小由二类数据样本数量偏差对计算结果带来的影响,提高了垃圾文本过滤识别效率和准确率.为垃圾文本识别提供了一种新的改进算法选择.  相似文献   

4.
基于空间短文本对象的检索策略   总被引:1,自引:0,他引:1  
针对传统空间文本检索策略中的效率和有效性问题, 对如何从给定的空间文本对象集合中快速有效地检索出top-k个近似结果进行研究。基于一个空间检索的通用框架, 提出一种基于空间文本对象的快速策略, 用于满足用户对效率与有效性的要求。实验结果证明该策略优于现有方法。  相似文献   

5.
阵列结构型空间碎片光电望远镜(SDPTA)具有通用性强、视场大、单元众多、覆盖空域广、可靠性高等优点,针对国内首台阵列结构型空间碎片光电望远镜产生的大量观测数据无法识别的问题,提出一种基于两行轨道根数(TLE)数据的快速匹配识别方法。通过计算北美防空司令部(NORAD)发布的TLE数据对阵列结构型空间碎片光电望远镜的观测数据关联比对,用以识别空间碎片;并利用CPF(consolidated prediction format)星历的数据对已识别的数据中的激光星进行外符精度分析,检核识别准确性并对该阵列结构型空间碎片光电望远镜观测精度进行分析。经计算,该阵列结构型空间碎片光电望远镜外符精度为7. 9″。计算分析表明,利用TLE数据对未知碎片进行识别的方法准确有效,望远镜的观测精度达到了设计指标。  相似文献   

6.
刘红芝 《科技信息》2009,(32):36-37
本文首先介绍了信息过滤技术的提出背景、概念、传统向量空间模型存在的问题。针对中文文本层次结构的特点,提出了基于N层向量空间模型中文文本过滤的方法;在引入了用户主题不相关配置文件和不相关阀值的基础上提出了一种两重过滤方法。随后给出了基于N层向量空间模型中文文本过滤系统的原理。  相似文献   

7.
空间分类既要考虑待分类对象的非空间属性,还要考虑其空间邻接对象非空间属性对分类的影响.提出一种基于多关系的朴素贝叶斯空间分类算法,算法将多关系分类方法用于空间分类,考虑了不同近邻对象的非空间属性对分类产生的影响,其分类准确率高于单关系朴素贝叶斯空间分类算法.算法可以用于空间数据库中的大数据集,不需要复杂的数据预处理.  相似文献   

8.
针对国内自然语言处理领域地名识别存在的缺点,提出一种基于本体的中文地名识别方法.该方法借助文本工程通用框架GATE,引入构建的地名本体,识别文本中中国县及县以上行政区划地名,使之与地球表面具体的地理位置相对应,进而赋予它们地理坐标和地理语义.重点讨论地名本体的构建、地理解析及地理编码过程中geo/non-geo,geo...  相似文献   

9.
图像空间关系特征描述   总被引:1,自引:0,他引:1  
图像目标空间关系的描述是基于内容的图像检索中的关键技术,通过空间位置关系识别事物更符合人们的习惯.回顾并比较了图像中的目标空间关系的特征及描述方法,指出了存在的问题,并提出了改进的建议.  相似文献   

10.
对振动信号的随机状态空间模型,利用数据驱动随机子空间识别的计算理论得到结构的状态矩阵A.为克服状态矩阵的多样性问题,构造非奇异线性变换矩阵T,将状态矩阵转换为能控标准型,利用状态矩阵能控标准型中参数向量的向量角作为结构异常指标,对结构进行异常识别.数值实验验证了该方法的有效性.  相似文献   

11.
公共空间模式(CSP) 分析由于具有变换简单、实现快速等优点,被广泛应用于信息挖掘、脑电信号处理等大数据处理应用中.本文以基于脑电信号的人类认知状态分类识别为背景,研究一种基于Fisher 分数(Fscore)的特征评价与选择的CSP 构建方法.利用F-score 计算代价小、可以快速从高维数据中选择出有效信息和特征的优点,实现了对模式重要程度做出定量的表达;针对F-score 阈值确定困难、信息冗余、无法自适应实现等难点问题,提出了相应的解决方法.所提出方法在脑认知活动解析实验中,针对五类认知状态分类问题取得了92%的识别准确率.本方法为大数据的公共模式挖掘等问题供了一个强有力的新工具.  相似文献   

12.
在马克思主义文本与现实的对话空间中,文本与现实是两个基本的研究命题,无论是文本现实化,抑或现实文本化,皆是新时代马克思主义基本理论研究的两个重要方向。基于新时代马克思主义话语场域,在知行合一的原则须首先科学认识马克思主义文本对话现实的关系空间,从马克思主义利益观视角解构文本与现实对话的价值空间,进而在把握社会主义现代性问题的过程中拓展文本对话现实的新的发展空间。  相似文献   

13.
基于概率潜在语义分析的中文文本分类研究   总被引:1,自引:0,他引:1  
概率潜在语义模型使用统计的方法描述"文档—潜在语义—词"之间的概率分布关系,其实质是模拟了潜在的概率语义空间,并将文档和词映射到同一个语义空间.该文将概率潜在语义分析模型用于中文文本分类,一方面较好地处理了自然语言中的同义、多义问题;另一方面通过计算概率潜在语义空间中向量的距离来获得文档间的类别信息从而达到文本分类的目的.实验结果表明,该分类器具有良好的分类性能.  相似文献   

14.
在构造仿射矩阵时,满足稀疏性就会降低其分组效应,反之,又不利于数据的选择.针对这些问题,提出投影相关自适应子空间分割方法.通过引入迹lasso,自适应地根据样本数据的相关性构造仿射矩阵,同时提取出有利于类别识别的特征.在6个基因表达数据上的实验结果表明,该方法优于现有子空间分割方法.  相似文献   

15.
一种基于相交关系的GML空间聚类算法   总被引:1,自引:0,他引:1  
提出一种基于相交关系的GML空间聚类算法SCIR,该算法以GML数据作为数据源,计算空间对象的相交关系,针对空间对象的相交关系和非空间属性,定义了一种相似度度量方法,利用ROCK算法进行聚类.实验结果表明,算法SCIR能实现GML数据中基于相交关系的空间对象聚类,并具有较高的效率.  相似文献   

16.
基于LSTM的中文文本分类方法能够正确地识别文本所属类别,但是其主要关注于学习与主题相关的文本片段,往往缺乏利用词语其他方面的信息,特别是词性之间的隐含的特征信息。为了有效地利用词语的词性信息以便学习大量的上下文依赖特征信息并提升文本分类效果,提出了一种结合词性信息的中文文本分类方法,其能够方便地从词语及其词性中学习隐式特征信息。利用开源数据并设计一系列对比实验用于验证方法的有效性。实验结果表明,结合词性信息的基于注意力机制的双向LSTM模型,在中文文本分类方面的分类效果优于常见的一些算法。因此识别文本的类别不仅与词语语义信息高度相关,而且与词语的词性信息有很大关系。  相似文献   

17.
自然场景的文本识别在深度学习的推动下发展迅速,但是大多数文本识别算法都无法在低分辨率条件下使用,为了解决这个困境,本研究将超分辨率重建技术作为预处理手段加入到文本识别中,并提出一种针对文本识别领域的超分辨率重建网络,利用像素级注意力机制使超分辨率重建网络专注文本相关信息,同时利用文本识别网络的先验信息构建感知损失,辅助超分辨率识别网络的训练,将低分辨率图片的识别率从66.38%提升到78.99%.  相似文献   

18.
针对空间文本对象流和订阅流的匹配,采用一种混合索引树来组织数据对象,包括多叉树空间索引、谓词索引和倒排文件三个部分,其中多叉树空间索引用于空间区域管理,谓词索引和倒排文件用于订阅谓词管理.在此基础上,提出了谓词索引建立算法、空间文本对象与倒排项匹配算法和混合索引树检索算法.与基于空间网格加倒排文件的检索方法进行了对比实验,结果表明:所提出的算法提高了用户的检索效率,并验证了其有效性.  相似文献   

19.
基于空间关系的概念邻域,研究了空间实体多尺度表达中空间关系变化程度的比较和计算问题.首先从数字景观多尺度表达的角度对空间关系包含的拓扑关系、方位关系、距离关系分别建立了具有适当空间关系分辨率的概念邻域结构,其次,基于已建立的空间关系概念邻域给出了多尺度对象空间关系差异程度的集成表达和度量方法,从而得出了空间关系相似度的计算公式,最后结合实验数据的分析和计算,证明了该空间关系相似度集成表达模型和计算方法的合理性及适用性.  相似文献   

20.
土壤特性的空间差异及其空间插值方法研究   总被引:9,自引:0,他引:9  
对土壤养分的空间差异及其空间插值方法进行研究,获得田间土壤养分的连续空间分布,是精准农业技术体系中用GIS管理和分析土壤背景数据的一项基础性工作.本研究对一块面积为28533m2的旱地以30m×30m间隔采样,获36个有关土壤速效钾、速效磷和有机质含量的采样数据.用移动平均、趋势面拟合、点状克立格、逆距离加权等空间插值方法得到各种插值的连续空间分布,与同期用15m×15m采样间隔所得132个实际观察数据进行比较,结果表明几种插值方法并无显著差异,但其中以克立格和逆距离加权插值整体效果最好,尤以克立格指数模型最佳.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号