首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 148 毫秒
1.
提出了一种在构造内部规则和外部规则的同时采用概率统计的中文地名实体的识别方法,并利用这种基于规则和统计相结合的方法对测试语料库进行识别测试,实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性.  相似文献   

2.
新兴媒体时代的发展使大量的信息涌入了我们的视线和大脑,广大网名用户在面对网上的信息时需要找寻符合自己的资料,在这种情况下,信息抽取发展起来了。国内的信息抽取技术起步时间较短,又由于中文信息的复杂性,所以在中文信息抽取领域,此技术还不是特别的成熟。在本文中,作者对基于规则的中文人名抽取技术进行了初步探索和研究。  相似文献   

3.
提出了一种基于统计与规则相结合的藏文人名自动识别方法.该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述.根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时,采用姓氏驱动的方法,很好地解决了藏文文本中汉族人名的识别问题.实验结果表明,该方法具有较高的准确率和召回率.  相似文献   

4.
如何将旧币分离出来是银行、金融等机构中一项非常重要的工作.针对旧币分离问题,本文提出了基于统计特征的旧币分离算法.首先根据纸币统计特征构建训练样本集,包括纸币灰度值图像的标准差和间断强度等;其次在训练样本集上构建学习向量量化神经网络模型,建立输入与输出之间的关系.仿真实验结果表明,文中算法提高了分离正确率.  相似文献   

5.
基于综合统计特征的Skype流量分析与识别   总被引:9,自引:0,他引:9  
首先对Skype通信机制进行了深入研究,并在此基础上提出了基于流统计特征和静荷统计特征的Skype流量识别策略,然后综合分析上面两种方法的优缺点,提出了基于综合统计特征的Skype流量识别方案,并设计出基于综合统计特征的Skype流量识别系统模型,最后设计并实现了相应的实验系统时相关结论进行验证。  相似文献   

6.
针对中文机构名实体的识别提出了利用隐马尔科夫统计模型的方法.同时,在此方法的基础上通过构建一元模型来补充识别那些缩写的和没有核心词的机构名,弥补了单一统计模型在机构名实体识别中的不足.实验证明二者相结合的方法能获得较高的准确率和召回率,具有可行性.  相似文献   

7.
方芳 《咸宁学院学报》2012,32(1):47-48,64
数量名短语的自动识别是中文信息处理中短语识别的重要内容,对汉语深层次句法分析和语义分析将起到很重要的作用。本文对"数.量.名"、量词重叠的数量名短语进行自动识别,以量名搭配概率为基础,提出了基于变长后缀匹配的后退算法来发现更多的量名搭配,把召回率提高了40个百分点。我们在240万字的当代新闻小说语料上进行了识别试验和测试,结果显示,达到80%左右的调和平均值。  相似文献   

8.
通过对中文机构名的语法语义特性进行分析,将中文机构名分成前部词和特征词,提出了一种基于统计的识别方法.使用成熟语料库的训练数据,计算候选机构名的特征词可信度、前部词首词可信度和前部词中部可信度,最终得到机构名构词可信度,并与给定阈值比较,实现了中文机构名识别.在开放性实验中,达到了85.57%的召回率和94.37%的准确率.  相似文献   

9.
为获得说话人发音特征,基于仿生思想,提出一种基于语谱图统计的方法,通过对说话人短时语谱图的线性叠加获得可表征说话人稳定发音特征的特征语谱图。为解决资源受限的设备中说话人识别系统网络训练速度慢、识别效率低的问题,基于传统自组织映射(self-organizing feature map,SOM)神经网络提出了一种自适应聚类SOM (adaptive clustering-SOM,ACSOM)算法,随着待识别说话人数的增加,自动调节增加竞争层神经元个数,直至聚类数达到说话人个数。采用该AC-SOM模型对100人的自建特征语谱图样本库进行聚类识别,最大训练时间只需304 s,最大单张识别时间小于28 ms;在识别人数相同时,相对于所对比的其他识别方法,该方法大大提升了网络训练速度和识别速度,满足了边缘智能(edge intelligence)系统中对数据处理与执行的实时性的要求。  相似文献   

10.
副词"也"在现代汉语中的使用频率很高,用法也较为复杂,其用法的自动识别对语义理解及句法分析有着重要意义.在已构建的副词"也"用法词典、规则和用法标注语料的基础上,分别采用了规则和统计的方法对副词"也"的用法进行了自动识别,实验结果显示微平均准确率分别为55.20%、62.48%;进而对规则识别结果和统计识别结果进行分析,采用多种方式,依据用法在语料中分布率、规则方法及统计方法识别的准确率以及分布率和准确率的综合等多种方式,将规则和统计结合起来进行用法自动识别,多种结合方式中最高微平均准确率达到了69.95%.  相似文献   

11.
近十年来,已知分布于我国的苦苣苔科植物物种数猛增至719种(含种下等级,截至2019年1月),其中有大量的新发表类群。然而,这些新发表物种中,有相当多的一部分发表在国外相关学术期刊上,缺乏中文名的拟定,而且很多甚至在发表的时候就未对其拉丁学名的词源进行诠释。同时,由于近年来分子系统学背景下的科内属一级水平上发生巨大变动,国内不同学科的期刊在发表涉及苦苣苔科植物的文章时,不仅在学名的正确应用上存在一定的滞后和障碍,同时其新旧中文名的更迭以及近年来新分类群中文名拟定的随意性,也给国内该科植物物种多样性及相关的研究带来一定困难。因此,本文尝试梳理和规范苦苣苔科植物的中文名命名规则,以便中国苦苣苔科植物生物多样性研究和实际应用上的使用。这一规范的建立,不仅适合于现在已基本完成的苦苣苔科植物新分类系统,即便是未来在属一级水平上再次进行重组或修订,本规范依然能够适应且能让后来研究者更好地了解苦苣苔科植物的分类和修订历史。  相似文献   

12.
研究了分布式证据的区域性与置信度问题,发现即使在证据源可靠的情况下,随着与证据源间距离的增大,证据权威性将逐渐减小,传统D S理论会给出悖离常理的结论·解决这一问题可以使用距离函数来衡量证据的有效性,并将其引入mass函数,描述其变化规律·将来自不同观测点的原证据进行换算后再进行组合,通过实验与传统D S理论的比较表明,对分布式观测点外的广泛区域进行可能性估计时,所提方法比传统D S规则具有更强的适应性·  相似文献   

13.
农业旅游的概念既关系到农业旅游理论体系的构建,也与农业旅游的健康发展紧密相关,一直是学术研究的热点和难点.由于其内涵的复杂性和研究角度的分散性,国内外现存的关于农业旅游的概念数量众多,分歧较大.选取国内外农业旅游研究文献中出现的50个有影响力的概念作为研究样本,利用霍尔斯提公式进行信度检验,提炼出国内外农业旅游概念中出现频率最高的4个指标:以农村风貌为吸引;以农业生产经营活动为吸引;一种旅游形式或活动;以娱乐、教育为目的.最后将农业旅游的概念界定为以农村风貌或农业生产经营活动为吸引,以娱乐、教育为目的的旅游活动.  相似文献   

14.
可修复系统可靠性统计分析   总被引:1,自引:1,他引:1       下载免费PDF全文
常规可靠性统计分析要求样本从同一母体抽取且为独立同分布。但是可修复系统的母体难以保持不变,样本独立同分布的要求也难以满足。如何判别样本是独立同分布?针对此问题,本文讨论了样本独立同分布的检验,并以平均寿命为例,对样本独立同分布和非独立同分布条件下可靠性统计分析进行了讨论。  相似文献   

15.
基于仿真的调度规则组合决策研究   总被引:3,自引:0,他引:3  
针对车间调度规则组合的多目标优化问题,提出了一种基于仿真的评估决策模型. 通过仿真获得不同调度规则组合下的方案集合,在利用层次分析法获得性能指标权重的基础上,采用灰关联理论计算各结果方案对于单项指标的关联系数,实现了基于灰色关联度的方案评估,并导出了最优的调度规则组合. 调度规则组合决策体现了用户对系统性能指标的要求,解决了传统依靠经验进行调度规则选取的问题,优化了制造系统的运行.  相似文献   

16.
提出了一种基于Alexa的网站访问统计系统的设计与实现方法,该系统利用了XML、Hibernate等技术实现了数据的采集和分析,能自动记录和统计网站的访问情况,为网站评测提供科学依据.  相似文献   

17.
统计7万余个人名运用的字种数、频率及字调分布,分析可知人名命名具有较强的文化传承性、相对的性别区别性、较为稳定的时代性、和谐悦耳的音乐性等特性,并分析了人名用字"华"字高频率使用的原因。  相似文献   

18.
设计了一个中文姓名抽取系统, 该系统采用神经网络进行汉语句子的分词处理, 根据姓名后置特征词进行姓名的抽取, 成功解决了尾字和下文成词的姓名抽取问题. 以1998年1月份《人民日报》语料库中含有此类姓名的语句作为测试数据,结果表明, 姓名抽取的召回率和精确度较现有方法都有很大提高.  相似文献   

19.
提出了一种加权的关联规则CWA priori算法,在数据挖掘过程中,充分利用决策属性在挖掘中的作用,清洗掉数据源中无价值或价值较小的记录,从而达到节省程序运行时间和空间的目的。给出了CWA priori算法的描述,开发设计了基于该算法的A S-M in ing门票分析系统,该系统在项目单位正常运行使用。实践证明:发现的知识模式对公司的门票销售决策具有一定的实用参考价值,同时在节省程序运行资源方面也取得了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号