首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
基于统计规则的交集型歧义处理方法   总被引:1,自引:1,他引:0  
中文分词是中文信息处理的基础, 歧义问题是中文分词的一个难点, 而交集型歧义问题占歧义问题的90%以上, 因此对交集型歧义问题的研究是中文分词研究的一个重点. 通过反复的实验和对实验结果的分析, 提出了5条规则, 并根据这5条规则给出了一种针对交集型歧义字段切分的算法, 实验结果表明, 基于该算法实现的分词系统DSfenci, 对于交集型歧义消解的准确率高于95.22%.  相似文献   

2.
张可 《衡阳师专学报》1996,17(5):106-108
汉字输入中文信息化的关键。汉字编码输入是集汉字研究和计算机技术为一体的科研成果;利用汉字的字形、字音编码输入方法,有易学易记的特点,能很快掌握。  相似文献   

3.
在讨论水书异体字的翻译特点和形式化描述的问题后提出水书异体文字机器翻译的一种自动获取方法SSRA(语义相似性规则算法).该方法运用词类关联性和语义相似性原理并引入机器学习技术,然后对水语形式化描述后进行语言计算,最后构造决策二叉树,使系统能够在词类获取后进行异体字自动识别翻译,在现实中本方法与水汉电子字典系统的结合运用表明此方法有效.  相似文献   

4.
文本挖掘中中文歧义字段的自动分词是计算机科学面临的一个难题.针对汉语书写时按句连写,词间无间隙,歧义字段分词困难的特点,对典型歧义中所蕴含的语法现象进行了归纳总结,建立了供词性编码使用的词性代码库.以此为基础,通过对具有特殊语法规则的歧义字段中的字、词进行代码设定,转化为神经网络能够接受的输入向量表示形式,然后对样本进行训练,通过改进BP神经网络的自学习来掌握这些语法规则.训练结果表明:算法在歧义字段分词上达到了93.13%的训练精度和92.50%的测试精度.  相似文献   

5.
一种基于SVM和规则消除组合型歧义的算法   总被引:2,自引:0,他引:2  
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径.  相似文献   

6.
在分词过程中如何处理歧义切分是中文分词算法要解决的难点之一.文中提出了一种改进的基于词典和基于统计的组合中文分词算法,能够发现并处理交集型歧义,该算法在发现歧义的过程中没有采取传统的双向匹配法而是采用双栈的结构,减少了匹配花费时间,并分别采取长词优先和最大概率方法处理一般的交集型歧义和特殊的同词长交集型歧义.最后通过实例对文中所提出的算法进行实验验证,结果表明该算法比传统的分词算法有更好的准确率.  相似文献   

7.
针对FSS-LMS算法推理机制不全和算法运算量大的问题,提出了一种新的受ELSE规则支配的模糊LMS算法.ELSE规则的存在使得在任何输入数据条件下都能成功执行推理机制,而且运算量大为减少.与其它模糊LMS算法相比,该算法所建立的模糊规则更加简单和可靠.实验结果表明,该算法不仅具有更少的计算量,而且比其它的模糊LMS算法以及其它传统的LMS算法具有更好的性能.  相似文献   

8.
提出一种利用规则与统计相结合的方法用于英汉机译系统中以消解语义级歧义 ,建立了一种根据单词之间的词语搭配关系以消除歧义的模型。该模型利用英汉双语语料选择合理的词组语义 ,对有歧义的单词作出标注。在此基础上给出了语义消歧的学习算法 ,并建立了一套有效的提高召回率的消歧算法。算法在英汉机译系统中的实际应用使正确率提高了约 10 % ,效果显著。  相似文献   

9.
针对计算机各语言间的无岐义映射问题, 提出一种从自然语言向SPARQL语言映射过程中的歧义消解算法. 该算法基于自然语言的特征, 拟合知识丰富程度和文本相似度消解实体映射过程中的歧义性, 拟合语义权重度和文本相似度消解关系映射过程中的歧义性. 实验结果表明, 该算法效果较好.  相似文献   

10.
提出一种新的基于知识编译的模型计数方法——MTREE.该方法以一个否定范式(NF)作为输入,利用命题表推演过程,结合香农扩展和简化规则,将输入的否定范式编译成与之等价的R-模型树,在R-模型树上应用多项式时间算法求出其模型个数,即为原输入NF的模型个数.严格证明了该算法是完备有效的.  相似文献   

11.
在分析湘西方块苗文的结构特点及其构件拆分方法的基础上,提出了一种基于构件汉语拼音全部字母的输入编码方案,设计了输入法编码映射表;并以多多输入软件生成器为工具,实现了基于Windows IMM-IME结构规范的湘西方块苗文输入法软件及其安装程序.测试结果表明,基于上述输入编码方案的苗文输入法易学易用,能够有效地解决湘西方块苗文的计算机输入问题.  相似文献   

12.
针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务, 使用CCF提供的新浪微博数据作为训练和测试数据, 利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具, 提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法, 提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法。在2013年CCF 中文微博实体链接评测任务中正确结果的准确率为0.8838, 在10 个参赛队伍中名列第3位。表明该方法有效并可以适应文本中的噪声。  相似文献   

13.
为有效提高方块苗文的输入速度,提出一种方块苗文输入的音形编码新方法,并用上下文无关文法给出该方法的形式化定义.该方法是将方块苗文输入编码序列设计为“2个音码+2个形码”的4码形式,与文字本身读音无关.音码由方块苗文首构件和末构件的汉语拼音首字母决定,形码由方块苗文本身的末笔画名称和结构类型名称的汉语拼音首字母决定.测试实验结果表明,较之前期已实现的方法,该方法不但简单规范、易学易用,而且具有更低的重码率、更快的输入速度和更高的输入正确率.  相似文献   

14.
地震波动输入方法对高土石坝地震反应影响研究   总被引:2,自引:0,他引:2  
将地震波动输入方法引入高土石坝地震反应分析程序,讨论了该方法在坝体与地基之间相互作用及无限地基辐射阻尼的模拟效果.为探讨地震波动输入方法对高土石坝地震反应的影响,从地震波频谱特性、坝体高度和地基模量三个方面开展了研究工作.分析结果表明:与传统的一致输入方法相比,地震波动输入方法可以考虑无限地基辐射阻尼的影响,并合理地反映出坝体与地基之间相互作用的变化规律;当高频含量较多的地震波作用时,传统一致输入模型与所提出地震波动输入模型的数值结果差异相对较大;两类模型数值结果的差异区域会随坝体高度的增加逐渐增大;地震波动输入方法可以较好地反映出地基模量变化对坝体与地基之间相互作用的影响.  相似文献   

15.
在研究和分析藏文拼写文法的基础上,对计算机藏文快速输入法键盘键位布局进行形式化描述,推导计算机藏文键盘键位布局规则及方法。综合考虑藏文字符的字频统计结果、计算机藏文键盘键位布局规则、德沃拉克键盘键位击键方便指数以及为了便于记忆加以考虑的藏文字母与英文字母发音上的近似性,设计一种能够实现藏文无重码快速输入的键盘键位布局。最后,计算输入一个藏文字的平均击键数,验证所设计的键盘键位布局比现有的输入法键盘键位布局更具科学性。  相似文献   

16.
A high-speed and effective packet scheduling method is crucial to the performance of Gigabit routers. The paper studies the variable-length packet scheduling problem in Gigabit router with crossbar switch fabric and input queuing, and a scheduling method based on neural network is proposed. For the proposed method, a scheduling system structure fit for the variable-length packet case is presented first, then some rules for scheduling are given, At last, an optimal scheduling method using Hopfield neural network is proposed based on the rules. Furthermore, the paper discusses that the proposed method can be realized by hardware circuit. The simulation result shows the effectiveness of the proposed method.  相似文献   

17.
针对具有未知输入的线性系统讨论了基于迭代控制思想的未知输入观测器设计方法.针对每一步迭代,由于当前未知输入已知,因而可以通过设计常规的Luenberger观测器得到当前步的状态估计和输出估计.在此基础上采用D-型迭代学习控制的思想,通过当前输出步误差和未知输入估计值提出下一步的未知输入的迭代估计方法,并利用此次未知输入估计值再次设计Luenberger观测器估计下一步的状态.之后,对迭代算法的收敛性进行了分析,并给出了迭代算法收敛的充分条件.最后,对一个实际模型进行仿真,验证了算法的有效性.  相似文献   

18.
通过理论推导,获得了线性多自由度体系输入能与其等效单自由度体系输入能之间的关系,并以高层框架筒体结构为对象,研究了线性多自由度体系输入能的简化计算方法,以及非线性多自由度体系输入能与线性多自由度体系输入能之间的差异,探讨了地震波以及结构特征对这一差异的影响.研究表明,对于筒体结构而言,采用前3阶等效单自由度输入能之和即能对结构的弹性输入能作比较准确的估计.对于周期小于1 s的短周期结构,塑性的发展所导致的周期变大将使得输入能趋于增加;而对于周期较长的高层结构,塑性的发展与自振周期的变大会使得输入能趋向于降低.  相似文献   

19.
郭云东  孙有朝 《科学技术与工程》2021,21(27):11843-11849
飞机驾驶人为差错是导致飞行不安全事件/事故的重要因素之一,为有效预测飞机驾驶人因可靠性,减少人为差错,确保飞行安全,提出一种基于FBCREAM方法的飞机驾驶人因可靠性评估模型。考虑飞机驾驶的情境环境及人因特征,调整原始认知可靠性与失误分析方法(CREAM)中的人为差错形成条件使其更合理地表征驾驶舱中飞行员工作情境。引入模糊逻辑方法,利用隶属函数对人为差错形成条件的不确定性和模糊性进行建模。以人为差错形成条件的隶属度为输入参数,人为差错模式隶属度为输出构建贝叶斯网络模型,通过解模糊化方法计算人为差错概率精确值。选取单发故障情境环境下执行飞行任务进行实例分析,结果表明该方法能够准确评估飞机故障情境环境下的飞机驾驶人因可靠性,可为航空安全评估提供有效的工具和重要支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号