共查询到19条相似文献,搜索用时 93 毫秒
1.
汉语自动分词的研究现状与困难 总被引:31,自引:0,他引:31
汉语自动分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础研究课题。尽管已被研究了二十多年,分词仍然是中文信息处理的瓶颈问题。基于对汉语自动分词研究的现状分析,构建了自动分词的形式化模型,论述了影响分词的诸多因素,分析了分词中存在的两个最大困难及其解决方法。最后指出了目前分词研究中尤其是在分词评测方面存在的问题以及未来的研究工作。 相似文献
2.
3.
分布交互仿真/高层体系结构中作战想定的可视化生成系统 总被引:9,自引:3,他引:6
对DIS/HLA中作战想定的可视化生成和加载进行了研究,着重分析了基本模型的管理,模型的实例化参数化,代码自动生成,文档自动生成以及模型数据的自动加载等。并研究了实体模型的可重用性和作战想定可视化生成系统的互操作性。最后针对导弹攻防对抗仿真系统开发了作战想定的可视化生成系统,它基于高效的数据管理方法并提供对信息管理系统的无缝连接,论文不仅研究和实现了作战想定的可视化生成系统,,同时为DIS/HLA的各种支撑系统的可视化研究提供了重要的参考依据。 相似文献
4.
军用文书自动生成是C4ISR系统中的关键技术之一 ,是提高指挥效能必不可少的重要环节。通过系统分析 ,阐明了C4ISR系统中军用文书生成系统的一个重要发展方向是基于自然语言处理的文书自动生成 ,并根据军用文书生成过程中的信息流向 ,提出了该系统三模块的结构模型 :信息理解模块、文书信息库模块、文书生成模块 ,进而描述了这三个模块的整体运作流程。该模型对其他领域中基于自然语言理解的文本生成系统也有参考价值。 相似文献
5.
6.
7.
一种将Simulink/Stateflow模型改造成HLA成员的方法 总被引:10,自引:5,他引:5
介绍了将Simulink/Stateflow模型改造成HL成员的意义,方法和过程,对Simulink/Stateflow模型转化为HLA成员的机理,以及实现过程中的关键技术,包括模型外部接口的对象化封装,HLA外壳程序(HLA-wrapper),基于Simulink/Stateflow的仿真成员的程序结构,运行时间接口(run-time interface)调度程序的修改,模型运行时间的管理作了阐述,并描述了一个自行开发的将Simulink/Stateflow模型自动转化为HLA成员的软件工具SMIT(Simulink Model Import Tool),包括其用例描述(use-case0,程序结构等。 相似文献
8.
基于详细水机电模型的水电系统动态过程仿真 总被引:6,自引:0,他引:6
水力系统与电力系统模型精度失配、缺乏合理全面的水机电数学模型是制约水电系统动态过程仿真质量提高和应用范围扩展的主要原因。本文建立了适用于水机电联合仿真的详细水机电整体模型,该模型包括基于管道结构特征自动建立的复杂水系统弹性水击模型,差动式、阻抗式和圆筒式调压井通用模型,水轮机非线性解析模型,调速器模型,计及阻尼绕组作用的同步发电机与电网模型,励磁系统模型等,提出了联合求解弹性水击波过程和并网机组机电动态过程的数值算法。对具有复杂水系统的单机无穷大系统短路扰动过程进行仿真,结果合理可信,证实了水机电数学模型和数值方法的有效性。 相似文献
9.
提出了一种基于DMC预测控制历史数据智能建模基础上的自动补偿方案,该方案适用于参数摄动的时滞对象。仿真研究表明,该补偿算法能明显改善系统增益失配的控制效果,对同时存在增益、时滞失配的系统也有一定效果。由此,我们能在一定程度上降低对被控对象模型的测试要求,增强系统控制的鲁棒性,从而拓宽了DMC预测控制的适用范围。 相似文献
10.
11.
结合词性分析与串频统计的词语提取方法 总被引:4,自引:1,他引:3
在介绍分析现有主要提词方法的基础上,提出并实现了一种结合词性分析与串频统计的词语提取方法.文章首先详细描述了该方法的原理与框架,同时结合实例说明了其实现过程.然后将该方法与已有的具代表性的文本提词方法作计算结果的对比分析,结果表明该方法能够提取得到电子文档中包括原子词与合成词在内的所有词语,并且准确率与召回率较之前的方法均有很大提高.优良的自动提词结果能够保证文本自动处理的性能,进而促进相关领域的自动化程度与性能的提高. 相似文献
12.
Liu Gongshen Li Jianhua & Li ShenghongSchool of Information Security Engineering Shanghai Jiaotong University Shanghai P. R. China 《系统工程与电子技术(英文版)》2005,16(1)
1.INTRODUCTION Therearemanycommonproblemsintextprocessing, suchasremovingduplicationofstrings,recognizing andremovingtheprefixandsuffixofstrings[1]and distinguishingoftheembeddedstrings[2].These problemscanberesolvedbymeansofstringcrosspat ternmatching.Thatistofindallmatchesbetween twostringsofU,whichisastringsetdefinedonal phabetΣ. Therearemanyclassicalalgorithmsforpattern matchingandcanbeclassifiedintotwocategories: single patternmatchingandmulti patternmatching. Thecurrentprevail… 相似文献
13.
特征选择是文本挖掘领域中重要的基础性工作,能够为后续文本挖掘任务的顺利实施提供良好的数据处理方法和技术支持,而特征词排序是特征选择的关键环节.结合文本统计信息和结构信息以及流形排序思想,提出了一种新的特征词排序方法.通过构造原始文本中潜在的能够反映文本语义和结构信息的条件共现度词网络作为特征词间的流形结构,并以特征词的词频统计信息作为特征词初始权重,结合流形排序思想以及图学习理论进行特征词间的相似性学习,进而实现对特征词重要性排序.分别在公共语料集和补充语料集上与其它多种特征词排序方法进行数值实验对比,实验结果验证了方法的有效性.该方法拓宽了流形排序思想和图学习理论在文本挖掘领域的应用,也给单篇文本特征词排序提供了新的方法和策略. 相似文献
14.
15.
近二十年复杂系统研究回顾 总被引:1,自引:0,他引:1
探讨复杂性是近年来系统科学界的一个热门,但目前在这方面所取得的成就并不理想。要想在研究上获得成效就得反省这些年人们到底做了那些真正的属于复杂范围的工作。可以认同的事实是人类对于自然的认识兴趣由来以久,发现自然界中含括了大量结构及功能复杂的物质或事物。但对于复杂性事物的卓有成效的研究准确的说是属于对复杂系统特征的考察仅仅只有二十年来的历史。复杂性的探索工作直到如今所取得的成果还是处于较低的层面,没能彻底超越早期研究所倡导的一般系统思维模式。绝大部分理论仍旧停留在系统思想和其他各门具体学科嫁接的基础之上。本文主要目的是在于通过简洁的语言展现和改造传统复杂性研究的思维模式。 相似文献
16.
采用并行协同进化遗传算法的文本特征选择 总被引:1,自引:1,他引:0
现有的文本特征选择方法都是串行化的, 应用于海量文本数据集时时间效率较低, 因此利用并行思想来提高文本特征选择的效率, 已成为文本挖掘领域的一个研究热点. 本文将 遗传算法和并行协同进化算法结合起来, 在粗糙集的基础上设计了一个并行协同进化遗传算法 并将该算法用于文本特征选择. 该方法采用遗传算法搜索特征, 利用并行协同进化算法来提高 时间效率, 从而较快地获得较具代表性的特征子集. 实验结果表明该方法是有效的. 相似文献
17.
文中介绍周易是怎样一本书,并在书中找到几点讲述世间万物都在运动变化的内容。探索了周易中含有世间万物互相依存、茂盛生长的整体、和谐景象的描绘等问题。最后揭示了神奇的河图具有内在规律性的和谐美。 相似文献
18.
Labeled LDA can mine words' probabilities under a given topic, however, it can't analyze the association relationships among these topic words. Although the correlation between word pairs can be calculated by utilizing PMI (Pointwise Mutual Information), their relationship to the given topic is lost. Motivated by the operation of counting word pairs in a fixed window used in PMI, this paper proposes a topic model called PL-LDA (Pointwise Labeled LDA), which can compute the joint probabilities between word pairs under a given topic. Experimental results on aviation safety reports show that this model achieves results with good interpretability. Based on the results of PL-LDA, this paper constructs a topic text network, which provides rich and effective information for analyzers including reflecting the distribution of topic words and displaying the complex relationships among them. © 2017, The Journal of Agency of Complex Systems and Complexity Science. All right reserved. 相似文献
19.
生物医学文献知识发现研究探讨及展望 总被引:8,自引:0,他引:8
采用文本挖掘技术处理海量生物医学科技文献和文本注释型数据库。从而发现创新知识如基因、蛋白质、疾病、药物及其相互关系的研究是当前人工智能和数据挖掘领域研究的热点。本文对生物医学文献知识发现的研究内容、研究成果以及基于文本挖掘的关键技术诸方面进行了系统的分析和阐述。通过分析中医药学数据的特点,提出了基于文本挖掘的中医证候分子生物学知识发现研究,该方法的特点是综合利用中医药学文献和MEDLINE,能够获得创新的证候与基因相关知识。初步实验表明,文本挖掘技术有望为证候的分子水平研究提供辅助和支撑手段。 相似文献