首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程.阐述了一个文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、词义扩展、学习和识别过程、分类算法等进行了详细介绍。引入smooth技术改进词语权重,介绍向量空间模型.结果表明查全率和准确率均达到80%左右,而且smooth的引入有效地改善了分类性能.  相似文献   

2.
Web文本聚类是文本挖掘的重要组成部分。该文章分析了Web文本挖掘的方法,通过比较现有的几种聚类算法之后,着重研究了一个基于DBSCAN的聚类算法.以及它在文本挖掘中的具体实现过程。  相似文献   

3.
文本挖掘技术综述   总被引:17,自引:0,他引:17  
文本挖掘,是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程.对其进行深入的研究势必将极大地提高人们从海量的文本数据中提取信息的能力,具有很高的商业价值.首先介绍了文本数据挖掘的研究情况,然后给出了文本挖掘的框架,对文本挖掘中信息的抽取技术以及文本挖掘中使用的相关技术、评估方法等都作了详细的介绍,最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景.  相似文献   

4.
介绍了将现有文本数据库在Web 上建立检索系统的原则以及文本数据库在Web 上实现检索的机理和检索的方法.系统运行表明:系统结构合理、安全可靠、功能齐全、用户界面友好,是一个实用的系统.  相似文献   

5.
文本分析是文语转换系统的前端,是制约语音合成自然度的一个重要因素,文章在考察汉语文本分析方案的基础上,分析了藏语的特点,提出了一套适合于藏语语音合成的文本分析模块的实现方案.文中采用最大匹配法和分词词库相结合的方法实现文本的自动分词,建立一套层次化的规则体系对文本进行规范化的处理,字音转换则通过SAMPA-ST的藏语机读音标系统来实现,本研究的完成为藏语的语音合成打下了良好的基础.  相似文献   

6.
针对网络出版中电子出版物的版权保护问题,提出了一个基于USB Key数字证书实现数字文本版权保护的应用方案,分析了方案原理和方案实现模型,描述了数字证书在PDF文本内容保护中的实现逻辑,并探讨了未来的应用扩展.  相似文献   

7.
一种增量式文本软聚类算法   总被引:1,自引:0,他引:1  
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类.  相似文献   

8.
构建大规模的汉英双语平行语料库   总被引:1,自引:0,他引:1  
刘荣 《太原科技》2006,(10):84-85
鉴于互联网上存在着大量的双语互译文本.如何通过这些双语互译文本来建立大规模的双语语料库.是对双语互译文本深加工和不同目的应用的关键问题。主要提出了一个大规模汉英双语平行语料库的构建工作.包括其总体规划、实施模型和流程细节。  相似文献   

9.
近年来,场景文本识别技术得到了飞速发展.然而,由于不规则场景文本图像中经常存在诸如杂物遮挡、分布扭曲、光照不足等视觉障碍,使得现有方法不能对单词中某些字符进行准确识别,进而产生较多的错误识别.为了解决这一问题,本文提出了一种基于错误纠正(errorcorrection,EC)模块的场景文本识别算法.与现有算法中的纠错模块不同,所提出的EC模块是一个序列到序列的预测模型.在EC模块的编解码结构中增加了多单元注意力机制,能够更加关注特征图中的一些重要信息.EC模块可直接从纯文本中学习语义信息,用于纠正拼写错误的文本.此外,提出了一种基于场景文本识别的多特征(multi-feature,MF)提取器,该提取器由5个MF单元组成,可分别从Resnet-45后5个模块的输出中提取特征信息.与传统的方法相比,MF提取器可以从不同深度挖掘更加丰富的图像信息.在7个数据集上的对比实验结果表明,与当前先进方法相比,所提算法在性能上具有明显的优势.  相似文献   

10.
陈翔 《长沙大学学报》2011,25(5):35-36,70
用于文本认证的数字水印技术是数字水印核心技术之一.首先总结了当前用于认证的文本水印技术的分类、基本特征以及文本认证系统模型,然后分析了脆弱文本水印的算法和研究现状,最后指出用于文本认证的数字水印技术未来发展的方向.  相似文献   

11.
海德格尔对荷尔德林诗歌的阐释,目的是进行诗与思的对话,归根结底还是探讨存在。诗与“在”的关系,是海氏诗学框架的核心内容,诗与“在”的关系又进一步引申为艺术与真理的关系,本从真理如何被遮蔽的问题入手,试图读解海德格尔诗学的内涵。艺术是无蔽的真理显明的一种方式,诗是危机的拯救,语言是存在的家园。海德格尔对诗与在的探讨最后又转入了对语言的探讨,无法走出语言的牢笼。只有在实践中,把艺术变成为社会变革的一个因素,才可以解放被传统理性压迫的力量,显现艺术的真理,确立艺术的价值。  相似文献   

12.
Canonical Wnt/β-catenin pathway plays a central role in development, homeostasis, as well as tumorigenesis. The regulation of the pathway involves various and complicated mechanisms, including the extracellular, intracellular and endonuclear regulation. As the key component of the pathway, the Lefl/Tcfs-β-catenin complex is also the key target of regulation in the nucleus. In the current review, we are going to summarize the regulators in the nucleus which can modify the transcrip- tional activity of the Wnt/β-catenin pathway.  相似文献   

13.
As an American modern novelist who were famous in the literary world, Hemingway was not a person who always followed the trend but a sharp observer. At the same time, he was a tragedy maestro, he paid great attention on existence, fate and end-result. The dramatis personae's tragedy of his works was an extreme limit by all means tragedy on the meaning of fearless challenge that failed. The beauty of tragedy was not produced on the destruction of life, but now this kind of value was in the impact activity. They performed for the reader about the tragedy on challenging for the limit and the death.  相似文献   

14.
We have developed an adiabatic connection to formulate the ground-state exchange-correlation energy in terms of pairing matrix linear fluctuations.This formulation of the exchange-correlation energy opens a new channel for density functional approximations based on the many-body perturbation theory.We illustrate the potential of such approaches with an approximation based on the particle-particle Random Phase Approximation(pp-RPA).This re-  相似文献   

15.
信托财产是信托关系的基本要素,由于信托的特殊性,信托财产与传统民法的财产有很大区别,正确给信托财产定位,是信托业得以健康发展的核心问题。信托财产的特性在于其人格性,而这种人格性的赋予是以交易成本最小化为动因,尽管信托财产人格性设计对受益人的利益有偏袒,但从社会成本而言,其目的在于促使交易成本最小化,当然,对信托财产的人格性不能绝对化,由于利益平衡的需求,往往在特定情况下对信托财产予以人格否认。  相似文献   

16.
本文通过测量金属晶体电极表面的微分电容研究了金属电极表面在金属与水溶液界面上的吸附能力,以及金属与吸附质之间的相互作用。文中论述了多晶铜电极在(0.5-x)mNaClO_4+xmNaBr的一系列不同x值的溶液中的微分电容测量值及微分电容-电位曲线,证明了F~-和ClO_4~-离子在多晶铜电极表面是非常弱的吸附,Br~-离子在多晶铜电极表面具有特定的吸附,每条电容-电位曲线有一个凸起的峰。在峰所对应的位能值,金属表面对阴离子的吸附能力强,证实金属-吸附质之间的相互作用强,吸附的阴离子在过渡层中散射导电电子的能力也强。对于相同阴离子和金属的体系,其微分电容与吸附质的浓度、电压、溶液的pH值和表面的非均匀性等因素密切有关。研究证明,金属晶体电极表面在电解质溶液中的微分电容的变化规律类似于表面电反射信号的强弱变化规律,微分电容大小取决于金属-吸附质之间的电荷转移程度。  相似文献   

17.
阴离子表活剂压裂液是新型清洁压裂液,原油和地层水对其破胶机理与实验研究已相当充分,但气体对其破胶作用至今研究很少.为解决阴离子表活剂压裂液在压裂应用中的障碍,研究采用一套实用的实验流程,评价了天然气、氮气、二氧化碳三种常见气体对阴离子表活剂压裂液的影响.实验证明,三种不同的气体对阴离子表活剂压裂液的降粘幅度存在较大的差别,其中,二氧化碳气体对阴离子清洁压裂液降粘幅度最大,可使交联液体彻底破胶,天然气对阴离子型表活剂压裂液降粘幅度较小,氮气对阴离子压裂液的粘度几乎没有影响,氮气和天然气可以使液体泡沫化,从而有利于返排.实验结果为优化压裂设计提供了依据,可有效提高现场压裂施工成功率.  相似文献   

18.
介绍了速调管在我国的发展现状和几种不同结构的多腔速调管的主要特性比较,并给出了小信号条件下速调管的各种主要特性的简化分析方法.在这种简化分析方法中,把多腔速调管看作是几个双腔速调管的级联,并且没有考虑非线性、空间电荷效应和相对论效应等带来的影响,目的是阐述基本原理和基本分析方法.  相似文献   

19.
Deposition of granular materials into a container is a general industrial packing process. In this study, the deposition behaviour of dilute granular mixtures consisting of two types of particles that were of the same particle size but different particle densities in the presence of air was numerically analyzed using a coupled discrete element method (DEM) and computational fluid dynamics (CFD). Bilayer granular mixtures with light particles at bottom and heavy particles at top were first simulated. It was found that the presence of air significantly affected the flow behaviour of the bilayer mixtures. For the system with a relatively low initial void fraction, the air entrapped inside the container escaped through the dilated zones induced due to the friction between the powder bed and wall surfaces. The escaping air streams entrained light particles that were originally located at the bottom of the granular system. Consequently, these light particles were migrated to the top of the granular bed at the end of deposition process. More light particles were migrated when the deposition distance was increased. For the system with a high initial void fraction, some light particles penetrated into the top layer of heavy particles and created a mixing zone. Deposition of random mixtures with different initial void fractions was also investigated and the influence of initial void fraction on the segregation behaviour was explored as well. It was found that the increase of void fraction promoted segregation during the deposition in air. It was demonstrated that, for granular mixtures consisting of particles of different air sensitivities, the presence of air had a significant impact on the mixing and segregation behaviour during the deposition.  相似文献   

20.
Subjective logic provides a means to describe the trust relationship of the real world.However,existing fusion operations it offers treat fused opinions equally,which makes it impossible to deal with the weighted opinions effectively.A.Jφsang presents a solution,which combines the discounting operator and the fusion operator to produce the consensus to the problem.In this paper,we prove that this approach is unsuitable to deal with the weighted opinions because it increases the uncertainty of the consensus.To address the problem,we propose two novel fusion operators that are capable of fusing opinions according to the weight of opinion in a fair way,and one of the strengths of them is improving the trust expressiveness of subjective logic.Furthermore,we present the justification on their definitions with the mapping between the evidence space and the opinion space.Comparisons between existing operators and the ones we proposed show the effectiveness of our new fusion operations.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号