共查询到18条相似文献,搜索用时 46 毫秒
1.
针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈等技术对URL-key进行过滤,构建领域URL-key。然后结合伪相关反馈技术,选取URL-key为特征,构建URL-key向量,利用SVM对查询串进行分类。实验结果表明,该方法不仅F值比对比方法提高7%,而且资源的使用也远远小于对比方法,提高了系统的时效性。 相似文献
2.
基于条件随机场的汽车领域术语抽取 总被引:1,自引:0,他引:1
中文领域术语抽取是中文信息处理领域的一项重要研究任务,在词典构建、领域本体构造等方面有重要的应用.采用条件随机场(conditional random fields,CRFs),从汽车知识网站上爬取网页,预处理后得到纯文本,然后分析汽车领域的术语组成特点并制定相应的语料标注规则进行人工标注,对汽车领域进行了术语抽取.在使用词和词性特征的基础上增加了词典特征、领域词频和背景领域词频等特征,精确率、召回率和F-值分别达到84.61%、80.50%和82.50%.与其他方法比较说明所提出的汽车领域术语抽取方法是有效的. 相似文献
3.
基于语言特性的中文领域术语抽取算法 总被引:2,自引:0,他引:2
提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高. 相似文献
4.
领域词典作为中文信息处理的基础,在各个领域都有着重要的应用.而人工构建领域词典不仅工作量大,而且缺乏时效性.因此,自动构建领域词典成为目前研究的重点,而构建领域词典的关键是从领域语料中自动抽取领域术语.本文以金融领域作为切入点,提出了根据登录词前后邻接关系计算邻接词之间的双条件概率自动识别领域术语.实验证明,本文提出的算法不仅能够有效地提取新术语,同时在小语料和低词频情况下也能取得较好的效果. 相似文献
5.
基于互信息与词语共现的领域术语自动抽取方法研究 总被引:1,自引:0,他引:1
吴海燕 《重庆邮电大学学报(自然科学版)》2013,25(5):690-693
领域术语自动抽取是本体建设中最基础最重要的工作。领域术语的自动抽取,通常采用基于规则或者基于统计的方法,这些方法是从术语的完备性,或者是检验术语的领域性进行检验。在前人的基础上提出了一种方法,该方法不仅测试领域术语的完备性,同时测试了其领域性,以期获得更好的结果。实验结果表明,该方法获得的术语准确率得到了一定的改进,准确率和召回率分别达到了81.7%和70%。 相似文献
6.
领域现象术语常常是复合型短语,很难根据局部上下文特征用传统的机器学习方法来抽取.为此,文中提出了一种领域现象术语的抽取方法.该方法首先用基于上下文的方法抽取得到分隔符集,然后结合分隔符集和上下文术语用改进的NC -value算法进行候选领域现象术语抽取,最后在候选领域现象术语中过滤掉名词性术语,进而得到最终结果.实验表... 相似文献
7.
针对领域本体构建中概念上下位关系获取难的问题,提出融合句子结构特征的概念上下位语义关系抽取方法。首先利用层叠条件随机场(cascaded conditional random fields, CCRFs)算法建模实现概念上下位实体识别,然后通过对句子结构特征分析得出融合概念上下位关系的句子结构特征,最后利用融入句法特征基于支持向量机(support vector machine,SVM)建模的方法实现概念上下位关系抽取。为验证提出方法的有效性,以旅游领域上下位实体关系抽取为例进行了相关实验。实验结果表明:基于CCRFs模型的识别效果相对于现有的单层模型有较大改进, 其F值提高了6.57%;加入句法特征基于SVM概念上下位关系抽取方法较现有的基于条件随机场(conditional random fields,CRFs)概念上下位关系抽取方法更有效,其F值提高了4.68%。 相似文献
8.
9.
本文在已建立的家电领域本体的基础上,提出一种面向家电领域的语义检索模型,该模型一改传统检索方法中机械式字符匹配的弊端,支持基于本体的语义理解.利用SVM分类器、自然语言处理、语义标注等技术,在对查询条件预处理以及资源语义标注的基础上,对标注资源库进行检索,提高了查准率和查全率。 相似文献
10.
针对电气工程领域英汉机器翻译中平行语料稀缺的问题,在使用通用语料训练翻译模型的基础上,提出了一种融合领域术语信息的嵌入层参数初始化方法.首先,对文本进行分词预处理,将术语词划分为一个最小单元;然后,利用Glove和Word2vec在不同单语语料上训练得到两种词向量,并分别初始化嵌入层参数中常用词和术语词的向量表示;最后... 相似文献
11.
Sherlock方法是一个专门抽取可复用的软件框架的领域分析方法,是在Proteus方法和FODA领域分析方法的基础上发展而来的。Sherlock方法的输入包括了以领域应用为基础的领域描述、领域文献、用户需求以及领域专家和市场专家的访谈。Sherlock方法的输出是指由一系列有体系结构组件所组成的框架。讨论了Sherlock方法的主要特点,并以商业和管理信息系统的图形用户界面框架开发作为一个实例具体说明。 相似文献
12.
在经典特征选择算法的基础上,提出一种带专业词库的特征选择方法.在训练分类模型的时候,适当加重属于专业词汇的特征的权重.这种方法能够有效地避免特征选择时误删有用的低频词,因此,适合用于短文本的分类(电子邮件等).实验结果表明,本方法在抽取特征维数较少时,分类准确率提高约3%. 相似文献
13.
对不同种类噪声的分类处理,可以提高噪声环境下语音信号处理的性能.为了能够准确地区分各类噪声,提出了一种基于Bark域噪声能量分布特性的噪声分类方法.通过将噪声能量从均匀时频空间映射到Bark空间,构造了一个能够有效区分各种噪声的22维特征向量,并使用支持向量机(SVM)进行模型训练和噪声分类.实验结果表明:所提出的噪声分类方法具有非常高的分类准确率,对用于实验的两种噪声数据集的平均分类准确率分别为99.50%和93.44%. 相似文献
14.
无界区域上具有记忆项的随机波动方程的拉回吸引子的存在性 总被引:1,自引:0,他引:1
在无界区域Rn(n≤3)上研究了如下具有线性记忆项的随机波动方程的渐进行为utt+αut-k(0)Δu+λu+f(x,u)-∫∞0k′(s)Δu(t-s)ds=g(x)+h(x)dωdt。其中, 当n=3时非线性项f具有次临界增长率, 当n=1,2时f可具有任意增长率。运用解的一致估计方法在H1(Rn)×L2(Rn)×M1(Rn)上证明了对应的随机动力系统拉回吸引子的存在性。 相似文献
15.
利用量子么正变换引起拓扑项的可移性,求出了一维无限深运动边界方势阱在压缩变换中出现的微扰项在一级近似下对Berry相因子的贡献。 相似文献
16.
17.
18.