首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 77 毫秒
1.
实现了模糊算法并进行了检索实验,实验结果表明了模糊检索算法的合理性。将模糊技术应用到W eb数据检索中能得到比纯频率检索更好的性能,更能接近使用者的真实想法。  相似文献   

2.
3.
一种基于主题的文档检索模型   总被引:2,自引:1,他引:1  
现有信息检索模型难以从主题层次上准确判别文档相似性,为此,本文提出了一个基于主题的文档检索模型(TDRM).TDRM为所有文档建立公共主题空间,把每个文档表示为主题空间上的一个向量,并用向量夹角余弦定义文档相似度.TDRM模型借助Latent Dirichlet Allocation的主题生成方法估计每个文档的主题分布.实验结果证明,与基于词频统计的向量空间模型相比,TDRM模型在相关文档检索方面有更高的检索精度.  相似文献   

4.
尽管将BERT运用在Ad-hoc文档检索领域能够提升任务精确度,但也存在两个显著缺陷:第一,由于BERT存在输入限制,对长文档进行截断会导致文档信息丢失;第二,Ad-hoc文档检索任务的数据集中存在相当数量的领域特定词,而BERT不能较好地学习这些特定词的特征.而利用LDA主题模型不存在输入限制,可以表示完整的语义信息的优点,将其引入联合增强模型,且对文档中的领域特定词及语义内涵进行学习表征,弥补了BERT模型的不足.为此提出RWT-BERT联合增强模型通过对BERT和LDA主题模型的表征构建交互网络,对查询语句和长文档进行更深层次的特征挖掘.实验结果表明:该模型在3个数据集的主要指标上都有不同程度的提升,尤其在Core17数据集上,与目前效果最好的句子级Ad-hoc文档检索模型Birch相比,nDCG@20指标提高了4.01%.  相似文献   

5.
提出一种基于XML的文档图像在原生数据库中存储和检索的新方法,该方法将文档图像切分标记为XML文档,将此类XML文档存储到原生数据库中;利用XML:DB API接口对XML数据进行查询和管理,XSL样式表完成XML数据的显示.  相似文献   

6.
刘劼 《科技咨询导报》2009,(15):193-193
数字图书馆中的文档检索主要包括三个主要部分,文档存储。查询格式以及相似性计算。现存检索方法的主要差别即在于相似性计算。本文简要介绍了基于识别的检索技术和不基于识别的检索技术,对数字图书馆中文挡图像检索系统的建设具有一定的意义。  相似文献   

7.
K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果.最后,将该改进算法作为局部搜索过程嵌入到迭代局部搜索结构中,构造一个基于K中心点的迭代局部搜索文档聚类算法,进一步改进了文档聚类结果.试验结果表明该算法显著改进了文档聚类结果.  相似文献   

8.
用I3(n)表示n-立方体Qn的3-独立数。提出了构造Qn的3-独立集的一个算法,证明了2n-[log2n]-1≤I3(n)≤[2n/(n+1)].这些结果被应用于神经联想存储器的设计.  相似文献   

9.
DelplIi中的流操作是利用Delplli开发有关文件、数据库和网络等系统的一项重要技术,它为来自不同数据源的数据提供了统一、简洁的操作方法。本文介绍了流技术的一般操作方法,并以一个基于SQL Server2000的文档管理软件为例来说明流技术在实际开发中的应用。  相似文献   

10.
由于长文档对格式规范要求非常严格,且长文档本身具备的元素种类繁多,每一种元素格式要求各不一样。另在页眉页脚方面也有其特殊性,即页眉必须是每一页内容所在章的章标题。传统的手工方式在处理简单的短幅文档时还可以应对,但在面对长文档的上述问题时就会费时费力。使用样式和域可以轻松实现对长文档的高效编辑与排版,长文档的上述那些特殊情况也会迎刃而解,同时也使文档处理得更加规范美观。  相似文献   

11.
网络背景下,高校文献检索课教学面临机遇和挑战.通过论述高校文献检索课网络教学系统建设及其教学运行程序,探讨高校文献检索课网络教学模式的特点.  相似文献   

12.
科技查新已经发展成为涉及社会各领域用于查证项目高新科技含量的一种查证手段。在知识产权日益重要的今天,专利文献也已成为科技查新中必不可少的重要文献。阐述了专利文献在科技查新中的重要性及作用,介绍了常用的专利检索工具。  相似文献   

13.
指出基于TfIdf的常用文本特征提取方法在文本分类问题中的缺陷,进而提出使用特征词的分布状态、词频和文本频三者相结合的方式提取文本特征的观点,给出了计算特征词权重的新方法,提出了新的文本分类方法. 试验表明,该方法能够最大限度保留文本的特征,并且可有效避免向量空间模型中的维数灾难问题,能应用于大规模文本分类.  相似文献   

14.
法律术语数据库在自然语言检索中的应用研究   总被引:1,自引:0,他引:1  
介绍了术语和术语数据库,分析了术语数据库在自然语言检索中的应用机制,探讨了基于法律术语数据库的自动标引。  相似文献   

15.
常规测井资料解释应用于非常规储层裂缝识别时,存在裂缝识别率低,储层评价不准确等问题;而成像测井方法(FMI)识别效果好,但成本过高。为了提高常规测井裂缝识别的准确率,首先采用BP(back propagation)神经网络方法,建立常规测井参数与裂缝发育程度之间的非线性关系。在神经网络样本选取上,引入K-means聚类算法,依据不同样本特征对其进行优化分类。最后,利用聚类结果分别建立更为精细的神经网络模型,并用于实际裂缝预测。将该方法应用于塔河油田碳酸盐岩储层A探井,识别结果表明:基于样本优化方法的裂缝密度曲线拟合效果(相关系数R分别为0.84、0.89、0.76)明显优于未考虑样本优化方法(R为0.58),验证了本文方法的优越性,可以将其作为一种识别储层裂缝发育程度的新方法。  相似文献   

16.
基于向量空间的信息检索模型VSM,以其简洁直观、检索结果和排序效果良好等优点,在信息检索领域得到普遍的应用。文章结合藏文文本的特点,研究VSM在藏文文本信息检索中的应用方法。  相似文献   

17.
基于RBF神经网络的客户分类模型   总被引:5,自引:0,他引:5  
运用径向基函数(RBF)神经网络和K均值聚类算法建立了客户价值分类模型,并用最小二乘法调整RBF的权值.仿真结果证明了该方法的有效性.  相似文献   

18.
自适应神经网络在短期负荷预测中的应用   总被引:2,自引:0,他引:2  
采用基于混沌算法的自适应预测模型,应用于电力系统短期负荷预测.选取重构相空间中的饱和嵌入维数作为神经网络的输入节点数,适当选择非线性反馈项,能使网络的动力学在权空间具有混沌行为.通过进化算法建立一种自适应机制,使得网络能够根据学习和训练的结果优化非线性反馈项.算例表明,该算法具有很强的自适应能力和鲁棒性,精度高.  相似文献   

19.
针对目前情感分析中的循环神经网络模型缺乏对情感词的关注的问题,提出一种基于循环神经网络的情感词注意力模型,通过引入注意力机制,在情感分类时着重考虑文本中的情感词的影响.在NLPCC 2014情感分析数据集及IMDB影评数据集上进行试验,结果表明:该模型能够提高情感分析的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号