首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 187 毫秒
1.
探讨了针对概率XML文档集中与内容相关的关键字检索结果的排序问题,针对概率XML文档的特征提出了一种新的排序模式.与仅取决于检索结果概率的检索排序算法不同,本文提出的排序算法充分考虑了节点对文档的区分程度、节点描述文档的程度,以及XML文档本身的结构特性,设计了满足以上特征的检索结果排序模型,并针对排序模型提出了新的倒排索引结构.新的排序算法可以快速完成关键字检索,并将最相关的信息提供给用户.模拟数据集实验验证了该方法的有效性.  相似文献   

2.
在分析现有关键字提取算法的基础上,提出了一个基于词语网络的英文文档关键字提取算法,采用节点删除指标度量节点(词语)重要性.所提取的关键字不仅包括高频单词和短语,而且包括文档中的重要但出现频率不高的单词和短语.对比实验结果证明了该算法的有效性.  相似文献   

3.
在大规模文档中进行快速的相似搜索对绝大多数信息检索应用程序是至关重要的.基于局部敏感哈希的检索方法将高维的空间数据映射到低维的二进制海明空间,从而实现了快速搜索.本文给出了一个基于核化局部敏感哈希的快速文档检索方法,可以在保证时间效率下允许算法使用不同的相似函数进行快速检索.实验结果表明该方法在大规模文档集合检索中具有较好的效率和准确率.  相似文献   

4.
用OPSBOPMs实现超立方体系统的容错路由   总被引:1,自引:0,他引:1  
提出了针对超立方体结构多处理机系统的最优通路集的新概念和建立基于最优通路集的最优通路矩阵(OPSBOPMs)的新算法,并给出了基于OPSBOPMs的容错路由算法,证明了该算法是基于最优通路矩阵(OPMs)和基于扩展最优通路矩阵(EOPMs)容错路由算法的扩展.研究结果表明该算法的存储开销与OPMs的相同,但记录的最优通路的信息包含了它们所记录的最优通路的信息,使搜索最优通路的能力增强.  相似文献   

5.
分析了BSON文档的结构,通过比较类似结构的映射方法,给出了BSON文档树的概念和结构,并提出NoSQL数据库文档到关系数据库的映射策略,在此基础上建立了BSON文档模式和关系模式之间的双向映射模型,并给出了双向映射算法.  相似文献   

6.
针对审计系统中搜索大量审计数据的需要,设计了一种基于哈希表机制的多关键字匹配算法.该算法把关键字集合储存到哈希表中,并为关键字集合建立了两个过滤表和一个关键字长度类型表.在查找过程中,对未经过滤表验证的字符串不再进行匹配查找,同时,关键字长度类型表的使用减少了循环的次数.测试结果表明,该算法在速度和精度上都优于BM和mgrep算法.  相似文献   

7.
基于有组织的P2P网络,给出了一个将语义和Chord算法融合的搜索算法,以解决搜索信息的表达能力和负载平衡问题.算法的基本思想是将一个引入超级节点和域组概念的有组织P2P结构作为基于语义的P2P网络的拓扑结构,利用超级节点和相似度思想,使含有相似主题的结点尽可能链接在同一个超级节点上,并利用关键字和语义的二次比较来进行查询定位,实现了在搜索效率和准确性上的相互协调.最后在现有Edutella架构基础上,分别对有组织语义P2P网络和Chord算法进行扩展,构建搜索算法的实验环境.实验表明,该方法提高了P2P系统的搜索成功率和搜索效率.  相似文献   

8.
基于超立方体覆盖的构造性网络学习算法   总被引:3,自引:0,他引:3  
该文提出了一种基于超立方体覆盖的构造性神经网络学习算法,以解决二值型输入变量的K分类问题。该算法分两步来动态地构造一个三层前馈网络。首先,对于每一类的所有训练样本,用尽可能少的超立方体来覆盖它们,并为每一个超立方体构造一个隐层单元;其次,用"或"操作把这些隐单元连接到相应的输出单元上。文章给出了相应的理论分析和一个具体的实现。实验结果表明,该算法优于常用的一些归纳学习算法。  相似文献   

9.
为了提高宋词文档分类的精确性,本文在广泛采用的向量空间模型(Vector space model,VSM)的基础上,对分类算法中使用的特征项做了相应的修改,提出了频繁关键字共现的概念.在实验过程中,首先提取了宋词语料库中的关键字,再利用发现关联规则的Apriori算法发现分类时所需要的频繁关键字共现,最后结合关键字和频繁关键字共现,利用最邻近算法(KNN)对宋词文档进行风格分类.实验结果发现,结合了频繁关键字共现的VSM可以提高对宋词风格分类的准确度.可见,频繁关键字共现确实提供了风格分类中所需的更多信息.  相似文献   

10.
K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果.最后,将该改进算法作为局部搜索过程嵌入到迭代局部搜索结构中,构造一个基于K中心点的迭代局部搜索文档聚类算法,进一步改进了文档聚类结果.试验结果表明该算法显著改进了文档聚类结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号