排序方式: 共有20条查询结果,搜索用时 593 毫秒
11.
高性能网页索引器JU_Indexer的实现 总被引:4,自引:1,他引:3
高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、 建立网页索引的算法、 以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间. 相似文献
12.
基于统计规则的交集型歧义处理方法 总被引:1,自引:1,他引:0
中文分词是中文信息处理的基础, 歧义问题是中文分词的一个难点, 而交集型歧义问题占歧义问题的90%以上, 因此对交集型歧义问题的研究是中文分词研究的一个重点. 通过反复的实验和对实验结果的分析, 提出了5条规则, 并根据这5条规则给出了一种针对交集型歧义字段切分的算法, 实验结果表明, 基于该算法实现的分词系统DSfenci, 对于交集型歧义消解的准确率高于95.22%. 相似文献
13.
利用超链接信息改进网页爬行器的搜索策略 总被引:5,自引:0,他引:5
网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的.爬行器如果按照传统的宽度优先搜索策略在Web空间中爬行,它对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高.为此,给出了利用超链接信息改进网页爬行器搜索策略的算法.该算法充分考虑了网页之间的超链接信息,克服了传统的宽度优先搜索策略的盲目性爬行.实验表明,利用该算法爬行得到的网页与某一特定主题相关的网页超过50%. 相似文献
14.
本文描述了一个基于层次知识表示结构的集成化概念分析方法,此方法已在IBM-PC机上用GCLISP语言实现,并着重介绍了系统的层次知识表示结构、通用语法知识表示和规则选择控制策略。 相似文献
15.
针对主题爬行器获取网页更新速度快的特点, 提出一种用于网络搜索引擎的增量索引结构. 在建立倒排索引时, 每个词项的记录表以链接块的形式存放于倒排索引文件中, 每次新分配的块大小递增. 该索引结构解决了倒排索引连续存储所带来的难以更新问题. 实验结果表明, 与支持实时更新的传统链表式存储方式相比, 这种索引结构能提供更高效的检索, 采用以空间换时间的方法有效地提高了索引的更新效率. 相似文献
16.
PageRank-Pro: 一种改进的网页排序算法 总被引:9,自引:1,他引:8
根据网页点击信息改进了原有的PageRank算法, 利用Seidel迭代算法加快了迭代收敛 过程. 实验结果表明, 改进后的迭代算法效率提高23%左右. 相似文献
17.
赫枫龄 《吉林大学学报(理学版)》2000,(1)
讨论在 Windows环境下应用 Client/ Server技术实现可重用的输入汉字特殊符号组件的方法 ,给出可重用的输入汉字特殊字符组件的实现原理 ,并描述在应用程序中调用可重用的输入汉字特殊字符组件的方法 . 相似文献
18.
为了实现手机和通用计算机之间信息的共享,给出了通用计算机的红外线适配器的设计方案,并详细描述了基于COM(Component Object Model)架构的红外手机管理软件的实现细节.该管理软件使用ATL(Active Template Library)实现松散耦合的COM组件架构,其优点是目标程序小,修改、升级、二次开发容易,甚至可以通过互联网实现快速自动升级,能通过手机收发短信息,管理手机电话簿等资源. 相似文献
19.
提出一种基于改进后缀树与交互聚类思想相结合的算法ISTC算法, 通过改造传统后缀树结构实现了对文档标题和摘要的层次化聚类, 同时用交互聚类的方式替代了传统的递归算法. ISTC算法具有语言无关性, 不仅适用于基于单词的西方文字, 而且可以在不引入词典分词技术的情况下有效地处理基于单字的中文字符. 在此算法基础上, 设计并实现了基于改进后缀树算法的交互聚类引擎, 在不同的网络环境下对其
进行了系统测试, 并与其他元搜索引擎进行了对比. 实验结果表明, 使用改进后缀树算法进
行实时交互式聚类是可行的. 相似文献
20.
赫枫龄 《吉林大学学报(理学版)》1992,(4)
本文首先讨论了以往基于Demon的概念分析程序处理英语动词中的过去式和过去分词同形的局限性,然后,提出了一种基于多级知识表示结构的集成化概念分析方法,并着重介绍了JUP的语法知识表示结构和处理英语中动词的过去式与过去分词同形的语法现象的健全性。 相似文献