共查询到20条相似文献,搜索用时 56 毫秒
1.
2.
3.
根据校园舆情和信息安全管理的需要,结合垂直搜索的特点,提出了一种面向主题的域内垂直搜索引擎模型.给出了模型在信息采集、分词处理、主题识别、网页索引、检索处理5个功能模块的实现过程,并对模型涉及的中文分词方法、隐形关键词组的扩展运算、检索正态化因子的调整等关键技术进行了讨论.建成的搜索引擎能够很好地满足用户主题检索服务的需要. 相似文献
4.
基于网页分块技术主题爬行器的实现 总被引:1,自引:0,他引:1
针对目前通用搜索引擎搜索到的结果过多、 与主题相关性不强的现状, 提出一种基于网页分块技术的主题爬行器实现方法, 并实现了一个原型系统Crawler1. 实验结果表明, 本系统性能较好, 所爬网页的相关度在55%以上. 相似文献
5.
《烟台大学学报(自然科学与工程版)》2017,(3):255-260
主题网络爬虫技术是获取特定主题的有效手段,其搜索算法的性能直接决定着搜索结果的优劣.文章综合分析了现有的网络信息搜索算法,并将遗传算法思想应用到主题网络爬虫技术中,提出了非贪婪遗传主题网络搜索算法.实验结果表明,该算法能够采集到更多主题相关度高的网页,提高信息采集正确率,快速高效获取交通相关的信息. 相似文献
6.
提出一个基于用户群的智能主题爬虫系统CITC。它首先对用户群日志进行挖掘,得到相应的知识库。在知识库的指导下,CITC采用多重选择策略,对网页进行选择性爬取。实验结果表明,此系统能够基于用户群兴趣有效地抓取目的网页。 相似文献
7.
基于主题划分的有组织P2P搜索算法 总被引:9,自引:0,他引:9
提出一种基于主题划分的P2P搜索算法———主题覆盖网络搜索算法(TONS).TONS在有组织P2P网络基础上,将结点按主题组织成覆盖网络,使含有相似主题的结点链接在一起,因此可以根据内容将查询限定在P2P网络的局部范围内.通过在覆盖网络中随机添加一些长距离链接,使覆盖网络具有Small-World特性.TONS为有组织的P2P系统提供了一种能依据部分匹配、多关键词等复杂条件搜索结点数据对象的有效方法,与现有的有组织P2P系统相比,它可以将搜索的查全率提高74.7%,并减少P2P网络信息搜索的平均路径距离和平均消息数目. 相似文献
8.
为了提高网页在互联网中的搜索效率,基于非结构化P2P网络的多种搜索算法和网络蜘蛛搜索算法,提出了一种广度优先搜索(BFS)和非贪婪性搜索(NGS)相结合的改进搜索算法(BNS)。并通过该算法的性能分析与大理学院校园BBS的应用测试,结果表明,BNS算法在搜索速率、相关度和准确率上都优于BFS和NGS算法,该算法的实际应用提高了网络论坛运行效率。 相似文献
9.
互联网上信息是海量的,并且还在快速的发展.面向主题的Web信息检索已成为当前研究的热点之一.将语义网技术同传统的信息检索技术相结合,给出一个利用本体判断主题相关度的判断算法,通过实验验证了算法的有效性. 相似文献
10.
在码分多址(CDMA)通信中,多用户检测是抑制多用户干扰的有效方法.结合群智能和禁忌搜索算法的优点,提出了一种新的群禁忌搜索(S-TS)多用户检测方法,通过粒子群的并行禁忌搜索,使算法具有很强的全局寻优能力.仿真实验证明,该方法具有较好的误比特性能、抗远近效应能力和多项式计算复杂度. 相似文献
11.
12.
张小琴 《中南民族大学学报(自然科学版)》2014,(2):89-92
为提高大数据环境下主题信息搜索的准确率和查全率,提出了将贝叶斯推理与遗传算法相结合的搜索策略.利用贝叶斯推理对文档的主题相关度进行了计算,并结合遗传算法对搜索过程进行启发式引导,同时引入差异度参数,在Heritrix框架基础上,利用集成开发环境Eclipse 3.3实现了相应功能.实验结果表明:搜索策略改进后的系统抓取主题页面所占比例与原系统相比有较大提高. 相似文献
13.
14.
许多生物信息学软件涉及将核苷酸序列翻译成对应的氨基酸序列的操作.密码子检索表的结构及检索算法强烈地影响蛋白质翻译的速度.本文提出了2种快速的密码子检索方法.一是平均检索长度约为7,最大检索长度为9的分块检索;二是没有空间冗余和地址冲突的哈希表检索,其平均检索长度和最大检索长度均为3.对几种密码子检索方法的检索效率进行比较,结果表明哈希表的检索速度最快. 相似文献
15.
基于遗传算法的神经网络算法研究 总被引:4,自引:0,他引:4
樊为民 《太原师范学院学报(自然科学版)》2004,3(4):14-17
针对神经网络存在许多局部最小点,在某些初值的条件下,算法的结果会陷入局部最小等问题.文章将遗传算法和神经网络相结合,用遗传算法替代BP算法学习网络权值,并将其应用于聚类分析.计算结果表明,遗传算法和神经网络的结合将具有良好的全局搜索能力。 相似文献
16.
免疫算法与其他随机优化算法的比较分析 总被引:10,自引:0,他引:10
详细描述了免疫算法的基本原理、步骤和寻优机理,以及抗体的抑制和促进、记忆单元更新、亲和性计算等特点。阐述了免疫算法抗原、抗体与实际问题的映射关系。用其他随机优化算法(模拟退火算法、遗传算法、进化规划等)与免疫算法进行了比较研究,给出了他们的异同点、免疫算法的优点等。利用旅行商问题(TSP)、随机优化算法测试函数对免疫算法及其他算法进行了测试分析。实例分析表明,免疫算法是一种收敛速度快、收敛性好的算法。 相似文献
17.
目前在图像压缩方面的算法有很多,但这些算法都在一定程度上使图像失真,且算法比较复杂,在此提出一种基于搜索算法的图像压缩算法,该算法能在让图像不失真的前提下对其进行压缩和复原,实现图像无损压缩,该算法复杂度为多项式级. 相似文献
18.
如何快速有效地搜索出激励码书中的最佳激励矢量是码激励线性预测编码(CELP)得以实际应用的关键问题之一.作者结合遗传算法的优点,将遗传算法应用于CELP的码字搜索,利用遗传算法的优越性,较快地搜到码书中的最佳激励码字.阐明了将遗传算法应用于码字搜索的具体思路,并给出了软件仿真结果. 相似文献
19.
依据数据的机内编码特征,提出了一种从无符号整数序列中查找第K个元素的快速算法.算法分析和实验结果表明:算法的时间复杂度低于传统的基于比较的查找算法,且附加存储空间小. 相似文献
20.
采用汇编语言,利用其循环,移位,位操作等指令,编制出公用控制方案的搜寻程度并在80386DX微机上计算出二位公用控制件方案,实践表明,此程序搜寻速度极高,且输出信息量大。 相似文献