首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
本文主要分析了中文全文检索技术中有关内容,并根据此内容设计实现了一个中文全文检索系统.针对汉语词法的特殊性,在基于词表的全文索引方面,本文应用了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新.并根据其特征,设计了优化的查询策略.  相似文献   

2.
中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词的检索.  相似文献   

3.
李岩 《当代地方科技》2010,(15):118-118
本文分析了现今全文索引技术的现状。重点介绍了SQL Server2005数据库系统下实现全文索引的过程,并以实例分析了SQL Server2005实现全文索引技术的简易过程,介绍了实现该技术的部分代码。  相似文献   

4.
周安 《咸宁学院学报》2013,(6):37-38,41
目前站内搜索引擎已经逐渐成为web应用领域的热点.本文根据Sphinx、Mysql系统结构和运行特点,以Python语言为例,提出一种通用的web站内搜索引擎的构建方法.对于基于Linux+Apache+Mysql(或PostgreSQL)构架、Django等开源技术构架的web网站,该方法在不改变现有网站构架的基础上可以很便捷的构建一种性能优越的站内搜索引擎.  相似文献   

5.
在对中文地址编码技术进行研究的基础上,把中文地址切分为地址要素和特征字,提出了中文地址清洗模型,制定了对中文地址要素的编码规则,并基于该编码规则设计了中文地址清洗算法,实验证明了该文方法具有较好的清洗效果.  相似文献   

6.
流行的数据库管理系统通常实现了全文检索子系统,从而方便对数据库表中的文本数据建立全文索引,进而借助于这个索引来检索文本数据.达梦数据库管理系统提供多文本数据检索服务.包括全文索引和全文检索.达梦数据库实现了全文检索系统.但是此系统存在着索引膨胀率过高,索引填充时间较长的问题.全文检索,是一门综合性很强的技术.它牵扯到了很多的技术点,主要有分词技术,数据源提取和文档解析技术,相关度计算技术,存储技术.压缩技术等.  相似文献   

7.
本文在对VxWorks研究的基础上,介绍了TrueType技术的基本原理及在VxWorks系统中如何通过FreeType应用TrueType字库.该方法和传统的中文显示处理方法相比,有很好的可移植性,可运行于Windows、Linux等系统.  相似文献   

8.
为方便中文文本分类过程算法研究,阐述中文文本分类的基础技术,提出基于构件的中文文本分类技术研究辅助平台.该平台对大多数分类中使用的算法在中文文本分类中的应用效果进行了研究.实验结果表明: 该平台可以通过计算分类器分类准确率的宏平均值比较分类算法与特征选择算法的性能,可以评估语料库的可用性,能够用于研究中文分词、特征选择、分类算法等中文文本分类技术问题.  相似文献   

9.
本文基于PostgreSQL及其空间扩展模块PostGIS和空间数据模型理论,分析对比了各类数据库系统模型的特点,研究了PostgreSQL的空间数据存储机制,提出了由PostgreSQL作为数据库,以客户端接口库LIBPQ实现空间数据库连接及PostGIS实现空间数据库表管理的地理空间数据管理办法.  相似文献   

10.
开源数据库PostgreSQL采用比较经典的客户端/服务器模式,可以通过SSH(Secure Shell)连接和SSL(Secure Socket Layer)连接方式提高访问的安全性.本文分析了PostgreSQL客户端连接方式,利用PostgreSQL客户端接口库LIBPQ,加密客户端到服务器的网络连接,配置安全套接层建立透明的安全通道,对客户端与服务器之间传输的数据进行加密,增加了数据传输的安全性.  相似文献   

11.
吴凤仙 《科技信息》2008,(13):291-293
选取《中国期刊全文数据库》与《维普中文科技期刊库》2000—2007年所发表的关于“用户信息需求”与“图书馆服务”研究的725篇研究论文作为分析数据。采用文献定量分析方法进行统计,从文献的时间分布、期刊分布、著者分布、主题分布等角度分析“用户信息需求”与“图书馆服务”的研究状况,对近8年来相关文献的分布情况、信息需求的主要特征以及国内关于信息需求研究的热点问题进行概述。  相似文献   

12.
全文检索是基于Web的信息搜索的关键技术,文章从基于KySou的全文检索系统的实现机制入手,深入分析了全文检索系统的工作原理、系统组成及API接口设计,并就全文检索系统的优化进行探讨,包括索引过程优化和搜索过程优化。  相似文献   

13.
尾矿干堆及脱水工艺研究应用与展望   总被引:1,自引:0,他引:1  
 为更好地应用尾矿干堆技术,推动中国尾矿处理技术的发展,在Ei数据库和中国期刊全文数据库中对尾矿干堆的相关文献进行检索统计的基础上,对国内外尾矿干堆技术的应用现状及研究进展进行了综述性研究.分析了国内外尾矿干堆的应用,列出了相关实例,得到了尾矿浓度及降雨对干堆工艺的影响;探讨了采用干堆法的原因,对其优势和局限性进行了概括,比较分析了国内外尾矿干堆的联系和区别.对尾矿干堆的关键技术脱水工艺的现状进行了总结,认为尾矿压滤、尾矿浓缩—压滤/过滤和尾矿分级—浓缩—压滤是目前最常用的3种脱水工艺,并对其脱水设备作了简要描述.对目前尾矿干堆技术存在的技术和管理问题进行了分析,最后对尾矿干堆技术的应用前景进行了预测和展望.  相似文献   

14.
依据中国学术期刊电子杂志社研制的《中国期刊全文数据库》(CJFD)中的数据 ,对《广西民族学院学报 (哲社版 )》论文被CJFD来源期刊的引用情况进行统计分析和评价。  相似文献   

15.
SCI选刊原则及广东省科技期刊申录状况探析   总被引:1,自引:0,他引:1  
科学引文索引(SCI)是目前在国际受到高度关注的评价体系,一直遵循严格的选刊原则.在SCI积极进入中国市场并且微调其对于中国科技期刊收录策略的情况下,重温SCI选刊原则,统计分析了SCIE收录中国大陆科技期刊最新情况,探讨广东省科技期刊存在的不足之处,为进一步探索广东省科技期刊更多地成为SCI源期刊的攻略提供参考.  相似文献   

16.
文本挖掘综述   总被引:1,自引:0,他引:1  
杨霞  黄陈英 《科技信息》2009,(33):82-82,99
文本挖掘是对一个非结构化文本信息进行分析从而获取用户关心或感兴趣,有潜在实用价值知识的过程。本文首先介绍了文本挖掘的定义和研究现状,之后文本挖掘一般处理过程,着力于文本分类和文本聚类的一般过程,最后展望了今后的研究目标。  相似文献   

17.
针对 J2EE(Java Enterprise Editon)开发中多平台的请求和响应问题, 提出了一种基于 SpringMVC 的开发 方式。 客户端是多平台的, 后台系统架构中的核心控制器根据客户端的类型将请求分发到服务端对应的业务 控制器中, 处理后返回不同类型的结果响应客户端, 并采用跨域异步数据交互的办法, 实现了对多平台客户端 的数据支持; 在数据库方面, 采用流行的 Hibernate 技术进行数据的持久化, 并使用 MySQL 原生工具进行热备, 以确保数据安全; 在传输方面, 采用了 HTTPS(Hyper Text Transfer Protocol over Secure Socket Layer)实现身份验 证和加密通讯; 最后通过系统测试验证了后台系统架构的并发性能良好, 符合预期要求。  相似文献   

18.
分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法.此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种"平均值"匹配阈值调整方法,从而在精度和效率方面优于传统的分类算法.实验表明此系统查准率为91.8%,查全率为85%.  相似文献   

19.
本文讨论了在AutoCAD环境下开发汉字系统,将纵横输入法应用于CAD工程,并能适用于任何中西文版本的AutoCAD。采用ADS(即AutoCAD的系统开发接口规范),使用WATCOMC语言32位编程技术来实现与AutoCAD的无缝连接。通过键盘,采用纵横输入法在AutoCAD中进行汉字的输入,汉字的显示,以及实现汉字在AutoCAD中的标注。  相似文献   

20.
Web文本挖掘在人们的日常生活和决策分析过程中起到了越来越重要的作用。介绍了Web挖掘的概念和基本特征,在此基础上重点研究了Web文本挖掘方法,引出了Web文本挖掘的模型WebMiner。结合知识库概念,尝试对WebMiner模型进行改进,提出了基于知识库的Web文本挖掘模型K-WebMiner,希望可以提高Web内容挖掘的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号