首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种针对网络流式文本数据的匹配算法
引用本文:林建秋,杨书华,孙建东.一种针对网络流式文本数据的匹配算法[J].齐齐哈尔大学学报(自然科学版),2005,21(2):37-41.
作者姓名:林建秋  杨书华  孙建东
作者单位:1. 哈尔滨工业大学(威海),威海,264209
2. 山东大学软件学院,济南,250101
摘    要:本文描述了一种对网络流式数据实时监控的搜索算法,应用有限自动机的原理.实现对任意长度数据流进行多关键字无回溯单遍匹配扫描,且加入概率计算,在一定程度上实现文本的简单模糊语义分析。该算法已被网络过滤软件使用,并有良好表现。

关 键 词:自动机  状态集  信息获取  关键字  字符串匹配
文章编号:1007-984X(2005)02-0037-05
修稿时间:2005年1月20日

A match arithmetic for the data of net flouting text
LIN Jian-qiu,YANG Shu-hua,SUN Jian-dong.A match arithmetic for the data of net flouting text[J].Journal of Qiqihar University(Natural Science Edition),2005,21(2):37-41.
Authors:LIN Jian-qiu  YANG Shu-hua  SUN Jian-dong
Abstract:This paper describes a simple, efficient algorithm to locate all occurrences of any of a finite number of keywords in a string of text, especially for data stream from Internet. The algorithm consists of constructing a finite state pattern matching machine from the keywords and then using the pattern matching machine to process the text string in a single pass. To some extension, the algorithm implements simple ambiguous syntactic parser in text. The algorithm has been used to improve the speed of some filter software for internet.
Keywords:string pattern matching  information retrieval  keyword
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号