首页 | 本学科首页   官方微博 | 高级检索  
     

正则表达式在文档自动识别中的应用
引用本文:赵兴涛,王斌君,刘舒. 正则表达式在文档自动识别中的应用[J]. 中国人民公安大学学报(自然科学版), 2005, 11(4): 33-35
作者姓名:赵兴涛  王斌君  刘舒
作者单位:中国人民公安大学,北京,100038
摘    要:
xml格式适合表达法律条文等半结构化的信息。为了能将文本格式的法律文件等自动转 化为xml格式的数据,首先需要理解文本格式法律文件等结构信息。本文利用正则表达式的概 念,有效地识别法律文件的章、节、条、款等结构信息,为将法律文件从正文结构到XML结构 的自动转化奠定了基础。

关 键 词:正则表达式  法律条约XML

Application of Regular Expression into Automatic Recognition of Electric Document
Zhao Xingtao,Wang Binjun,Liu Shu. Application of Regular Expression into Automatic Recognition of Electric Document[J]. Journal of the People's Public Security University(Natural Science Edition), 2005, 11(4): 33-35
Authors:Zhao Xingtao  Wang Binjun  Liu Shu
Abstract:
Keywords:NetFramework
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号