首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
对Linux下实时通信软件的分类、配置、构成进行了分析,提出了一种基于多Agent的计算机取证模型,给出了系统的结构和设计,以及采用的关键技术.该系统能够准确地定位和收集LumaQQ等Linux实时通信信息,进行数据分析,形成取证报告.  相似文献   

2.
针对Web同一对象内部信息组件之间的空间距离小于不同对象之间信息组件之间的距离这一显示特征.提出一种新的Web对象抽取方法.通过分析给定页面中不同实体间的空间位置关系来判断哪些信息成分属于同一对象,与Web文档的表示无关.通过Web页的文档对象模型(DOM)获得不同信息成分之间的位置关系,进而判断这些信息组件是否属于同一对象.实验结果表明,该方法对于多个领域中不同结构的Web文档具有很好的适应性.对于设计结构规则,含有多个数据对象的页面,抽取结果的准确率可以达到100%.  相似文献   

3.
Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的Web信息抽取,针对Web网站的分类体系,提出了基于HTML页面分块算法的Web网站分类体系包装器WCSW(website classification system wrapper),WCSW将整个网站作为包装对象,以分块算法和块语义特征分析为基础,根据抽取规则对网站具有分类语义的导航信息块进行处理.实验结果表明:抽取的Web网站分类层次的准确率较高,实用性较强.  相似文献   

4.
WWW网站分类体系包装器WCSW   总被引:1,自引:0,他引:1  
Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的Web信息抽取,针对Web网站的分类体系,提出了基于HTML页面分块算法的Web网站分类体系包装器WCSW(website classification system wrapper),WCSW将整个网站作为包装对象,以分块算法和块语义特征分析为基础,根据抽取规则对网站具有分类语义的导航信息块进行处理.实验结果表明:抽取的Web网站分类层次的准确率较高,实用性较强.  相似文献   

5.
Web网页中含有丰富的信息资源,通过网页分类可以更好地对其内容进行抽取和管理,方便用户阅读.针对网页复杂的结构信息和丰富的文本内容,提出了一种基于网页文本和结构的网页分类方法,利用众创相关网页的结构特点和文本信息,选择联合特征和原子特征相结合的方法进行分类.实验表明,这种方法有一定的可行性,且比单一使用文本信息进行分类的方法具有更高的正确率和召回率.  相似文献   

6.
基于字符图像质量评价的打印机取证   总被引:1,自引:0,他引:1  
为了认定打印文件的来源,提出一种基于字符图像质量评价的打印机取证方法,在分析字符打印区域“条带”噪声的基础上,通过高斯滤波对字符图像提取噪声,并借助图像质量评价方法提取噪声图像的统计特征,来描述每台打印机的个体特征,并采用支持向量机作为分类器,对比目前国外已有文献的方法,所提出的方法不仅10台打印机都判决正确,而且字符分类正确率有很大提高,字符图像质量特征抓住了打印机的个体特性,使取证结果有效且具有说服力。  相似文献   

7.
李洋  栾吉华 《科技资讯》2007,(35):80-81
以往基于DOM的Web信息抽取方法在信息抽取过程中存在如需要较多样本集、适应性较差等问题,为解决Web上的信息在抽取中存在的问题,本文提出了一种在原有基于DOM的Web信息抽取方法的基础上引入竞争分类方法进行信息抽取.  相似文献   

8.
针对传统的Web信息抽取方法运算量大、自动化程度低的问题,提出了一种基于SVM的WEB信息自动化抽取方法。利用SVM优秀的分类性能将网页中有用数据和无用数据分类标注,有效地完成Web信息抽取任务,准确地抽取出所需信息,实现数据抽取的自动化。实验结果表明,该方法可以有效地获取网页信息特征,具有较高的召回率和准确率。  相似文献   

9.
典型相关分析(CCA)是一种经典的多视角特征提取方法,可以从2个视角中查找特征集之间的线性相关关系.但CCA在做分类任务时具有多个缺点,一是CCA本身为无监督学习方法,做分类时没有利用样本的类信息,二是CCA仅考虑需要分类的目标数据,而忽略了与目标数据来自同一域的Universum数据的信息.因此人们提出增强组合特征判...  相似文献   

10.
计算机取证模型大致可以分为静态取证模型和动态取证模型两类。动态取证模型主要结合入侵检测技术,检测异常事件的发生,从而采集动态数据,对采集来的数据进行整理、归纳后并入证据库。静态取证技术是在事后取证,对涉事计算机设备进行分析处理,提取磁盘和移动存储设备的内容,对其进行分析归类,最后形成证据。该文主要结合事后静态取证技术提出一种基于证据文件特征集构建的取证模型,阐述了模型提出的目的和意义,分析了取证模型各模块的功能和实现方法,叙述了基于特征集构建的取证模型的取证步骤,最后介绍了皮尔森相似度算法在构建特征集模型中的应用。  相似文献   

11.
基于特征相关学习的网页信息提取方法   总被引:1,自引:0,他引:1  
为了给出网页信息提取方法的数学形式化的理论分析,首先用一维空间域的信息函数来表示网页信息,并通过分析网页过滤过程,推导出网页信息过滤定理.然后通过分析网页的相似性,推导并提出一种基于相关过滤的网页特征信息的提取理论.在这个理论基础上,融合基于标识规则和基于内容规则的两种方法,提出一种基于特征相关学习的网页信息提取方法.导出的特征提取理论和实验结果表明这种方法具有较好的准确率.  相似文献   

12.
本文从主题分析的个人特征、写作风格的特点及写作技巧方面,浅评了美国女作家凯瑟琳.诺瑞斯的《the holy use of Gossip》,认为该部作品是一个作者把自己对“流言”这个主题自由的表述和和写作技能完美结合的典范。  相似文献   

13.
A classification method for Web information extraction   总被引:2,自引:0,他引:2  
Web information extraction is viewed as a classification process and a competing classification method is presented to extract Web information directly through classification. Web fragments are represented with three general features and the similarities between fragments are then defined on the bases of these features. Through competitions of fragments for different slots in information templates, the method classifies fragments into slot classes and filters out noise information . Far less annotated samples are needed as compared with rule-based methods and therefore it has a strong portability. Experiments show that the method has good performance and is superior to DOM-based method in information extraction.  相似文献   

14.
中国学术期刊编辑的现代写作学特征是批判性、逆向性、延续性。其批判性是通过审读来审定学术论文稿件的创新性、学术性、科学性,纠正谬误,规范文体,达到出版标准;其逆向性在于适应连接作者中断了的思维的需要,由后写作状态逆返至写作状态或前写作状态;其延续性在于继续作者中断的思维,圆满完成论文。三者相辅相成,构成一个完整的写作能力结构。  相似文献   

15.
Deep Web查询接口分类是实现Deep Web在线数据库分类访问的主要方法,本文在研究查询接口特征数据抽取和表示的基础上,通过对查询接口所在Web页的位置来构建对应的接口特征XML文档,根据XML文档中的节点位置不同,分别为不同的查询接口特征赋予不同的分类权重因子,以提高有效特征的分类能力,并采用信息增益算法实现最终分类特征的选择,然后采用KNN分类算法实现查询接口分类,实验结果表明此方法的实际可行性.  相似文献   

16.
基于结构与内容的网页主题信息提取研究   总被引:11,自引:0,他引:11  
结合HTML网页内部特征与外部的结构布局,提出采用映射表这种网页映射模式对网页视图进行变换,基于结构与启发式规则对网页进行区域分割与识别,并利用向量空间模型对网页内容分析,从而准确得到具有高语义内聚性的网页主题内容.实验结果表明,此方法对各种复杂结构的网页主题信息提取较为理想.  相似文献   

17.
介绍了Web2.0的概念和技术特征,阐述了Web2.0信息组织和检索的特点,比较了Web2.0与Web1.0在信息组织和检索方面的差异,分析了Web2.0在应用中存在的问题。  相似文献   

18.
司各特·菲茨杰拉德的作品很多,其代表作《了不起的盖茨比》被人们认为是"一部象征性的,甚至是讽刺性的作品,代表了美国社会本身",[1]它是"我们现代文学史上仅有的几部真正的神话小说之一"。[1]在《了不起的盖茨比》中,作家以其丰富的色彩描写和象征手法,深刻地刻画了"爵士时代"美国社会的风貌,成功地展示了20世纪20年代存在于大多数人身上的"美国梦"破灭的历史全程。这部小说在运用色彩刻画人物形象等方面取得了很大的艺术成就。本文从色彩这一角度来分析作者的写作技巧和象征意义。  相似文献   

19.
Web 3D图像的存储管理及在数字博物馆中的应用   总被引:1,自引:0,他引:1  
应用Web 3D技术并使用VRML语言实现对普通图像以及Web三维空间的一般场景描述,提出将互联网三维信息与关系型数据库相结合存储管理数据的方案,结合数字博物馆研究课题展示了Web 3D图像存储在数据库服务器中的方法,论述了不同方案的解决特点和存储文物Web 3D数据信息的应用意义。  相似文献   

20.
Web技术的发展和应用促进了图书馆的信息资源建设向着广度和深度方向发展。概述了Web1.0和Web2.0及其在图书馆信息资源建设中的应用特点,阐述了Web3.0的理念和技术特性,分析了Web3.0给图书馆信息资源建设带来的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号