首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 453 毫秒
1.
基于滑动窗口最长公共子序列Wi Fi指纹定位算法   总被引:1,自引:0,他引:1  
针对基于Wi Fi瞬时指纹定位算法中由于RSS信号的时变特性引起的Wi Fi定位精度差问题,提出了一种基于滑动窗口最长公共子序列指纹定位算法.该算法将时间序列的RSS信号指纹转化为基于滑动窗口的数据模型,增加了指纹特征信息,提高比对准确性.通过计算请求定位数据与样本的最长公共子序列来获得样本点的相似性,解决由于窗口伸缩或滑动窗口中个别采样点无信号引起的比对不准确问题,从而提高了定位的精确性和鲁棒性.实验结果表明,所提定位算法的结果明显优于瞬时指纹定位算法.  相似文献   

2.
针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。  相似文献   

3.
基于序列比对的攻击特征自动提取方法   总被引:3,自引:0,他引:3  
在对生物信息学序列比对理论研究的基础上,将序列比对算法应用到入侵检测模型中,提出一种序列比对攻击特征自动提取新方法.针对Needleman-Wusch算法缺乏攻击知识积累,设计一种基于知识积累的序列比对算法IASA(Information Accumulation Sequence Alignment).新方法首先调整数据去噪并进行数据聚类,使用IASA进行序列比对,使得序列比对的特征片段趋向于更合理结果,再将比对结果所代表的攻击特征转化为IDS规则.实验结果表明,该方法能提高攻击特征生成质量,降低系统误报率.  相似文献   

4.
针对从模板生成的网页中自动抽取web数据的问题,提出了一种新的树对齐算法.该算法能够确定输入网页的最大匹配结构.经过一系列的对齐操作之后,多棵树被合并成为一棵记录着合并前多个网页上的统计信息的合并树,树对齐算法可以发现合并树中的重复模式,在最可能内容块上构建包装器,并按照重复模式从网页上抽取数据.实验结果表明,该算法的抽取结果具有较高的准确性和良好的稳定性.  相似文献   

5.
建立基于链的父亲结构树描述和存储网页信息,采用Htmlparse和基于正则表达式的描述方法,设计、实现了一种高效的基于单元识别的网页信息抽取算法.分析与实验结果表明,文中给出的网页信息抽取方法能提高检索的查准率和查全率.  相似文献   

6.
基于广义隐马尔可夫模型的网页信息抽取方法   总被引:2,自引:0,他引:2  
针对网页所特有的基于版面结构的特点,利用基于视觉的网页分割算法VIPS对网页分块,得到一种新的状态转移序列,取代了传统的状态转移序列。通过二阶Markov链改进广义隐马尔可夫模型(GHMM)的状态转移和输出观测值假设条件,提出了二阶的广义隐马尔可夫模型。最后通过实验说明改进的GHMM对于网页信息抽取有很高的精确率。  相似文献   

7.
序列比对是生物信息学中基本的信息处理方法,对于发现生物序列中的功能、结构和进化信息具有重要的意义。该文对典型的双序列比对算法以及多序列比对算法进行了描述和评价;针对目前序列比对算法普遍存在的不足,提出了一种新的思想--基于知识表达系统的序列比对研究,应用知识表达系统对序列比对相似性发现进行定义及其处理。  相似文献   

8.
概念漂移检测目的在于准确捕获相邻窗口数据模式的变化,包括突变式概念漂移以及渐变式概念漂移。以往算法主要通过比较相邻窗口中聚类结果的差异来判断漂移,文章将序列比对的思想用于概念漂移检测,针对原序列比对算法只注重比中字符数目的局限性,提出了一种可同时考虑比中字符数目和连续匹配字符数目的序列相似性度量。并基于此,提出了一个基于序列比对的概念漂移检测算法CDD_BSA。实验表明:CDD_BSA在符号数据流上具有较好的概念漂移检测效果。  相似文献   

9.
准确挖掘网页中的信息对检索系统非常重要.提出了一种基于模板的网页信息抽取方法进行网页信息抽取.该方法采用网页抓取与数据模板技术实现了网页信息的自动发现与抽取.在Yahoo网站上的实验结果表明,该方法具有较好的检索效果.  相似文献   

10.
针对网页篡改问题,设计了一种基于机器学习的批量网页篡改检测方法.以一所综合性大学所有注册网站为研究对象,通过抓取网站首页面的所有信息,对抓取数据进行分类建立对应的检测规则,综合判断网页是否存在篡改.该方法分为学习阶段和检测阶段,学习阶段根据网页历史信息获取各个检测器的标准值,检测阶段对待检测网页的各个参数进行检测,综合多个检测器的输出,反馈检测结果,若结果为误报,则系统进行重新训练修正参数.以实际发生的网页篡改案例为依据,进行网页篡改模拟,并对误报率和漏报率进行了分析,结果表明:当检测数据集窗口大小为11,报警阈值为2时,误报率为1.183%,漏报率为0.878%,获得了最优的效果.  相似文献   

11.
提出一种基于模型匹配的深网(Deep Web)在线专业数据库查询接口特征抽取方法, 该方法通过分析网页结构中特征词的深度自动抽取查询接口特征向量, 同时考虑频度和集中度两种因素定义特征词向量空间中的权值, 并在传统向量模型的基础上加入特征词个数作为一个新的分量, 构建一个数据库查询接口, 使用模型匹配的分类方法对其进行分类. 实验验证了该方法的有效性.  相似文献   

12.
基于特征相关学习的网页信息提取方法   总被引:1,自引:0,他引:1  
为了给出网页信息提取方法的数学形式化的理论分析,首先用一维空间域的信息函数来表示网页信息,并通过分析网页过滤过程,推导出网页信息过滤定理.然后通过分析网页的相似性,推导并提出一种基于相关过滤的网页特征信息的提取理论.在这个理论基础上,融合基于标识规则和基于内容规则的两种方法,提出一种基于特征相关学习的网页信息提取方法.导出的特征提取理论和实验结果表明这种方法具有较好的准确率.  相似文献   

13.
提出一种新的基于WordNet和文本集语义参数IC的计算方法,通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息,即概念的自信息,同时利用新的参数考虑概念对在WordNet中的共享信息,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题,可以应用在信息抽取、信息检索、文档分类及本体学习中.领域通用的数据集RB数据实验结果表明,该方法在计算语义相似度问题上有效。  相似文献   

14.
基于网络的个人健康管理实时监控健康分析平台   总被引:1,自引:0,他引:1  
针对个性化电子医疗服务、高效医疗服务和远程医疗服务的需求,将国际通行个人健康档案标准数据模型、Java手机客户端和网络服务技术相结合,构建一个基于Web2.0的社区医疗服务平台,该平台实现了为医生/患者、教练/运动员4类用户提供基于网络的实时监控及在线远程医疗分析功能.  相似文献   

15.
一种基于设计模式的分布式指控仿真系统框架   总被引:1,自引:0,他引:1  
以面向对象设计模式为基础, 研究并实现了一种面向指控领域的应用框架. 该框架明确各层之间的纵向和横向关系, 通过统一的抽象接口进行通信, 降低了层次之间的耦合度. 实践表明, 该框架的建立对提高软件重用度、 增强系统的可扩展性和可维护性等都有重要意义.  相似文献   

16.
采用NaOH调节体系的pH值, 通过改变造孔剂柠檬酸的加入量, 制备了一系列新型介孔硅铝酸盐材料, 并利用X射线衍射(XRD)、 透射电镜(TEM)和N2吸附脱附等进行表征, 同时分析了不同柠檬酸加入量对材料孔结构的影响.  结果表明: 合成材料具有蠕虫状内交联的介孔结构,   具有较强的酸性; 柠檬酸与铝物质的量比为13的样品在苯酚与叔丁醇烷基化反应中具有较高的催化活性和对2,4-二叔丁基苯酚(2,4-DTBP)的选择性; 较高的苯酚转化率和对2,4-DTBP的选择性主要归因于催化剂较强的酸性和较大的介孔孔径.  相似文献   

17.
通过改进清晰有理数均值的方法, 提出一种新匹配聚类算法. 首先计算每条数据的清晰有理数均值, 然后与匹配项比较, 得出聚类结果, 解决了人工标注型数据的聚类问题. 将该方法在反欺诈网页领域中进行了检测和验证, 并与使用同一名称但不同类型数据集的K最近邻算法进行比较, 实验结果表明, 该方法在反欺诈网页领域中比K最近邻算法更有效, 同时也证明了新匹配聚类算法在人工标注型数据上聚类具有合理性.  相似文献   

18.
采用计算向量之间相似度的方法, 通过实验分析验证了表格信息在主题爬行中的重要性. 研究结果表明, 与整个网页相比, 表格所能提供的与用户相关的信息占整个网页信息总量的80%以上, 因而在主题爬行领域可以充分利用这一结论进行网页解析. 在舍弃除表格和标题之外的其他元素后, 提高了爬行程序的效率.  相似文献   

19.
针对广告的两个基本特征: 镜头切换较频繁和经常突显商标信息, 提出一种基于镜头切换和文本检测的广告检测算法. 该算法先对各相邻帧进行直方图差分, 再对剪切、 消融、 淡入淡出和划变4种常见的镜头切换方式进行分析和识别, 实现了镜头切换检测. 对于镜头切换频率较低的广告, 通过基于最大梯度差分的文本检测方法检测广告商标信息, 实现了广告自动检测系统. 实验结果表明, 对于约15 min的视频序列, 该检测算法可获得83.32%的正确率, 可初步满足广告检测的要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号