首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
将预处理后的XML数据当作文本信息采用词频-逆向文档频率(TF-IDF)模型进行处理时,逆向文档频率作为词项权重有其不足之处.为此,文中定义了词项的数据源敏感度作为逆向文档频率(IDF)的修正系数.其值取决于提供此词项的数据来源于不同数据源的概率,概率大则其值大,反之则其值小.然后在修正后的词项权重向量的基础上,定义了相似度函数.最后在模拟、真实数据集上进行数据重复检测实验.结果表明,新方法获得了更高的F测度值.这说明考虑词项的数据源敏感度可提高相似度函数的有效性.  相似文献   

2.
互联网上提供的同一事实的信息通常会存在冲突,影响数据集成和知识发现.为了甄别真值,提出了一种基于距离的异构数据联合真值发现算法.首先,关于同一数据项,基于数据源声明值与真值的距离,计算数据项向量;采用KMeans聚类算法,获得数据项初始聚类.然后,迭代进行信任分析和聚类,即在每个类簇内,采用最优化思想,联合异构类型数据,更新事实的可信度和数据源的类簇内可靠性,重新计算每个数据项向量,再次聚类,迭代直至类簇达到稳定.实验结果表明:由于细粒度的数据源质量划分,联合考虑异构数据类型,可以获得更高的真值发现准确度.  相似文献   

3.
大量的web应用需要融合来自不同数据源的真实信息,然而关于同一实体的同一属性,不同的数据源可能会提供多个不同甚至彼此冲突的数据.如何判断数据源的可靠性和甄别事实的真假,即真值发现问题,日益获得关注.针对web数据集成中的多真值发现问题,提出了一种基于贝叶斯分析和最大似然估计的迭代计算方法,将真值发现的每一步与数据源可靠性评估紧密结合.首先,根据提供更多真实信息的数据源具有更高可靠度和由可靠的数据源提供的事实数据更可能为真值的基本原则构建似然函数,将事实真值作为模型的隐变量,并将正确性和错误性两方面的数据源质量指标作为模型参数.然后,迭代执行E步(计算事实为真的概率)和M步(评估数据源的质量),直至参数收敛.最后,真实数据集上的实验结果表明我们的方法提高了真值发现的准确率,有效解决了数据融合过程中的多值冲突问题.  相似文献   

4.
为了解决短文本的语义稀疏和特征信息难以提取问题,本文提出了一种基于深度学习的短文本分类方法.首先通过增加自注意机制的双向BiLSTM通道获取短文本特征词向量,引入外部CN-DBpedia知识库KBs来深度挖掘短文本语义,解决语义稀疏问题.其次通过BTM主题模型在短文本数据集上提取主体信息,为了得到准确的词向量拼接引入了超参数δ.最终将所得的特征词向量以及知识向量运用语义余弦相似度计算并拼接向量,将得到的拼接结果与主题信息通过Softmax分类器中进行分类.在中国微博情感分析数据集、产品评价数据集、中文新闻标题数据集、Sogou新闻数据集上进行实验.与TextCNN、TextRNN、TextRNN_Att、BiLSTM-MP、KPCNN算法相比,分类准确性有一定提高.  相似文献   

5.
基于相关向量机的电力负荷中期预测   总被引:11,自引:0,他引:11  
针对电力负荷中期预测比较困难并且存在较大误差的问题,提出了一种基于相关向量机的中期预测方法.结合EUNITE网络提供的实际数据,研究了日最大负荷前后期关系、日最大负荷与节假日的关系和当日与对应星期数的相关性,并建立了相应的电力负荷中期预测模型.该模型是将与某天相关的n个前期信息作为该天的日最大负荷的输入量,而日最大负荷与节假日、当日(星期数)的关系信息用两个二元值表示.在模型训练前,将输入量的前7个属性值和预测目标值进行归一化处理 采用不同训练样本集的仿真实验结果表明,相关向量机方法比支持向量机方法具有更多的优点,当高斯核函数的宽度值取为2 0时,相关向量机方法具有较为理想的预测效果.  相似文献   

6.
Web数据挖掘是将数据挖掘技术和理论应用于对互联网资源挖掘的一门新兴研究领域.XML能够为web数据挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.分析了Web数据挖掘的特点,并将XML技术引入Web数据挖掘领域中,进而在此基础之上介绍了一种数据挖掘的模型.  相似文献   

7.
电力云计算将虚拟化与分布式技术代替传统的服务器+SAN/NAS信息计算模式,虚拟池对数据的整合与管理在提高资源利用率和降低建设成本的同时,由于电力云稳定和可靠工作的前提很大程度上依赖于良好的网络状态,由此也带来故障诊断更加复杂的新挑战.为了实现电力云网络故障的诊断,针对网络故障本身具有的小样本和非线性特征,采用支持向量机SVM算法,在二分类无法解决多分类的基础上进行改进,选择了一对一SVM,借助实验数据和MATLAB仿真结果验证了其可行性.  相似文献   

8.
一种新的基于P2P的电信海量数据分析业务模式   总被引:1,自引:0,他引:1  
Internet环境中存在着大量的边缘节点.作为Internet主要建设者并拥有数量庞大数据业务用户的电信运营部门是否可以挖掘这些边缘节点蕴涵着的巨大的计算能力和信息资源,是一个值得深入研究的课题.基于P2P的对等思想,提出一种对电信运营部门具有参考价值的新的业务模式,即利用电信数据业务用户,在用户接入网络享受服务的同时,聚集广大用户闲置的计算资源来分析电信运营部门自身的海量数据.首先分析P2P技术对电信运营部门正面和负面影响,并选择适合电信运营部门采用的P2P网络拓扑结构;然后分析目前电信运营部门对海量数据分析的迫切需求,具体描述了基于P2P的电信海量数据分析业务,以及如何以电信为中介推广P2P应用;文章最后阐述了如何构建基于P2P的数据分析应用示范系统.  相似文献   

9.
我国电力信息化已经初见成效,但其中海量的信息资源存在数据结构混乱、数据应用层次浅、未能被充分利用等情况。本文提出了整合企业现有的各种主要应用系统,利用XML良好的数据结构性和网格技术,为各个异构数据源建立一个数据共享平台,再用网络数据挖掘技术作为一个有力工具,使之产生更大的社会和经济效益。同时结合我国现状,总结了对数据挖掘影响较大的几种因素及其相关对策。  相似文献   

10.
短期电力负荷预测作为电网企业的基本工作,其精度的提高对于电网企业运营管理和调度管理具有较大的意义,然而由于电力负荷受到诸多非线性因素的影响,因此得到高精度的电力负荷预测结果是比较困难的.本文首先利用数据挖掘中的k-means聚类技术对训练集的气象数据进行聚类分析,分析提取相似日,在提取相似日的相关历史数据后,建立支持向量机模型进行短期电力负荷预测.经算例结果证明,由该方法得出的预测结果平均相对误差为0.88%,和同结构支持向量机预测的平均相对误差(1.66%)以及ARMA预测的平均相对误差(3.81%)相比,预测精度得到明显的提高,证明了该方法的有效性.  相似文献   

11.
图集的统一协调,对图集质量有很大影响。本文是作者在编制北京市农业区划地图集的实践基础上,根据地图信息传输论的观点,对农业区划地图集的统一协调的内容及方法进行了探讨。试图总结编制这类图集的统一协调模式,以供读者编图时参考。  相似文献   

12.
研究了国家法的抽象正义观与民间法的情理正义观,认为西方国家法的抽象正义观与东方民间法的情理正义观存在实质的不同,原因在于思维方式、超验与经验传统、政治结构的差别。在现代法治理念下,传统民间法所代表的正义观将向混合正义观转型,西方法治所代表的国家法抽象正义观是其骨架。  相似文献   

13.
给出了一维非自治时滞系统点态退化的一个例子,拓宽了该领域的研究。  相似文献   

14.
利用对位异构体的对称性由核磁共振氢谱测定了工业十二烷基苯在硝硫混酸中的硝化选择性,发现一硝化产物中对位异构体的比例为75% ̄80%。以月桂酸和苯为原料,经氯化、酰化和还原合成了正十二烷基苯。在同样条件下研究了正十二烷基苯的硝化,由核磁共振氢谱和气相色谱分析,发现一硝化产物中对位异构体的比例仅为60%。根据空间位阻效应,对结果进行了讨论,并与甲苯,乙苯,异丙苯等短链烷基苯的硝化结果进行了比较。  相似文献   

15.
YBCO掺杂效应研究   总被引:3,自引:0,他引:3  
介绍了YBCO掺杂的基础知识,总结了YBCO各个位置采用典型元素掺杂而导致的超导电性和结构的变化,阐述了掺杂对YBCO的重要影响,并简介了当前YBCO掺杂效应研究中的几个热点问题.  相似文献   

16.
由于有限群的Lagrange定理的逆不成立,因此,n较大时要确定n次交代群An的所有子群或对An阶数的每一个正因数,确定是否存在这个阶数的子群是较困难的问题.文章通过对5-循环置换各次方幂的计算及其研究,构造出了A5的5个12阶子集,并证明了每一个子集都是A5的12阶子群,最后对A5的部分阶的子群做了总结.  相似文献   

17.
18.
许多科学家包括诺贝尔奖获得者李政道教授都预言,真空是未来物理学的一个重要研究对象.十七世纪的伽利略时代人们曾讨论过"真空"是否存在的问题.当时的学术界分成两派,一派以帕斯卡为代表,认为真空存在,另一派以笛卡尔为代表,认为真空不存在,最后实验证明"真空存在派"正确.现代研究表明,真空并非一无所有,这样就产生了一个新的问题"排除了真空物质后的空间",即"真空的真空"是否存在.本文探讨了与"真真空"有关的问题,提出了一些观测实验方法,这些方法可以帮助我们最终解答"真真空"的存在性问题.  相似文献   

19.
为了找出诱发高频机组基础不良振动的原因,从基础计算模型方面对基础激励与响应进行了分析,以两个高频机组基础为动测实例,经模态分析得出钢筋混凝土构架式基础竖向1阶振动与电机产生共振;应用功率谱法对动力机组及基础平台进行动测,得出平台异常响应频率66Hz为水泵工作频率,调整机器的工作频率可避开不良振源影响,达到明显的减振效果。由此而知,动力机器基础出现不良振动时,不可盲目改变结构的动力特性,应在机器不同工况比如:停机、起机及正常转速下,对机器及基础进行动测并对振动信号进行比较分析,以制定出行之有效的减振方法。  相似文献   

20.
基于“前沿分支”的观点研究了圈幂补图的树宽,首先确定了它的树宽下界,又给出了达到此下界的标号,从而得到了它的树宽表达式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号