首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 18 毫秒
1.
基于模糊聚类的网络论坛热点话题挖掘   总被引:3,自引:0,他引:3  
为解决单个帖子线索的多话题性问题,识别聚类中的孤立点,提出一种基于模糊聚类的网络论坛(BBS)热点话题挖掘算法.采用模糊聚类进行话题识别,使得一个帖子线索可以隶属于多个话题,而对于隶属度远小于类内平均隶属度的帖子线索,则当作孤立点来处理.此外,还给出了一种面向BBS文本的特征表示方法,并结合隶属度给出基于模糊划分的话题热度评分公式.实验结果验证了该算法的有效性.  相似文献   

2.
考虑到微博数据存在时序性特征以及包含用户的社交网络行为特征,提出一种动量信号增强模型算法来有效地检测微博突发话题.由于传统模型未考虑微博数据变化以及用户社交行为的影响,为此首次提出影响力因子以及热度因子,用以修正动量模型.为获取影响力因子,将计算出当前时点前给定周期内的数据对当前数据的变化差值的指数累计影响作为影响力的衡量标准,以体现词频在该区间段的重要性.影响力因子将用于修正词频序列,以获取MACD值指标.由于用户的社交行为对话题产生影响巨大,进而提出热度因子用以修正MACD值指标.当模型满足指标阈值时,特征词则列为突发特征词.最后,通过K-means聚类算法将特征词进行归类合并,以获取突发话题.实验结果表明,模型精度能达到81.82%,表现良好.  相似文献   

3.
描述了一个基于Web的监督自适应话题追踪系统.在IBM的对称Okapi公式算法基础上,通过结合监督自适应机制,对报道进行评分.系统通过调整关键字权重和增量学习的方式,对话题追踪任务中的监督自适应机制提出了新的算法,弥补了现有话题追踪系统的不足.该算法还考虑话题追踪的时序性,引入了时间信息.以互联网的新闻报道作为测试语料,将有监督自适应话题追踪系统与无监督自适应话题追踪系统进行性能比较.结果表明,有监督的自适应方法能有效降低误报率和漏报率,提高话题追踪的性能.  相似文献   

4.
为探求时序数据间的相关性与灰色模型的模拟预测效果之间的关系,提出了先对时序数据进行自相关分析,在判断自相关程度高低的基础上,建立等维灰数递补动态模拟预测模型.并分别对渭河流域的林家村站和华县站1983-2000年的年径流数据以及安徽省1989-2006年的工业和生活废水排放量数据进行了实例分析,发现自相关程度越高,精度越高.最后根据时序的自相关程度和精度检验的高低,给出了确定进行短期预测或者中短期预测的建议.  相似文献   

5.
本文选取上海证券交易所不同行业3只市值热度较高的股票运用ARMA-GARCH-t模型对其日收益率与波动性进行预测,在推广的Black-Litterman(BL)模型的框架下,将投资者主观收益分布与资产的先验均衡分布相结合,计算资产的配置权重,并与传统的马科维兹均值-方差(MV)模型给出的组合权重进行对比,发现投资者对资产收益的信心水平越高,BL模型在投资组合中赋予相应资产的权重越高,且投资组合的收益也得到提高。最后,通过融资融券分析验证3只股票市场配置的有效性,说明BL模型给出的配置更符合投资者预期。该研究可以为资产管理者和投资者在资产配置方面提供更多借鉴。  相似文献   

6.
针对系统中存在的索引检索效率问题,提出了一种基于时序参数的快速索引优化算法,该算法通过时间参数和序数参数获取数据块的热度值,将高热度值的数据块指纹组合成了一个高优先度的快速索引.快速索引与主索引组成了重复数据删除中的两层索引结构,从而提高了系统的检索性能.通过实验验证了基于时序参数的索引优化算法的优越性.  相似文献   

7.
火灾自动报警系统运行的实质是信号流遵循相应"时序"传递的过程,传统可靠性评估方法无法考虑其时序性特点.基于GO法能够描述有实际物流的系统的时序性特点,通过对火灾自动报警系统进行分析、绘制其GO图,并分别采用概率矩阵和输出状态组合的方法,构建基于GO法与故障树法比较分析的火灾自动报警系统可靠性评估模式.将其应用于具体案例,从可靠度、割集、概率重要度等可靠性参数的角度对两种方法进行比较分析,探讨时序性对系统可靠性分析的影响.研究表明,GO法可以有效解决系统可靠性分析过程中因"时序性"造成的误差.  相似文献   

8.
网络舆情安全是社会安全的重要组成部分,识别和追踪热点话题是治理突发事件网络舆情的基础。现有研究具有网络舆情事件表征不全面、对于热点话题的识别和追踪局限于语义信息等问题。该研究基于社交、内容、话题、情感4个维度构造超网络模型,并引入时间特征作为网络的连接关系,用于定量表征时序的网络舆情事件;将话题节点在超网络中的中心性及中心性变化率作为话题热度的度量指标,实现热点话题发现及演化跟踪;应用“甘肃白银马拉松”微博舆情案例对模型和指标进行验证分析。研究结果表明:该时序超网络模型能够清晰表征突发网络舆情事件,中心性及中心性变化率指标能够准确识别和跟踪热点话题,并为实时态势研判预警、舆论引导等提供指导。  相似文献   

9.
传统的lasso法因其解的稀疏性、变量选择的稳定性被广泛应用在高维、复杂、多变的大数据的降维及分类中,但在处理时序大数据时,lasso法因不考虑变量的时序关系而受限制。鉴于这一缺点,本文在处理时序数据时采用序lasso方法。序lasso将不同特征的不同时间点的数据作为输入变量,能够有效地估计出每个特征最合适的时滞间隔,它的优点是在恢复真实系数上消除了尾部的波动性。基于实际的时序数据上的实验结果证明了本文的模型和算法。  相似文献   

10.
针对目前粒度支持向量回归机的粒划算法只考虑了距离因素,引入时序因素,提出适用于金融时间序列的基于距离和时序的层次粒度支持向量回归机(DTHGSVR).该方法首先将训练样本通过核函数映射到高维空间,并在该特征空间中进行初始粒划.然后,通过衡量样本粒与当前回归超平面的距离以及当前样本粒时序的综合因素,找到含有较多回归信息的粒,并通过计算其半径、密度及时序信息进行深层次的动态粒划.如此循环迭代,直到没有粒需要进行深层划分为止.最后,对不同层次的粒进行回归训练.采用提出的基于距离和时序因素的层次粒度支持向量回归机对基金净值进行预测,实验结果表明回归的泛化性有所提高.  相似文献   

11.
基于多中心模型的网络热点话题发现算法   总被引:1,自引:0,他引:1  
为了有效消除网络话题相关报道内容侧重点变化对网络话题发现准确性的影响,提出了网络话题多中心模型.将报道内容之间的关联关系层次化,提高了对网络话题的描述能力.提出了基于多中心模型的网络热点话题发现算法,利用话题中心判别新出现的报道是否属于已有网络话题,算法基于单遍聚类思想,通过引入话题中心的策略优化了算法的计算开销.实验结果表明:该算法可以全面、准确地发现网络热点话题,同时具有较为理想的性能,可应用于大规模网络动态流式数据环境下的热点话题发现.  相似文献   

12.
为了刻画金融时间序列的尖峰厚尾性及股市中存在的杠杆效应,Ding、Granger和Engle(1993)提出了APARCH模型,但在关于此模型的研究中,通常假设条件分布为正态分布或对称厚尾分布,如t分布、GED分布.在兼顾波动性和分布两个方面的基础上对收益率序列建立APARCH-st模型,给出其VaR和ES的计算方法,并与基于APARCH-t模型的ES值相比较,结果表明,考虑偏态分布得到的ES估计更为保守.  相似文献   

13.
虚拟机热点的判断是虚拟机热点消除过程中的关键环节.传统方法通常判断监测指标是否超过阈值,未考虑判断指标与服务之间的关系,影响判断的准确性.本文结合部署在虚拟机上的服务的可用性和质量因素建立了热度评估指标体系,提出了基于模糊层次分析的主观权重和基于离差最大化法的客观权重的确定算法,以及将主观权重和客观权重相结合的热度综合评估方法,并给出了基于热度的虚拟机冷热点判断规则.实验结果表明,利用热度进行热点判断的准确率高于利用传统设定阈值的方法,可以有效减少不适当的迁移,热点消除的代价较小.  相似文献   

14.
基于自相关函数相位的频率估计方法方差分析   总被引:2,自引:0,他引:2  
为了分析基于自相关函数相位频率估计方法的性能,推导了加性高斯白噪声背景中正弦信号观测数据的相关函数相位噪声的表示式,得到了相位噪声方差的计算公式和基于自相关函数相位的频率估计方差的计算公式,给出了此类频率估计方法的估计方差与信噪比、观测数据长度以及对相关函数相位差进行平滑时利用的相关函数的点数关系.仿真结果与该文给出的公式计算结果吻合很好.  相似文献   

15.
本文是前文所述数学方法在时序逻辑网络分析方面的应用.利用矩阵布尔代数运算与逻辑函数方程的最小项展开,本文给出了时序逻辑网络状态转移矩阵的计算方法以及状态方程和输出方程的矩阵解法.这些方法易于在计算机上实现.  相似文献   

16.
基于局部和全局的LDA话题演化分析   总被引:1,自引:0,他引:1  
章建  李芳 《上海交通大学学报》2012,46(11):1753-1758
对话题演化进行形式化描述,探讨了基于全局和局部话题演化的2种建模方式,并应用话题相似度和困惑度进行评测.对房地产话题和奥运会话题进行实例分析,给出了2种不同建模方法在话题演化方面的优缺点.两会报告实验结果表明,全局话题演化能够获得较好的模型参数,方法简单可靠;而局部话题演化则能产生细粒度话题,反映新话题的产生和旧话题的消亡.  相似文献   

17.
为了降低加工过程的热误差,提高数控机床加工精度,基于时序相关分析理论与数值计算方法,建立了一种以温度场分布及加工参数为输入的新型机床主轴热误差建模方法.所建模型由热误差模型、主轴动压轴承热特性模型以及主轴热传递模型三部分组成.该方法首先根据时序相关理论建立热误差与温度测点之间的相关模型,再通过灰色相关理论完成关键温度测点位置与数量的优化,同时,基于数值计算与热传导理论,建立了动压主轴系统热特性模型.以一台大型龙门导轨磨床为实验对象,建立了磨床主轴箱热误差预测模型.实验结果表明,所建立的热误差模型具有良好的热误差辨识性能.  相似文献   

18.
以一氧化碳利用率为能耗评估指标,在高炉一氧化碳利用率混沌特性的基础上,提出了一种基于混沌理论高炉一氧化碳利用率的预测方法.首先以两座具有代表性的中高型高炉的一氧化碳利用率时序为样本,采用混沌相空间重构技术,对其进行相空间重构.其次利用自相关方法和G-P方法计算其重构空间的参数(时滞时间和嵌入维数).最后基于已获的混沌重构相空间参数,采用混沌加权一阶多步预测方法,建立高炉一氧化碳利用率的混沌预测模型,对其进行多步预测.现场实际数据的预测结果表明了所提出方法的有效性和预测模型的精准性.  相似文献   

19.
为解决电子排斥势能的计算,基于电子的波动性和粒子性相互依赖的观点,依据状态寿命正比于状态出现频次的构想,给出了一种电子排斥势能的计算方法。在这种方法中,体系的真实状态(或平衡状态)被看作由所有可能状态叠加而成。把能量看成各种不同状态寿命的函数,给出了在已知的电子密度分布数据限制下通过调整状态寿命参数获得能量极值的方法。本文方法可为双电子排斥能计算提供新的启示。  相似文献   

20.
过热度是铝电解生产过程中的一项重要参数,将过热度保持在适当的范围内可以提高电流效率,减小电解槽损耗,但是过热度测量难度较大且测量过程复杂.因此,基于粒计算理论,提出一种基于时间粒的过热度预测模型.通过在时间序列上构建时间粒,结合时间粒构建新的特征集与样本集,在此基础上,利用分类器对新的样本集进行训练,得到模型.采用山东魏桥铝电有限公司的铝电解生产数据进行实验,结果表明,该方法在预测过热度上较已有模型的预测能力有较大提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号