首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
序列比对是生物信息学中基本的信息处理方法,对于发现生物序列中的功能、结构和进化信息具有重要的意义。该文对典型的双序列比对算法以及多序列比对算法进行了描述和评价;针对目前序列比对算法普遍存在的不足,提出了一种新的思想--基于知识表达系统的序列比对研究,应用知识表达系统对序列比对相似性发现进行定义及其处理。  相似文献   

2.
股票市场预测可为投资决策提供重要依据,但在当前的量化投资领域,研究者大多基于单一行业对股票的金融时间序列进行预测研究,忽略了行业背景差异下的股票特征信息;同时,还存在难以有效提取股票时序数据特征、股票情感指标以及股票趋势预测不准确等问题.为解决上述问题,提出利用一种新的WBED(Word2vec-BiLSTM and EncoderDecoder)混合模型对不同行业背景下的股票信息进行时间序列预测研究.该方法采用WB模型进行情感分类,计算情感值,获取情感指标;然后引入双注意力机制,在Encoder模型中利用特征注意力机制给股票时序数据特征赋予不同权重以区别不同特征的重要程度,在Decoder模型中利用时间注意力机制给Encoder模型中LSTM的隐状态赋予不同权重以区别不同时间维度信息的重要程度;最后,利用股票时序数据和情感指标进行股票预测.另外,考虑到不同行业背景下的股票对象对模型超参数的敏感度可能不同,所以为不同行业的股票对象选择合适的超参数使模型的预测性能更好.参考"2019中国上市公司500强",选取三个行业中的九家上市公司股票作为研究对象,采用四种对比模型和四个模型评价指标进行实验分析.实验结果表明,提出的新的混合模型在行业背景差异下的金融时间序列预测研究中有一定的优越性.  相似文献   

3.
准确地预测社交网络中的信息扩散节点可以对谣言、计算机病毒等不良信息的传播以及信息泄露做到早检测、早溯源和早抑制。为了提高微观扩散预测精度,该文提出了一个基于多特征融合和深度学习的微观信息扩散预测通用框架(MFFDLP)。为了获取信息扩散的时序特征,基于信息扩散序列和社交网络图,采用门控循环神经网络提取局部时序特征和全局时序特征,并融合形成信息扩散序列表征;为了获取用户交互行为和兴趣爱好的动态表示,根据历史信息构建信息扩散图,使用级联图注意力网络提取信息扩散子图中节点特征和边特征,并通过嵌入查找,融合形成当前信息扩散序列中相应节点的动态扩散表征;使用双多头注意力机制,进一步捕获静态和动态扩散特征的上下文信息,实现了高精度微观扩散预测。在3个公共数据集上的对比实验结果表明:所提方法优于对比方法,在微观扩散预测的精度上最高提高了9.98%。  相似文献   

4.
提出了一种利用子波基函数神经网络对自动控制系统进行预测的新方法。子波基函数神经网络利用局部获得信息完成函数映射,从实验数据中提取时频特征,基于以前观察获得的数据来预测未来的输出结果。在这篇论文中,我们提出了一种实现子波基函数神经网络的结构和算法,并给出了一个时间序列预测的例子评价子波基函数神经网络预测的性能。  相似文献   

5.
研究发现新的白血病致病基因对揭示白血病机理,寻求有效治疗方法有重要意义.选取了mRNA和protein序列的330个物化特征,发现某些特征在五类白血病(T-ALL、ALL、AML、APL和JML)的已知疾病基因中表现出相似的显著性差异.基于这个特点设计了一种新的白血病疾病基因预测方法.测试结果表明该方法能够有效地从众多候选基因中预测出真实的白血病基因,效果明显优于其他预测方法.  相似文献   

6.
基于对负荷时间序列高阶矩时变特征的研究,提出了一种基于自回归条件密度模型的短期负荷预测新方法.该方法通过引入含时变参数的有偏分布,对负荷时间序列二阶以上矩信息进行了分析和描述.基于南京地区日用电量实际历史数据,分析了该负荷时间序列的时变高阶矩特征,建立了自回归条件密度模型.使用条件对数极大似然估计对模型参数进行了估计,实现了短期负荷预测,验证了该方法的可行性和有效性.结合算例中自回归条件密度模型时变参数的取值范围,推导了时变参数与条件高阶矩的数理关系,给出了一种刻画时间序列时变高偏度(三阶矩)、时变高峰度(四阶矩)的途径.算例分析表明,基于有偏t分布的自回归条件密度负荷预测模型的预测效果良好.  相似文献   

7.
基于医疗数据具有高维度、稀疏等特点,本文提出了一种融合多个评价标准的递归特征消除算法.首先,应用过滤型特征评价标准对特征进行初步筛选;然后,采用特征序列方法对多个特征评价标准的结果进行融合;最后,结合递归特征消除搜索方法进行特征选择.在医疗数据集上与使用单一评价标准的特征选择方法进行疾病预测性能对比实验.结果表明:本文所提方法的预测表现优于其他特征选择方法,其预测的AUC值、精确率、召回率、F1值、准确率均有所提升.  相似文献   

8.
GDP是国民经济发展的一个重要衡量标准,对其进行准确地预测非常重要;以重庆市为研究对象,基于统计数据,应用时间序列分析中的指数平滑法和ARIMA模型以及组合预测模型分别对2015—2020年重庆市的GDP进行了预测,并进行对比分析;研究结果表明:3种方法的误差均较小,但组合模型预测精度更高,重庆市未来几年的GDP年增长率将维持在10%左右。  相似文献   

9.
罗江毅  姚音 《河南科学》2023,(8):1093-1101
依赖于临床标签的氨基酸致病突变预测方法通常由于标签存在跨基因的偏差、稀疏噪声等因素,出现性能膨胀的情况.为解决此问题,创新地在不需要标签的情况下,利用预训练蛋白质语言模型计算ClinVar数据库中突变位点的氨基酸概率分布,并基于此分布构造突变型与野生型氨基酸出现概率的对数优势比(LOR),使用一种全局-局部结合的高斯混合模型拟合LOR,从而无监督地计算突变致病效应概率分数(PPE)并推断致病性,最后给出预测的不确定性度量.使用与深度突变扫描(DMS)实验的相关性作为评估指标以避免标签泄漏等问题.模型评估结果验证PPE具有稳健的致病性预测性能,在2458个蛋白质上的接收者操作特征曲线下面积(AUC)平均值约为0.89,与4种DMS实验的平均斯皮尔曼相关系数约为0.44,优于大部分依赖标签的计算方法,且与高通量实验的性能相当.该研究为遗传变异的解释、疾病的研究、诊断和临床治疗提供了可靠的辅助工具.  相似文献   

10.
借助混沌分析理论介绍了电力负荷时间序列的混沌性识别技术,给出了一种基于混沌负荷序列的预测方法--基于相空间轨迹演化模式的预报模型,该方法具有预测精度高、计算速度快的优点,在短期负荷预测中可获得相当满意的结果.  相似文献   

11.
电力负荷的混沌预测方法   总被引:9,自引:0,他引:9  
借助混沌分析理论介绍了电力负荷时间序列的混沌性识别技术,给出了一种基于混沌负荷序列的预测方法-基于相空间轨迹演化模式的预报模型。该方法具有预测精度高、计算速度快的优点,在短期负荷预测中可获得相当满意的结果。  相似文献   

12.
语音的韵律特征对情感表达起着非常重要的作用。在基于韵律修改的情感语音转换系统中,为了更为准确地预测情感语音的韵律特征,该文提出一种层次化的韵律分析与建模方法,针对愤怒、高兴、悲伤、惊奇这4种情感对语音按照韵律结构的层级进行分析,探讨不同层次之间情感韵律特征变化规律的关联性和叠加性,并使用高层音段信息作为输入对低层信息进行决策树建模。实验结果表明,本方法对情感韵律特征的预测均方误差比局部分音段以及传统的决策树韵律模型低大约5%。  相似文献   

13.
风险价值VaR是一种非常重要的风险度量方法,基于C藤copula(canonical vine copula)给出了条件VaR的一种新的估计方法.首先基于C藤copula对连续几个交易日收益率之间的自相依结构进行了估计,进而给出了在前n个交易日收益率条件下,下一交易日收益率密度函数的估计方法,并对下一交易日的VaR值进行估计.C藤copula的引入使我们能更准确地描述收益率序列中的相依结构,从而能够更加准确地预测市场风险.最后分别对沪深300指数、上证180指数和上海黄金交易所贵金属价格进行了CVaR估计以及预测效果检验实证分析,实证结果表明所提出的模型在VaR值预测方面的表现要远远优于历史模拟法以及方差-协方差法等.  相似文献   

14.
针对民航发动机寿命预测中监测参数较多筛选困难的问题,提出一种基于信息融合与相关向量机的发动机剩余寿命预测方法。首先通过核主元分析方法从发动机多维监测数据中提取退化特征信息;然后利用非线性模型将主元序列融合成反映发动机退化趋势的健康指数序列;最后采用相关向量机以历史失效数据为训练样本建立预测模型,对现有的发动机健康指数序列进行外推预测得到当前样本的寿命预测值。通过NASA Ames研究中心公开的涡轮风扇发动机仿真数据验证了该方法的有效性,其预测性能优于常用的支持向量机模型和过程神经网络模型。  相似文献   

15.
灰色趋势灾变预测及其在数据挖掘中的应用   总被引:4,自引:0,他引:4  
分析了数据库中由异常数据组成的小样本序列的特点,给出了灾变序列的定义,结合系统云灰色预测模型,提出了灰色趋势灾变预测的方法,对灰色趋势灾变预测在数据挖掘中的应用进行了研究,给出了对数据库中“贫”信息数据序列进行数据挖掘的步骤.以全国旱涝灾害数据为研究对象,对全国水灾年份进行了预测分析,其预测结果与实际现象相符.  相似文献   

16.
为了更好地研究樟疫霉的致病机制及防治方法,笔者基于病原菌效应分子具有的典型特征,利用Signal P、Prot Comp、TMHMM、big-PI Fungal Predictor和Target P等生物信息学预测程序对樟疫霉中328 457条蛋白质序列进行候选效应分子找寻,发现该菌含有3 439个小分子分泌蛋白,同时,对上述蛋白进行冗余性、半胱氨酸数量以及信号肽长度等性质进行分析。结果表明:上述分泌蛋白中存在较多的冗余性蛋白,所占比例为50%以上,并以含有1~10个半胱氨酸、17~26个氨基酸信号肽的分泌蛋白居多。另外,利用卵菌中效应分子所具有的保守基序RXLR,对拥有唯一氨基酸序列的1 549个分泌蛋白进行基序找寻,明确樟疫霉中存在160个候选效应分子。通过上述生物信息学分析方法可实现樟疫霉候选效应分子的预测。  相似文献   

17.
张量分解和深度学习已被应用于推荐系统,并取得了较好的效果.张量分解较好地从用户对推荐对象评分中提取用户、推荐对象以及其他影响因素的隐性的特征,将这些特征进行匹配,给出推荐策略,但这种方法忽略了用户、推荐对象以及其他影响因素现有辅助数据信息中的显性特征.深度学习是从辅助信息中提取用户、推荐对象以及其他影响因素的特征,并进行匹配给出推荐策略,却忽略了用户评分数据中用户、推荐对象以及其他影响因素的隐性特征.将张量分解和深度学习两种推荐方法相融合,提出一种基于张量分解和深度学习的混合推荐算法.使用张量分解算法和深度学习分别从三阶用户评分数据和多源异构辅助信息中提取用户特征和推荐对象特征,并将它们匹配得出用户对推荐对象的需求或喜爱的预测评分,再将两种算法的预测评分进行融合给出最终综合评分,从而提高个性化推荐的精准度.对比实验证明混合推荐算法与传统的协同过滤算法相比误差降低了34. 0%.  相似文献   

18.
为更好地预测灌浆功率时序,建立基于模糊信息粒化(FIG)和灰狼优化支持向量机(GWO-SVM)的灌浆功率时序预测模型。首先,引入信息粒计算方法,将原始详尽的时间序列数值点分解为一系列信息粒,以减少模型的数据输入总量;其次,基于模糊集理论,采用模糊集算子对每个信息粒进行模糊计算,使得到的模糊信息粒可以合理地表示原始数值点集;最后,以支持向量机作为预测工具,并采用灰狼优化算法进行参数寻优,对产生的模糊信息粒进行快速准确的预测。结合实际工程,应用该预测模型对灌浆功率的波动范围和变化趋势进行预测研究,经过性能评价和对比分析,验证了模型的有效性和优越性。  相似文献   

19.
目的:介绍白色念珠菌基因组的最新研究进展.方法:查阅国内外大量关于白色念珠菌基因组研究的文献并进行综合详述.结果:白色念珠菌是第一个完成全基因组测序的致病性真核生物,在基因组序列信息研究上取得了重大进展,在基因功能、转录组、蛋白质组等方面获得了许多重要成果.结论:白色念珠菌的基因组研究成果将对研究白色念珠菌的致病机制、耐药机制以及抗真菌药物开发有重大的意义.  相似文献   

20.
基于Theil不等系数的调和平均组合预测模型研究   总被引:1,自引:0,他引:1  
The il不等系数是一种新的相关性指标,基于该指标提出调和平均组合预测的一种新的模型,探讨了该模型非劣性组合预测、优性组合预测以及冗余预测方法的存在性,并给出冗余信息的判定.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号