首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 359 毫秒
1.
在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用到文件压缩与解压中。并在文件并行处理过程中,与数据分解法相结合对数据文件进行分割,将分解后的数据由主线程分给多个处理器上的多个子线程来并行处理,以此提高多核处理器的利用率并提高文件压缩效率。最后通过实验模拟验证模型以及算法性能。研究结果表明:在八核处理器下通过对文本文件、图像文件和音频文件等多种不同类型文件进行压缩解压试验,验证了动态Huffman并行算法与串行算法相比其加速比可以达到1.5~8.0倍,性能也得到很大提高。  相似文献   

2.
提出一种基于多核加权支持向量机的水质预测方法.核函数及其参数选择与数据分布的情况密切相关,采用单一的核函数应对水资源质量评价指标的整个数据分布难以达到很好的预测结果.采用多核加权学习的核函数避免了核函数设计的盲目性和局部最优等非线性优化问题.实例表明,该方法的预测结果是合理可行的,且与以往同类预测方法相比,有着更为客观...  相似文献   

3.
局部多核学习算法(LMKL)是一种变系数的多核支持向量机算法,其利用选通函数局部的选取合适的合成核函数;但是其选通函数有严重的参数沉余的问题,为此提出了改进的局部多核学习算法(ILMKL),在其目标函数中加入正则项,区别于LMKL中选通函数的l1范数形式,使用选通函数的lp范数形式,增强核函数间的“互补”作用;采用该算法在模拟数据集和UCI数据集上实验,结果表明该算法取得较高的分类能力.  相似文献   

4.
考虑到实际生物系统的非线性特性,提出了一种基于分数阶微分方程模型构建基因调控网络的新方法,采用模型预测数据与实际数据的逼近误差为目标函数,通过人工鱼群优化算法辨识分数阶微分方程模型的阶次和参数,并引入自适应步长,保留精英个体和增加种群多样性等策略提高算法的进化能力。对真实生物实验数据的结果表明,该方法能够较准确的辨识出模型参数,得到的分数阶微分方程模型与实际数据吻合程度较高。  相似文献   

5.
为提升河流流量的预测精度,将支持向量机与AR进行耦合,并构造三核混合核函数的流量预测支持向量机模型。以渭河流域的月径流量为例,首先,通过时间序列分析,将渭河流域的径流序列划分为趋势序列、季节序列和随机波动序列,然后利用AR模型构造适用于支持向量机算法的数据集,并将数据集按4∶1划分为训练集和检验集;其次,利用线性组合构造由多项式核函数、径向基核函数与Sigmoid核函数构成的三核混合核函数,在训练集上,采用遗传算法确定相关参数,随后在检验集上进行预测。结果表明:遗传算法确定参数会带来较大的不确定性,导致结果差异较大,从而着重讨论遗传算法带来的参数不确定性;通过函数构造与统计分析,给出三核混合核函数参数选择的一般性方法与流程,并进行验证,该参数选取方法能够降低遗传算法的不确定性,得到精度较高的流量预测结果,预测流量与实际流量的均方误差从150左右降低到130左右。  相似文献   

6.
提出一种基于偏差信息准则(deriance information criterion,DIC)的鲁棒贝叶斯混合分布模型选择算法.在变分逼近框架下,给出鲁棒贝叶斯混合模型的DIC计算公式;设计的模型选择算法能同时学习模型参数推断和进行模型选择,避免在大的候选模型集中根据模型选择准则选取最优模型.给出试验参数初始值设置方法,在含有较多离群点的仿真数据和Old Faithful Geyser数据上的试验结果表明了好的性能:得到鲁棒的混合分量参数和较准确的混合分量个数.  相似文献   

7.
主流句子分类算法采用单一词向量表示模型获得文本表示,导致了对文本的映射能力不足.对此,通过融合多种词向量的文本表示以提高分类的准确率.针对多核学习在融合不同核函数时,常规的核函数系数寻优方法存在的训练时间长、难以求得局部最优解等问题,提出了一种新的核函数系数寻优方法,该方法基于参数空间分割与广度优先搜索不断逼近核系数的最优值.以支持向量机(support vector machine,SVM)为分类器,在7个文本数据集上进行了分类实验.实验结果表明,多核学习分类效果明显优于单核学习,并且所提出的寻优方法在训练次数少于常规方法时也能获得了好的分类效果.  相似文献   

8.
针对传统的并行哈希划分算法不能高效地利用多核处理器的并行资源,且不能较好处理有倾斜的输入数据的问题,提出了一种在多核处理器中基于MapReduce的哈希划分算法,并且提出了存储结构优化、多步划分优化、数据倾斜优化3种优化策略。该算法将输入数据分成若干块后提交给各个线程并行处理,并选择合适的策略避免写冲突,使其能够高效地利用多核处理器的并行资源。文中提出的哈希表能够提高cache效率,从而提升算法的整体性能。引入MapReduce模型可使多步哈希划分在Map过程和Reduce过程中分别进行;数据倾斜优化策略能使算法适应有倾斜的输入数据,且具有较好的效果。实验结果表明:在多核处理器中,文中提出的算法能够适应各种分布的输入数据,并且使哈希划分的整体性能得到提升。  相似文献   

9.
为有效解决露天矿山行车事故预测模型建模时,易受小样本数据、离群数据规模影响,导致模型精度损失、算法抗噪容差能力及收敛速度下降等问题,提出一种基于二次惩罚项修正(PTS)的改进支持向量回归机模型(WLSSVR)。根据训练样本的数据分布特性,研究了服从露天矿山现实应用场景的二次惩罚项,进一步提高回归机模型的抗噪容差能力;考虑非线性预测模型影响因子选择困难的问题,研究了数据降维及因子分析方法,并将主成分分析方法引入到输入数据预处理算法中,以保证算法可得到理想的输入;针对传统回归机模型易受核参数选择影响,易导致模型早熟和收敛速度慢等问题,研究了粒子群惯性因子、学习因子的自适应迭代形式,提出了一种应用改进粒子群算法优化回归机模型核参数的方法。以露天矿行车事故频次预测为例,进行了预测和对比实验。实验结果表明:引入PTS模型的测试集预测结果明显优于不采用PTS策略的预测结果。这说明,应用文中提出的二次惩罚策略和参数优化算法对复杂系统的事故预测问题研究是可行且有效的。  相似文献   

10.
在监督学习中,模型的选择直接影响学习算法的推广能力.子空间信息准则是模型选择的一种新准则,它在一些假设条件下,给出推广误差的一种无偏估计.研究再生核Hillbert空间时,将子空间信息准则应用于模型参数选择问题,也证明子空间信息准则是推广误差的一种无偏估计.  相似文献   

11.
针对变压器油中溶解气体浓度的预测问题,提出了一种基于互信息和核熵成分分析(KECA)的油中溶解气体浓度预测建模方法。首先,用标准互信息变量选择方法确定模型的输入变量并对选取的输入变量进行相重构;然后,利用Renyi熵信息测度确定KECA核参数并采用KECA对相空间进行特征提取;最后,以核熵成分作为机器学习极限学习机(ELM)的输入,建立变压器油中溶解气体浓度的预测模型。实验结果表明,与灰色模型、支持向量机、BP神经网络建模方法相比,本文提出的方法能够充分利用油中溶解气体浓度信息,因而具有较优的预测精度和泛化能力。  相似文献   

12.
带钢退火过程中存在多变量非线性主导因素和数据噪声,难以用数学模型精确描述退火炉内带钢的延伸量.针对这一问题,提出基于核主元分析(KPCA)与免疫粒子群(ICPSO)优化最小二乘支持向量机(LSSVM)的炉内带钢延伸量软测量方法.采用ICPSO算法避免了粒子群算法易陷入局部最优的缺陷,利用ICPSO对LSSVM进行参数寻优,通过KPCA去除样本噪声,提取输入数据样本中的非线性主元信息,建立ICPSO-LSSVM软测量模型.此方法用于退火炉内带钢延伸量预测,通过现场生产数据仿真实验进行非线性函数估计;对比其他几种现有算法,实验结果表明本文方法具有较高的预测精度.  相似文献   

13.
山区环境中泥石流的孕育受多种因素的影响,为提高泥石流危险性的预测精度,提出一种萤火虫算法(firefly algorithm, FA)优化核极限学习机(kernel based extreme learning machine, KELM)的预测模型。首先,针对数据维度爆炸的问题,通过主成分分析(principal component analysis, PCA)数据降维,使得留有大部分致灾特征信息的因子输入训练模型;然后,使用萤火虫优化算法更新核极限学习机的参数,将四川省北川县监测数据输入优化后的预测模型,并与其他传统机器学习算法进行对比分析,验证该算法的优越性;最后,使用多种指标综合评估模型的预测效果。结果表明,FA-KELM模型能够有效地简化数据结构,提高泥石流危险性预测的准确性,为泥石流灾害预测方面的研究提供参考和借鉴。  相似文献   

14.
大型复杂装备的工作过程均表现出较强的非线性,并且受非高斯噪声和各种不确定因素的影响,导致状态监测信息多是高维的非线性、非高斯数据,且计算量随信息维数呈指数增长,若直接用于预测模型则导致计算量异常庞大,不利于完成模型参数估计和实现实时维修。针对上述问题,对核独立分量分析算法中关于核函数参数选择的盲目性,提出了用粒子群优化算法改进核参数选择过程的核独立分量分析算法,实现了高维状态信息的降维。最后,通过对某自行火炮发动机油液监测数据进行特征降维实例分析,验证了所提方法的可行性与有效性。  相似文献   

15.
提出一种停车设施片区优化指引的模型方法,以首选停车场和备选停车场的平面距离最小为目标函数,在泊位饱和度和车辆接受停放概率等约束条件下,建立停车片区优化指引模型,设计结合作图法的两层次搜索算法确定停车场备选解集.采用模糊优选评价方法进行备选方案的排序研究,通过隶属函数对各备选停车场方案的原始数据进行标准化处理,并通过备选方案与基准方案的贴近度数值评价各次选停车场的排序,以东莞市中心城区第7停车分区作为计算实例,说明停车片区停车指引模型和模糊优选评价方法能够成功地应用实施.  相似文献   

16.
采用持向量机方法构建了居民出行方式选择模型,使用网格搜索方法选择支持向量参数,避免参数选择的随机性,分析不同核函数对模型构建的影响。研究表明,采用多项式核函数、RBF核函数构建的支持向量机模型对居民出行方式预测精度较高,所构建的模型可用于居民出行方式预测;在支持向量机核函数选择中,优先选择RBF核函数,其次为多项式核函...  相似文献   

17.
针对目前TBM数据挖掘能力和掘进参数优化预测分析的不足以及对未来TBM实现无人驾驶的展望,将最小二乘支持向量机(LS SVM)机器学习应用到TBM掘进参数预测中,从吉林引松工程TBM掘进数据中提取掘进上升段的刀盘扭矩、刀盘推力、总推力、推进速度这4个重要参数建立LS SVM预测模型,预测4个参数在稳定段的均值,并讨论了模型训练集大小、参数选取等对预测性能的影响。结果表明,以原始数据中均匀提取的样本、RBF核函数和10折交叉验证建立的LS SVM模型可以较为准确地预测稳定段中上述4个参数,验证了LS SVM机器学习预测TBM掘进参数的可行性。  相似文献   

18.
网络流量数据序列具有混沌特性.相空间重构后,采用一种改进黑洞算法优化回声状态网络的非线性模型对网络流量进行预测.改进黑洞算法是在现有工作的基础上提出一种新的新解生成机制,可以提高算法的收敛速度和精度;相比于遗传算法、和声搜索算法等其他优化算法,所提出的改进黑洞算法不依赖自身相关参数的准确设定;将其应用于回声状态网络4个重要参数的优化选取,使得预测模型具有较好的预测稳定性.通过Mackey-Glass混沌时间序列和网络流量公共数据集的仿真实验,结果表明所提出的方法具有较好的预测性能.  相似文献   

19.
软件缺陷预测是软件开发过程中的一项重要技术,针对软件缺陷数据集的高维、小采样造成预测精度下降的问题,采用线性局部切空间排列算法对数据集降维处理,选用支持向量机作为基础分类器进行二值分类,建立软件缺陷预测模型,采用二维混淆矩阵评价模型的预测精度.实验结果表明,与其他模型相比,该模型可用较少的邻域点约简至更低的维度,不需要重新学习样本空间的流行几何结构,直接映射新的样本点,且预测时间耗费成本由13. 726 9 s降低至6. 217 s,给定参数区间寻优时间耗费由267. 442 1 s降低至165. 98 s,有效提高了软件缺陷预测的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号