首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
客观来说,房价受到诸多因素的制约,正因如此,房价预测仍然是数据分析中一个非常经典且具有挑战性的问题.本文针对房价数据冗余,在实际场景中很难确定重要特征,提出了一种创新的数据预处理方式,并通过双模型迭代拟合的方式进行数据预测.首先从数据意义、数据形式和数据关联性三个方面进行初始数据预处理,然后根据数据选择适合的模型进行训练.在传统机器学习中,Random Forest和XGBoost是两种常用的方法.RF模型通过其Bagging过程,能够准确地评判“冗余”特征,而XGB模型在提高预测效果的同时,也囿于其泛化能力下降,无法稳定地反映特征重要性.因此,本文利用RF模型处理冗余数据,并使用XGB模型对新数据集进行拟合提高预测效果.本文在Kaggle竞赛的数据集(House Prices-Advanced Regression Techniques)上进行了实验,测试结果显示,XGB回归模型最终的回归精度R2为87%,而单独的RF模型或XGB模型的R2分别为79.2%和78.7%.实验证明,该数据预测方法能够明显提高房价预测效果.同时,为充分体现模...  相似文献   

2.
近年来,小型无人机在无卫星导航条件下的使用需求日益强烈.针对多目标识别问题,提出一种基于小型多旋翼无人机平台的多运动目标识别定位技术,首先采用一种先快速定位感兴趣区域基于视觉注意机制,再用机器学习算法分析感兴趣区域获取目标的方法.实现了对图像中的指定目标进行追踪,同时还实现对目标的定位,其定位误差小于15 cm.该方法有效降低了光照变化、运动模糊、颜色类似物干扰及复杂背景等因素的影响.以地面机器人作为追踪目标进行算法测试验证,在目标消失时间较短的情况下,能够达到较好的追踪效果.  相似文献   

3.
提出了一种新的基于深度置信网络的交通流预测方法,利用深度置信网络良好的训练和预测性能,能够很好地学习时序数据集的内部特征,从而准确地预测交通数据流.为了验证算法的有效性,在PeMS数据集上对算法进行了实验测试,并同其他相关预测和分析方法进行了比较,实验结果表明新算法具有较好的预测性能.  相似文献   

4.
药物不良反应事件是造成患者发病、死亡的主要原因之一.传统的基于患者自发报告系统存在较为严重的漏报情况,近年来将推特等社交媒体作为数据来源进行药物不良反应事件检测的研究愈发受到重视.各种深度学习模型通常依赖于大量的训练样本,然而受限于数据来源的特质和耗时的数据标注工作,该领域的相关研究面临标注数据规模小、数据噪声大等问题,制约了这些模型发挥良好的效果.据此,在文本表示层面引入基于图嵌入数据增强和对抗训练两种正则化方法,提升模型在低资源高噪声下的药物不良反应事件检测效果.通过实验,具体分析和讨论两种方法的适用范围,结合卷积神经网络,提出一种同时发挥其优势的药物不良反应事件检测模型,实验结果显示其具有良好的适用性.  相似文献   

5.
在新服装产品销售预测任务中,由于缺乏历史销售数据,通常需要充分利用其他模态的数据作为补充。然而,多模态服装数据通常具有冗余性和异构性。为解决这些问题,提出一种包括三个主要元素的层次化多模态注意力循环神经网络(hierarchical multi-modal attention based recurrent neural network, HMA-RNN)。层次化结构将高层语义信息与低层语义信息分离,以避免信息冗余。在模态融合阶段引入多模态注意力机制(multi-modal attention, MMA)以减轻固有的数据不对齐问题。采用共享注意力机制构建跨多模态数据的依赖关系。在Visuelle 2.0数据集上的试验结果表明,所提出的方法加权平均百分比误差(weighted average percentage error, WAPE)为72.07,平均绝对误差(mean absolute error, MAE)为0.80,明显优于现有的方法,表明了该研究所提出的方法的有效性。  相似文献   

6.
7.
杨宇  闫钰  申芳  谷宇恒 《科学技术与工程》2023,23(18):7607-7621
随着互联网的普及,网络空间与陆地、海洋、天空、太空齐名,已成为国家第五大主权领域空间。网络安全的重要性日益凸显,入侵检测作为有效的攻击检测手段,正被广泛研究。首先从入侵检测的概念和分类出发,详细阐述了入侵检测的前两个环节:数据采集及处理和信号分类。然后,围绕机器学习和深度学习两个研究热点对信号分类的技术进行了归纳和总结。最后,对于当前研究的问题提出了思考和总结,并对未来方向进行了分析和展望。  相似文献   

8.
在电商供应链的自动化管理过程中,高质量的商品短期需求预测是供应链管理的基础和核心功能。基于电商大数据对商品需求进行准确预测,可以帮助企业降低成本,提升用户体验,对整个电商行业的效率提升都会起到重要作用。由于受用户喜好、价格调整、季节变化等各种动态与间歇性因素影响,使得该项任务具有一定的挑战性。首先创新性的使用商品历史销量走势图作为商品特征,通过深度学习的迁移学习获取图像特征并对商品进行聚类分析,目的是针对相似的商品进行预测;接着将短时段内(天为单位)的商品时序动态特征转为二维矩阵数据,通过卷积神经网络(CNN)自动提取特征,在与商品的固有特征融合后,连接到较长时序(周为单位)的长短期记忆神经网络(LSTM),并通过混合密度网络(MDN)进行预测输出。最后使用阿里巴巴菜鸟网络下的真实电商数据验证了所提算法更加的精确和有效,该算法符合大多数以综合性商品销售为主的电商平台,具有较好的可扩展性和普遍的应用价值。  相似文献   

9.
由于各医学图像分割任务的差异性,通常在单独的数据集上进行神经网络的训练,而跨数据集的共享信息可提高各项任务的表现。本文旨在提出一种部分监督的语义分割方法在由两个数据集合并的部分标注数据集上进行血管内超声影像(IVUS)的冠脉结构分割,即:使用多标签语义分割来解决数据集标注不一致的问题,并提出了一种具有类再平衡策略的非对称双分支网络来提高分割性能。本文提出的方法取得了比全监督方法更好地分割性能;并且分割结果与参考标准在管腔面积(r=0.99;P<0.001)、中膜面积(r=0.99;P<0.001)和斑块负荷(r=0.95;P<0.001)也取得了强相关性及优秀的一致性;此外,本文方法有效地利用了标注不一致的部分标注数据集,缓解了IVUS影像分割中“数据饥饿”的问题。  相似文献   

10.
11.
网络社交媒体的快速发展提供了便捷的信息获取方式,但也滋生了谣言和虚假新闻,现有的谣言检测模型在有标注数据充足时能有效解决分类问题,然而谣言可用的标注数据有限,各种针对谣言特点精心设计的模型倾向于过拟合,同时,现有模型的鲁棒性不足,谣言传播者恶意破坏谣言传播结构会使模型出现分类错误.针对以上问题,采用自监督的图对比学习方法,对原始谣言传播图进行不同方式的数据增强来模拟对原图的扰动,建立自监督对比学习任务,使图编码器捕获谣言更趋本质的特征,缓解了过拟合,提高了模型的鲁棒性与泛化性能.在来源于主流社交媒体平台的三个公开数据集Twitter15,Twitter16和PHEME上进行了对比实验,实验结果显示,提出的模型的准确率比基准模型分别提高3.4%,1.8%和1.2%,证实了图自监督对比学习方法在谣言检测任务上的有效性.  相似文献   

12.
近十年来,通过社交网络(如微博、推特)分享信息已经成为人们日常生活中不可缺少的一个环节,如何有效地预测信息传播的影响力成为社交网络研究中的重要课题,不论是识别病毒式营销和虚假新闻还是精确推荐和在线广告都有许多应用.目前,一些应用深度学习进行社交网络影响力预测的方法已经取得了一定进展,但在进行深度学习时仍会面临以下难点:用户通常具有不同的行为和兴趣并且他们同时通过不同的渠道进行互动;用户之间的关系难以检测和形式化表达.传统的社交网络影响力预测方法通过设计复杂的规则来手动提取用户及其所处网络的特征信息,这一方法的有效性严重依赖于设置规则的专业性,所以很难将某一领域的规则推广到其他领域的应用中去.基于深度神经网络模型,设计一种端到端的神经网络来学习用户的隐藏特征信息以预测其社交网络影响力.首先通过图嵌入的方式对用户的局部网络进行特征提取,然后将特征向量作为输入对图神经网络进行训练,从而对用户的社会表征进行预测.该方法的创新之处:运用图卷积和图关注方法,将社交网络中用户的特征属性和其所处局域网络特征相结合,大大提高了模型预测的精度.通过在推特、微博、开放知识图谱等数据集上的大量实验,证明该方法...  相似文献   

13.
细胞内物质的主动运输主要通过马达蛋白这一特殊的纳米机器来完成。在运输过程中,马达蛋白之间的协作性显著影响着距离、速度等重要的运输特性。为了理解这一机制,我们结合Gillespie模拟和理论推导,解释了单马达蛋白的力学特性如何影响了多个马达蛋白之间的协作性,进而对运输距离进行调节。我们建立了一个深度学习模型来帮助快速获得马达蛋白的运动参数。我们的结果揭示了同向马达蛋白在细胞内运输的物理本质。  相似文献   

14.
由于真实世界中的复杂数据经常能够被表示成李群结构,文章设计了一个以李群特征作为输入的深度网络架构,以此利用深度学习强大的特征表示能力来进行模式识别等任务。在构建李群深度神经网络的过程中,为了保证在优化时李群特征能够被限定在微分流形的结构上,提出了适用于李群特征的深度学习算法。算法在特征学习的过程中不仅能够保证不损失数据流形结构的信息,同时也限定了参数优化的假设空间。基于李群特征的深度学习算法在CIFAR-BW和MNIST数据集上,通过为静态图像设计辐条模型的李群特征,实验结果表明算法在较少次数的迭代下就能够收敛到较为理想的结果。  相似文献   

15.
提出了使用深度栈式自编码模型进行空气质量预测.选择了PM2. 5、PM10等污染物数据作为样本.本模型基于Java平台构建,进行了训练和参数调整,建立了最优的空气预测模型.根据北京市的实验结果表明,该模型具有良好的精度.与支持向量回归(SVR)模型和线性回归模型相比,本文提出的模型具有优越的性能.  相似文献   

16.
自动驾驶车辆需具备预测周围车辆轨迹的能力。诸多发展中国家普遍存在弱规则、强交互的混合交通流道路,高密度混合交通流的车辆轨迹预测是极具挑战性的任务。为了兼顾混合交通流道路环境下轨迹预测的高精度和可解释性,设计一个融合领域知识和经验的深度学习模型(DK-Conv-LSTM)实现车辆的长、短时轨迹预测。该模型采用卷积结构(Conv)提取交互特征,并将融合车辆历史信息的特征向量送入长短时记忆网络(LSTM)模型实现轨迹预测。知识经验通过嵌入损失函数的方式引导深度学习模型的训练。与基础的LSTM相比,仅添加卷积层结构的Conv-LSTM模型可提升终点轨迹误差(FDE)约30.46 %,提升平均轨迹误差(ADE)约34.78 %;而DK-Conv-LSTM模型可分别提升FDE 46.81 %和ADE 49.08 %;同时DK-Conv-LSTM模型可还原多前车跟驰、超车行为的驾驶轨迹。  相似文献   

17.
针对攻击者可能通过某些技术手段如生成式对抗网络(GAN)等窃取深度学习训练数据集中敏感信息的问题,结合差分隐私理论,提出经沃瑟斯坦生成式对抗网络(WGAN)反馈调参的深度学习差分隐私保护的方法.该方法使用随机梯度下降进行优化,设置梯度阈值进行梯度裁剪,对深度学习的优化过程添加噪声实施隐私保护;利用WGAN生成与原始数据相似的最优结果,对比生成结果与原始数据的差异进行反馈调参.实验结果表明,该方法可以有效保护数据集的敏感信息并且具有较好的数据可用性.  相似文献   

18.
为了预防新冠肺炎的传播,在佩戴口罩的同时,保持一定的社交安全距离是必要的。为解决现有的目标检测算法在社交距离检测中无法同时满足检测的实时性、准确性以及在复杂场景中存在遮挡、小尺度目标等问题,提出基于YOLOv3的改进算法DPPY(Dilated Pyramid-Pooling with YOLOv3)。首先使用空洞卷积参与到YOLOv3的核心图像处理结构中,然后引入密集型连接网络进一步融合不同层之间的连接,并且在这基础上还模仿了空间金字塔结构处理输入数据的尺寸问题,最后将这些处理结果一起与待追踪物体与彼此间的前后位置进行更好的关联并选用卡尔曼滤波器这个工具来更好地处理。若行人彼此间靠的过于紧密,则标红发出警报,以便更好地提醒相关人员注意。结果表明:与传统的YOLOv3算法相比,DPPY算法检测速度更快,检测精度更高。检测速度达到了34帧/s,平均准确率(Average Precision, AP)提高了9.1 %,并且在大、中、小目标检测中平均准确率均值(mean Average Precision, mAP)分别提高了7.8 %、8.2 %、8.9 %。  相似文献   

19.
随着在线社交网络的高速发展和影响力日渐扩大,研究其演化发展规律已经成为非常重要的课题.通过抓取新浪微博的数据,将用户划分为意见领袖和普通用户,并建立了一个定量的两层演化模型.在此基础上,分析了意见领袖和普通用户之间社交影响力的差异,研究了网络内部病毒传播机制和外部媒体因素对在线社交网络演化过程的影响,并利用抓取的实际数据验证了模型的准确性.研究结果对进一步探寻在线社交网络结构、社会价值观对在线信息传播的影响均有积极意义.  相似文献   

20.
针对路网的拓扑信息不完整而无法实现时空结合交通流预测的情况,提出了一种基于时间序列预测模型联合数据编解码机制的预测方法。对路网内路段交通流数据进行编码得到路网信息的链状结构,以此获取路网结构中的拓扑信息;通过时序模型对链状结构进行交通流预测,完成对链状结构的时序特征提取;最终,通过解码方法得到路网的时空交通流预测结果。采用GPS数据,选取不同路网进行对比实验,引入数据编解码的时空交通流预测方法与时间序列模型进行比较,并且与基线模型HA和ARIMA展开了对比实验。实验结果表明:深度学习模型引入数据编解码机制后,模型性能明显提升;引入数据编解码机制的深度学习模型的性能比基线模型的性能更优越。该方法仅仅使用简单的时间序列深度网络再联合数据的编解码机制即可实现时空结合的交通流预测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号