首页 | 本学科首页   官方微博 | 高级检索  
     检索      

数据驱动的自动化机器学习流程生成方法
引用本文:陈高建,王菁,栗倩文,袁云静,曹嘉琛.数据驱动的自动化机器学习流程生成方法[J].广西师范大学学报(自然科学版),2022,40(3):185-193.
作者姓名:陈高建  王菁  栗倩文  袁云静  曹嘉琛
作者单位:北方工业大学 大规模流数据集成与分析技术北京市重点实验室,北京100144
基金项目:国家重点研发计划(2018YFB1402500);;国家自然科学基金重点项目(61832004);国家自然科学基金国际(地区)合作与交流项目(62061136006);
摘    要:自动化机器学习是机器学习前沿的一个重要问题,自动化机器学习工具根据数据集及任务需求组合机器学习算子来构造流程,使领域用户在不具备专业机器学习知识的情况下也能完成相应数据分析工作,但目前的自动化机器学习工具普遍存在耗时长和精度低的问题。本文基于数据集相似性和强化学习原理,提出一种数据驱动的自动化机器学习流程的生成方法,利用相似数据集的历史知识,将神经网络与MCTS相结合,指导机器学习流程的生成。实验结果表明:该方法在耗时方面缩短至分钟级别,流程性能也得到提升。

关 键 词:AutoML  数据集相似性  MCTS  强化学习

Data-driven Method for Automatic Machine Learning Pipeline Generation
CHEN Gaojian,WANG Jing,LI Qianwen,YUAN Yunjing,CAO Jiachen.Data-driven Method for Automatic Machine Learning Pipeline Generation[J].Journal of Guangxi Normal University(Natural Science Edition),2022,40(3):185-193.
Authors:CHEN Gaojian  WANG Jing  LI Qianwen  YUAN Yunjing  CAO Jiachen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号