【AI读论文】AutoML的8年回顾:分类、综述与趋势

论文标题:Eight years of AutoML: categorisation, review and trends

论文链接:https://link.springer.com/article/10.1007/s10115-023-01935-1

本文主要围绕自动机器学习(AutoML)展开了系统性的文献综述,总结了该领域的主要观点和发现。以下是对每个章节的主要观点的归纳总结:

  1. 摘要

  • AutoML的目的:解决机器学习方法在实际应用中所需的技术知识和背景,以及耗时和重复的步骤,使其更加实用。

  • AutoML的发展历程:自2014年出现以来,AutoML领域的发表数量显著增长。

  • 主要技术趋势:神经架构搜索(NAS)的增长明显,算法选择问题逐渐被工作流程组合所取代。

2. 理论背景

  • AutoML的目的:自动化机器学习过程中的各个阶段和任务,以及应用的技术。

  • AutoML的主要任务:超参数优化、神经架构搜索、算法选择和工作流程组合。

3. 综述方法

  • 研究问题:对AutoML领域的研究进行了四个主要问题的调查,包括术语的提取、定量发展趋势、自动化阶段和技术的覆盖范围,以及未来的趋势和开放性问题。

4. AutoML分类法

AutoML分类方法是根据文献综述中提出的三维分类法,对AutoML方法进行分类的一种方法。这个分类方法包括三个维度:自动化的知识发现过程阶段、执行的任务以及应用的技术。让我们对这三个维度进行更详细的介绍:

  • 自动化的知识发现过程阶段:这个维度涉及到AutoML方法所涉及的知识发现过程的不同阶段,例如数据预处理、数据挖掘和后处理等。文献综述发现,AutoML主要集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。这个维度的分类可以帮助研究人员了解不同AutoML方法在知识发现过程的不同阶段上的应用情况。

  • 执行的任务:这个维度涉及到AutoML方法所执行的具体任务,例如超参数优化、神经架构搜索、算法选择和工作流程组合等。文献综述发现,AutoML方法主要集中在超参数优化和神经架构搜索等任务上。这个维度的分类可以帮助研究人员了解不同AutoML方法在执行不同任务时所采用的方法和技术。

  • 应用的技术:这个维度涉及到AutoML方法所应用的具体技术和方法,例如进化算法、贝叶斯优化、梯度下降等。文献综述发现,不同的AutoML方法采用了不同的技术和方法来解决自动化问题。这个维度的分类可以帮助研究人员了解不同AutoML方法所采用的技术和方法的差异和特点。

这个三维分类法为AutoML方法的分类提供了一个全面的框架,帮助研究人员更好地理解和比较不同的AutoML方法。

5. 定量结果

  • 发现AutoML领域的研究数量自2014年以来呈现显著增长,2021年的发表数量几乎是2014年的五倍。

  • 发现AutoML主要集中在数据挖掘阶段,而其他阶段的自动化研究相对较少。

73f6ded6d9c85cd2b9a1b53e9f6d397a.png

AutoML历年相关论文数量

6. 质性结果

  • 发现AutoML领域的主要研究集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。

  • 发现AutoML方法倾向于将自动化过程视为黑匣子问题,限制了生成模型的可解释性或关于达到生成解决方案的过程的解释。

7. 阶段、任务和技术的交叉分析

对AutoML方法在不同维度之间的关系进行了分析。这个分析旨在揭示不同阶段、任务和技术之间的关联,以便更好地理解当前的AutoML研究趋势和存在的挑战。

  • 阶段和任务的关系:通过分析不同任务在自动化知识发现过程的不同阶段中的应用情况,研究人员发现了一些趋势和模式。例如,他们可能发现某些任务在特定阶段中的应用频率较高,而在其他阶段中较低。这有助于了解不同任务在知识发现过程中的角色和重要性。

  • 任务和技术的关系:通过分析不同任务所应用的技术和方法,研究人员可以揭示不同任务所采用的技术趋势。例如,他们可能发现某些任务更倾向于采用特定的技术或方法,而其他任务则更倾向于采用不同的技术。这有助于了解不同任务所涉及的技术和方法的差异和特点。

这种交叉分析有助于揭示AutoML研究中不同维度之间的关系,为研究人员提供了更深入的理解和见解。这种分析有助于发现当前的研究趋势、存在的挑战以及未来的研究方向。

8. 开放性问题、挑战和趋势

在挑战部分,研究人员指出了AutoML领域面临的一些挑战和问题,并对未来的发展趋势进行了推测和讨论。

  • 未覆盖的阶段:研究发现,AutoML主要集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。这意味着AutoML方法尚未涵盖整个知识发现过程,而是集中在部分阶段的自动化上。这表明未来的研究需要更多地关注知识发现过程中其他阶段的自动化,以实现更全面的自动化支持。

  • 缺乏互操作性:目前的AutoML方法通常只自动化知识发现过程的单个阶段,而缺乏不同方法之间的互操作性。这意味着不同的AutoML方法往往是孤立的,难以相互配合和复用。未来的研究需要考虑如何实现不同AutoML方法之间的互操作性,以便更好地支持整个知识发现过程的自动化。

  • 人类角色的作用:AutoML方法通常作为黑匣子方法,缺乏对生成模型的解释和人类参与的支持。未来的研究需要考虑如何将人类纳入AutoML系统的自动化过程中,以实现更好的交互和指导。此外,未来的研究还需要关注如何生成可解释的模型,以便更好地支持人类的理解和解释。

  • 实证验证和可复制性:研究发现,许多AutoML方法在实验验证方面存在一些不足。例如,一些方法只是与简单的机器学习基准进行比较,而缺乏与其他研究的比较。此外,一些方法也缺乏适当的统计框架支持。未来的研究需要更加重视实证验证和可复制性,以确保AutoML方法的有效性和可靠性。

这些挑战和问题为AutoML领域的未来发展提出了一些重要的方向和目标。未来的研究需要关注如何解决这些挑战,以实现更全面、有效和可靠的AutoML方法。

  1. 结论

  • AutoML仍然是一个新兴的领域,面临着许多有前途的挑战,尤其是在神经架构搜索方面的显著发展趋势。

  • 提出了一个AutoML分类法,将有助于未来研究的分类,并为对AutoML感兴趣的研究人员和从业者提供参考。

这些总结突出了AutoML领域的主要发现和趋势,为该领域的研究和实践提供了有价值的见解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/209590.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

张弛声音变现课,如何为偶像剧配音?

在为偶像剧进行配音工作时,配音员应当捕捉剧中角色的年轻活力、浪漫的爱情故事以及轻快的生活节奏。偶像剧主要讲述的是青春的爱恋、友谊和梦想追求,因此配音需要传递出剧中的真诚和活泼。为偶像剧配音可以考虑以下几点建议: 鲜明活泼的声音 …

Python中列表和字符串常用的数据去重方法你还记得几个?

Python中列表和字符串常用的数据去重方法你还记得几个? 1 关于数据去重2 字符串去重2.1 for方法2.2 while方法2.3 列表方法2.4 直接删除法2.5 fromkeys方法 3 列表去重3.1 for方法3.2 set方法13.3 set方法23.4 count方法3.5 转字典法 4 完整代码 1 关于数据去重 关…

Linux之进程替换

创建子进程的目的 创建子进程的第一个目的是让子进程执行父进程对应的磁盘代码中的一部分, 第二个目的是让子进程想办法加载磁盘上指定的程序,让子进程执行新的代码和程序 一是让子进程执行父进程代码的一部分, 比如&#xff1a; 1 #include<stdio.h> 2 #include<…

笔记本只使用Linux是什么体验?

笔记本只使用Linux是什么体验&#xff1f; 之后安了Windows双系统之后也不怎么想再进Windows了。 开发环境就不用说了&#xff0c;Linux下配各种开发环境都方便的多&#xff0c;当然你要用 vs 那还是乖乖回 Windows 吧。 最近很多小伙伴找我&#xff0c;说想要一些Linux的资…

德迅云安全-德迅卫士:保障您的主机安全

主机安全是指保证主机在数据存储和处理的保密性、完整性、可用性&#xff0c;包括硬件、固件、系统软件的自身安全&#xff0c;以及一系列附加的安全技术和安全管理措施。 为什么要主机安全&#xff1f; 服务器一旦被黑客入侵&#xff0c;个人和企业面临以下安全风险&#xff…

shell 脚本 批量 修改 文件名

shell 脚本 批量 修改 文件名 原始文件 你可以使用以下的shell脚本来批量修改文件名&#xff1a; #!/bin/bashinput_dir$1if [ -z "$input_dir" ]; thenecho "Usage: ./rename.sh input_directory"exit 1 ficd "$input_dir" || exitfor file in…

python命令行 引导用户填写ssh登录信息

字多不看&#xff0c;直接体验&#xff1a; 待补充 演示代码 # -*- coding:UTF-8 -*- """ author: dyy contact: douyaoyuan126.com time: 2023/11/23 9:20 file: 引导用户填写ssh接口信息.py desc: xxxxxx """# region 引入必要的依赖 impor…

《YOLOv8创新改进》专栏指导书册 手把手创新教程

&#x1f680;&#x1f680;&#x1f680;YOLOv8改进专栏&#xff1a;http://t.csdnimg.cn/hGhVK 学姐带你学习YOLOv8&#xff0c;从入门到创新&#xff0c;轻轻松松搞定科研&#xff1b; 本专栏为订阅者提供答疑服务&#xff0c;每一篇提供源代码和详细的每一个步骤改进地方。…

TikTok青年领袖:短视频如何塑造新一代

在数字时代的潮流中&#xff0c;短视频平台TikTok崭露头角&#xff0c;成为年轻一代最喜爱的社交媒体之一。这个平台不仅改变了用户的娱乐方式&#xff0c;更在其中催生了一批富有创造力和影响力的青年领袖。 本文将深入探讨TikTok如何通过短视频内容塑造新一代的青年领袖&…

可编程交流回馈式负载箱在电源设备中的应用

可编程交流回馈式负载箱可以用于测试电源设备的输出能力&#xff0c;通过在负载箱中设置不同的负载条件&#xff0c;可以模拟不同的工作负载情况&#xff0c;从而测试电源设备在不同负载下的输出能力和稳定性。这对于电源设备的设计和生产非常重要&#xff0c;可以帮助制造商评…

购买Zoho CRM系统要花多少钱?

相信对CRM系统有过了解的人都知道&#xff0c;CRM系统的价格取决于功能需求&#xff0c;用户数量&#xff0c;部署方式&#xff0c;定制开发等因素。Zoho CRM是全球领先的云CRM系统&#xff0c;自2005年推出以来&#xff0c;累计服务25万企业&#xff0c;那么Zoho CRM系统的价格…

【Java工具篇】Java反编译工具Bytecode Viewer

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…