前言
最近我计划学习一下机器学习的相关技术,之前体验华为云CodeArts Snap的时候,重拾了一下Python。
然后就信心满满的打开了Python机器学习的教程,发现比想象中的难。
总觉得欠缺了些什么支撑自己的学习兴趣,正好最近在体验ModelArts,恍然大悟,缺少了些实践的乐趣。
没有延迟的满足感,学习动力不足,得想办法充充电。
之前一直做图片的训练和预测,这次得做点不一样的。
突然想到了之前论坛看到的帖子,关于是否愿意存款的问题。
换个思路,其实影响存款意愿的因素还是挺多的。别管想不想,客观条件一罗列,其实就能知晓TA的存款意愿。
不过客观条件有些多,手工计算的话,烧脑不说,还容易出错,得找个得力“助手”才行。
自动学习实现预测分析
还是得借力华为云ModelArts,因为ModelArts正好有个实验是:银行存款预测(使用新版自动学习实现预测分析)。
在这个实验中,主要是通过ModelArts平台上的自动学习功能,根据客户特征(年龄、工作类型、婚姻状况、文化程度、是否有房贷和是否有个人贷款),预测某个客户是否会办理存款业务。
真是,踏破铁鞋无觅处,全靠华为云的帮助。
接下来,让我们一起来一场ModelArts的实验之旅。
银行存款预测实验
前置工作
首先确保已经完成了华为云账号的开通与认证。
进入实验
步骤1:准备数据
下载数据文件
从gitee下载ModelArts-Lab工程中的训练数据文件“train.csv”。
创建OBS桶
OBS是ModelArts提供的使用对象存储服务,目的是为了进行数据存储以及模型的备份和快照。
本次实验在创建训练数据集之前,需要创建一个OBS桶,然后在OBS桶中创建文件夹用于存放训练文件,具体路径为“test-modelarts-yyy/bank-marketing/train.csv”。
1、登录OBS管理控制台,在桶列表页面右上角单击“创建桶”,创建OBS桶。
填写参数:
- "区域":华北-北京四,后续区域需要选择和OBS桶一致。
- "桶名称":创建桶名称“test-modelart-yyy”,注意重名时可以添加后缀。
其他使用默认值即可,确认无误后单击右下角“立即创建”。
2、在桶列表页面,单击桶名称,进入该桶的概览页面。
3、单击概览页面的左侧导航的“对象”,在“对象”页面单击新建文件夹,创建OBS文件夹。
图2-3:新建文件夹
新建一个名为“bank-marketing”的文件夹,新增成功之后单击“上传对象”按钮。
上传训练文件“train.csv”。
新建一个名为“bank-output”的文件夹,存放数据集输出数据。
步骤2:创建数据集
1、进入ModelArts管理控制台,在左侧导航栏选择“数据管理>数据集”,进入数据集管理页面。
2、单击“创建数据集”,进入创建数据集详情页面,配置信息。
- “名称”:本实验名称为“dataset-bank”。
- “描述”:银行存款预测。
- “数据类型”:选择“表格”。
- “数据源”:选择OBS,文件路径选择训练文件所在的位置。
- “数据集输出位置”:选择OBS中的位置。
其他选择默认值即可,确认无误后单击右下角“提交”。
等待数据集的创建。
步骤3:创建预测分析项目
1、进入ModelArts管理控制台,在左侧导航栏选择“自动学习”。
2、在“自动学习”页面,单击“预测分析”中的“创建项目”。
3、进行参数配置
- “名称”:“ExeML_bank”。
- “数据集”:选择“dataset-bank”。
- “标签列”:选择“class”。
- “输出路径”:选择“test-modelart-yyy/bank-output/”。
- “训练规格”:选择“[限时免费]GPU: 1*NVIDIA-V100(32GB) | CPU: 8 核 64GB”。
其他选择默认值即可,确认无误后单击右下角“创建项目”。
预测分析项目创建成功后页面自动跳转到“自动学习工作流”。
步骤4:运行工作流
1、项目创建成功之后,工作流会自动运行,等待“服务部署”前的全部节点变为绿色的“运行成功”。
2、节点到达“服务部署”,状态会变为“等待输入”,需要填写输入参数:
- “计算节点规格”:选择“[限时免费]CPU: 1 核 4GB”。
- “是否自动停止”:打开自动停止开关,设置停止时间为“1小时后”。
其他选择默认值即可,确认无误后单击右下角“继续运行”。
单击确认弹窗中的“确定”,等待一段时间之后,工作流便可运行完成。
步骤5:预测分析
1、点击控制台左侧“部署上线>在线服务”,进入“在线服务”列表页。单击服务列表上的“预测”,进入“服务详情”页。
2、在“服务详情”页,单击选择“预测”页签。
3、输入预测数据,单击左下角的“预测”,在右边的“返回结果”区域查看预测结果。
步骤6:清除相应资源
实验完成之后,清除相应的资源,避免产生额外的费用。
1、删除运行服务
在“在线服务”页,单击当前正在运行的服务的右侧的“删除”按钮,即可删除运行该服务,计费终止。
2、清除OBS中的数据。
将OBS中的桶和桶下的文件都删除。
体验及建议
首先来说体验感受,ModelArts的预测速度还是很快的,工作流的过程也很快,没有等太长时间。
发现了一些需要调整的地方:
1、文档配置内容和截图待更新。
实际操作中有一个配置项叫做“标签列”,文档中是没有的。
总结
完成银行存款预测(使用新版自动学习实现预测分析)的实验之后,对华为云ModelArts提供的自动学习功能有了更深一些的了解。
华为云ModelArts提供的自动学习功能,即便是零AI基础的开发者按照实验步骤,便可以轻松完成AI模型的训练和部署。
除了图片分类、物体检测,还包括对结构化数据做出分类或数值预测功能。
接下来,我计划系统的学习一下自动学习的功能,再配合华为云ModelArts提供的模型训练功能,实现更多的业务功能。
未来,也期待与华为云ModelArts一起实现更多的可能。
作者:非职业「传道授业解惑」的开发者叶一一
简介:「趣学前端」、「CSS畅想」系列作者,华夏美食、国漫、古风重度爱好者,刑侦、无限流小说初级玩家。
如果看完文章有所收获,欢迎点赞👍 | 收藏⭐️ | 留言📝。