人工智能(1):机器学习工作流程

1 什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

2 机器学习工作流程

机器学习工作流程总结

1 获取数据

2 数据基本处理

3 特征工程

4 机器学习(模型训练)

5 模型评估

  • 结果达到要求,上线服务
  • 没有达到要求,重新上面步骤

2.1 获取到的数据集介绍

  • 数据简介

在数据集中一般:

        一行数据我们称为一个样本

        一列数据我们成为一个特征

        有些数据有目标值(标签值),有些数据没有目标值(如上表中,电影类型就是这个数据集的目标值)

 

  • 数据类型构成:

        数据类型一:特征值+目标值(目标值是连续的和离散的)如上图

        数据类型二:只有特征值,没有目标值,如下图

 

  • 数据分割:

        机器学习一般的数据集会划分为两个部分:

                训练数据:用于训练,构建模型

                测试数据:在模型检验时使用,用于评估模型是否有效

        划分比例:

                训练集:70% 80% 75%

                测试集:30% 20% 25%

2.2 数据基本处理

即对数据进行缺失值、去除异常值等处理

2.3 特征工程

2.3.1什么是特征工程

特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。

意义:会直接影响机器学习的效果

2.3.2 为什么需要特征工程(Feature Engineering)

机器学习领域的大神Andrew Ng(吴恩达)老师说“Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering. ”

注:业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

2.3.3 特征工程包含内容

  • 特征提取
  • 特征预处理
  • 特征降维

2.3.4 各概念具体解释

  • 特征提取

将任意数据(如文本或图像)转换为可用于机器学习的数字特征

  • 特征预处理

通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程

 

  • 特征降维

指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程

2.4 机器学习

选择合适的算法对模型进行训练(后续详细讲解)

2.5 模型评估

对训练好的模型进行评估(后续详细讲解)

3 小结

机器学习定义【掌握】

  • 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

机器学习工作流程总结【掌握】

1 获取数据

2 数据基本处理

3 特征工程

4 机器学习(模型训练)

5 模型评估

  • 结果达到要求,上线服务
  • 没有达到要求,重新上面步骤

获取到的数据集介绍【掌握】

  • 数据集中一行数据一般称为一个样本,一列数据一般称为一个特征。
  • 数据集的构成:

        由特征值+目标值(部分数据集没有)构成

  • 为了模型的训练和测试,把数据集分为:

        训练数据(70%-80%)和测试数据(20%-30%)

特征工程包含内容【了解】

  • 特征提取
  • 特征预处理
  • 特征降维

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/1571.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

1.2g可视化大屏项目分享【包含数字孪生、视频监控、智慧城市、智慧交通等】

1.2g可视化大屏项目分享【包含数字孪生、视频监控、智慧城市、智慧交通等】 链接:https://pan.baidu.com/s/1KSNll7b6bVoVPPqcQmNKeQ 提取码:w13x

计算机组成原理(期末或考研备考)-计算机系统概述重点

1.1计算机发展历程 讲解视频: https://www.bilibili.com/video/BV15s4y1F7eC/?spm_id_from333.999.0.0 1946第一台电子数字计算机(ENIAC)第一代计算机(1946-1957)-- 电子管;体积大,容量小,成本高&#x…

Tomcat的部署和优化

目录 一、Tomcat简介 二、Tomcat 的构成 三、Tomcat 功能组件结构 四、Tomcat 请求过程 五、Tomcat 服务部署 六、Tomcat 虚拟主机配置 七、Tomcat优化 1.Tomcat 配置文件参数优化 2.JVM优化 一、Tomcat简介 Tomcat 是 Java 语言开发的,Tomcat 服务器是一个…

03 Web全栈 浏览器内置对象/事件/ajax

浏览器是一个JS的运行时环境,它基于JS解析器的同时,增加了许多环境相关的内容,用一张图表示各个运行环境和JS解析器的关系如下: 我们把常见的,能够用JS这门语言控制的内容称为一个JS的运行环境,常见的运行环…

three.js通过CubeTexture加载环境贴图,和RGBELoader加载器加载hdr环境贴图

一、使用CubeTexture进行环境贴图 1.CubeTexture使用介绍 Three.js中可以通过使用CubeTexture进行环境贴图,CubeTexture需要将6张图片(正面、反面、上下左右)包装成一个立方体纹理。下面是一个简单的例子: 首先需要加载六张贴图…

前端JavaScript入门-day03

(创作不易,感谢有你,你的支持,就是我前行的最大动力,如果看完对你有帮助,请留下您的足迹) 目录 1、循环-for 1. for 循环-基本使用 1. for循环语法 2. 退出循环 2. for 循环嵌套 2、数组 1 数组是…

18.RocketMQ中消息重复的场景和幂等处理

highlight: arduino-light 消息重复的场景 发送消息异常,重试发送导致消息重复★ 当一条消息已被成功发送到服务端并完成持久化。此时出现网络闪断或者客户端宕机,导致服务端对生产者的确认应答失败。生产者发送消息到mq时发送成功未获取到响应,然后生产者进行消息发…

java.util.concurrent.Executionexception 异常

报错截图: 今天运行时发生了如下报错。自己捣鼓半天也没发现问题出在哪儿,感谢大佬的帮助,记录下来防止再犯。。 caused by org.apache.flink.client.program.programInvocationException: Job failed。程序调用异常。网上找了很多解决方法…

数字图像处理-图像复原与重建

文章目录 一、图像退化/复原过程的模型二、噪声模型2.1噪声的空间和频率特性2.2一些重要的噪声概率密度函数2.2.1高斯噪声2.2.2瑞利噪声2.2.3爱尔兰(伽马)噪声2.2.4指数噪声2.2.5均匀噪声2.2.6脉冲(椒盐)噪声 2.3周期噪声 三、只存…

移动WEB开发之rem适配布局

css基础(一)css基础(一)_上半场结束,中场已休息,下半场ing的博客-CSDN博客Emmet语法Emmet语法_上半场结束,中场已休息,下半场ing的博客-CSDN博客css基础(二)c…

什么是AOP?

目录 一、AOP简介 1、AOP简介和作用 2、AOP的概念 二、AOP的基本实现 三、AOP工作流程 1 、AOP工作流程 2、AOP核心概念 四、AOP切入点表达式 1、语法格式 2、通配符 五、AOP通知类型 1、AOP通知分类 2、AOP通知详解 (1)前置通知 &#xf…

springcloud中间件:sentinel的简单使用

一、简介 Sentinel 是面向分布式服务架构的高可用流量防护组件,主要以流量为切入点,从限流、流量整形、熔断降级、系统负载保护、热点防护等多个维度来帮助开发者保障微服务的稳定性。 避免大批量的瞬时请求都打到服务上,将服务压垮。 Sen…