目录
前言
一、理解机器学习
1.1 机器学习的目的
1.2 机器学习的模型
1.3 机器学习的数据
二、学习机器学习要学什么
2.1 学习机器学习的核心内容
2.2 怎么选择模型
2.3 怎么获取训练数据
2.4 怎么训练模型
三、机器学习的门槛
3.1 机器学习的第一道门槛
3.2 机器学习的第二道门槛
3.3 机器学习的第三道门槛
前言
对于新人来说,开始学习机器学习可能会感到有些困难。例如一般会给出海一样阔的学习清单,然后还需要掌握基础数学知识、学习Python编程语言、学习机器学习基础理论、实践项目、参与社区和持续学习等方面的努力等等等等等等等等等等等一大堆的“刚性要求”及“说与不说都一样的建议”。
与其说这些是学习建议或者学习指引,还不如说是“机器学习劝退书”。如果不抓住主干,而是繁枝杂叶,那么养猪都要买上十本书,看完隔壁家猪都下崽了。
下面结合实际的经验,和一些真正上手人的经历,今天我来分享一下机器学习上手要怎么搞。
一、理解机器学习
1.1 机器学习的目的
机器学习的目的就是通过X来预测Y,
1.2 机器学习的模型
但X与Y的关系往往不知,所以需要假设X与Y符合某个模型。而模型并非完全是死的,它预留了一些参数,例如线性模型y = wx,就预留了w作为参数,模型是固定的(它必然是线性的),但模型不是死的,可以通过参数w来调整线性关系的斜率。
1.3 机器学习的数据
模型中预留的参数如何确定?这时候就依靠历史数据了,求解一个参数,使得模型在历史数据中预测最准确,以此来确定模型的参数。
二、学习机器学习要学什么
2.1 学习机器学习的核心内容
由上而知,机器学习就是选择一个模型,然后再用数据训练模型,以达到我们的目的---用X预测Y。因此,重心就只有两个:
(1)怎么选择模型
(2)怎么获取训练数据
(3)怎么训练
2.2 怎么选择模型
要知道怎么选择模型,就必须了解模型,了解更多的模型。只有桔子梨子桃子李子都吃过了,才能知道现在想吃什么。所以这是一个很简单的问题, 多学几个模型,玩几个模型,多玩玩,就知道了。但是不是所有模型都要知道呢?当然不是,也是不可能的!就像梨子桃子桔子李子柚子柿子椰子梨子橙子车厘子都未必样样吃齐,一般先学着五六个常用模型,就算入门了。
机器学习基本的模型,包括线性回归、逻辑回归、支持向量机(SVM)、决策树、随机森林、聚类分析、降维等。这些模型可用于分类和回归问题,如房价预测、股票走势或测试成绩等连续变化的案例。其中,线性回归和逻辑回归是处理回归任务最常用的算法之一,而SVM、决策树和随机森林则是处理分类任务常用的算法。
在机器学习入门阶段,建议先学习一些基础模型,如线性回归和逻辑回归,以及一些基本的聚类方法和降维方法。然后,可以根据实际问题和数据集的特点,选择适合的模型进行学习和应用。同时,还需要了解各种模型的应用场景、优缺点、参数设置等,以便更好地应用它们解决实际问题。
2.3 怎么获取训练数据
这里的获取训练数据,并非指获取最原始的数据,而是指怎么获取喂给模型的数据。这就涉及到数据清洗了,这里不铺开讲述,只要学习了模型,再看一两个案例,就自然知道要把数据处理成什么样来喂给模型了。因为不同的模型,所要求的数据也有个别的出入,实践一两下就自然知道要求了。实践出真知!
知道模型要求什么数据,接下来就是数据的处理了,这就是实打实打编程苦力工,对于有编程基础的同学来说,完全是肝的问题,而不是懂不懂的问题,不学自通。而对于没有编程基础的,也可以根据这些数据处理要求,作为编程的练习题,既可以学习数据清洗,又可以学习编程,一举两得,何乐而不为!
2.4 怎么训练模型
训练模型是最简单不过的事情,根据机器学习包(例如python中的sklearn)的API说明,依样画葫芦就行,根本不需要学习。属于动手试试就知的那种,完全不会成为门槛。
API说明在哪里找?官网、百度、CSDN、知乎,满大街都是,随便搜一下拿来就用。
三、机器学习的门槛
3.1 机器学习的第一道门槛
机器学习的第一道门槛,在模型(算法)的学习上,但基本学过就行。这就是个吃梨子桃子桔子李子柚子柿子椰子梨子橙子车厘子的过程,吃过就知道味道了。
这个中可能会涉及到一些数学知识,其实不必介怀,一知半解也是没关系的,不是人人都是美食家,也不是人人都是水果专家,一吃就知道这桃子是哪个品种,有没有施药,雨水有没有充足,吃过就行了,大概知道个味道,也不影响我下次去买水果时选择哪个水果。
3.2 机器学习的第二道门槛
机器学习的第二道门槛在于实践,做一个模型,肯定是希望有效果的,如果总是训练效果不好,这不免会打击信心,这时候就需要耐心与信心加持了。相信数据,相信会有效果,耐心去分析问题,这里必须说明,很多时候都是出现在数据问题上,所以需要很仔细的去了解数据,分析数据,清洗数据。
3.3 机器学习的第三道门槛
相信有许多迈过了第一道,第二道,已经入门的同学,却没有继续在机器学习上走下去。为什么?因为没有实践的机会!对!第三道门槛就是实践的机会! 一份工作也好,一份自己的项目也好,“被需要”是很重要的! 在获得实践机会后,将机器学习融入生活,才算真正开启了机器学习之路!
其实也没写几个字,却敲到手累了,有机会再细说。
最后,列出一些可以参考与学习的网站:
《1》人工智能学习路线图2023版-黑马程序员人工智能技术路线
《2》老饼|机器学习
《3》机器学习相关电子书_天赋好书(cnToFu.com)
《4》1. 监督学习 - sklearn中文教程 | 编程字典
如果觉得本文有帮助,点个赞吧!