人工智能的发展史上,有哪些里程碑式的论文?

文章立意方向

在开始这篇文章之前,首先介绍下笔者的站位和看问题的角度:笔者是一个有过大厂从业经历的一线人工智能算法工程师,从2011年至今,亲身参与、亲眼看到人工智能的蓬勃发展的历程。手中的工具从基于概率论、导数的机器学习再到今天的带有深度记忆、推理能力的大模型。

所以,基于笔者的从业经历(2011年~至今),那些史前的、创世性的论文(如辛顿-Hiton教授苦苦求索的CNN卷积神经网络),并不在笔者的介绍范围内。

本文笔者仅介绍那些 【应用度高】、【引用量高】、【被互联网大厂直接上线使用】的 极具现实意义和落地价值的paper。主要涵盖的领域是视觉算法(CV)和自然语言处理(NLP)。

牛X论文一览

1、《A Convolutional Neural Network for Modelling Sentences》 (2014)

官方描述:这篇论文提出了一个用于句子建模的卷积神经网络(CNN)架构,该模型使用一维卷积来学习句子嵌入的层次特征

老杨描述:为文本分类开启了新篇章(之前我们都是用RNN循环神经网络来做文本分类),这篇文章的出现,让本应该做图片分析的CNN,干起了NLP的活,不仅准确率略有提升,关键的问题是-->CNN做文本分类可以在CPU机器上来训练(当然RNN也可以跑在CPU机器上,只不过完成一轮模型训练,非常耗时!),对于当时部门极度缺少GPU的我们来讲,是一个福音-->既能完成业绩,而且干活效率高(不用深夜定闹钟来看训练进度了)。

直到目前为止,据老杨所知,百度搜索体系、信息流体系,仍然采用这篇论文的技术来快速筛选涉黄/暴/恐/恶心/政治等相关的文章、语句、评论等。

论文意义:传统的认知是,CNN就是做图片分析的,现在可以跨界做NLP的活,为以后新的特征提取器transformer(本来这个特征提取器的定位和RNN一样,是为了做NLP)在Sora上的应用开辟了新篇章!

2、《Attention is All You Need》 (2017) ---谷歌公司

官方描述:这篇论文提出了Transformer模型,它在处理序列数据时不依赖于循环网络结构,而是使用注意力机制,对NLP领域产生了革命性影响。

老杨描述:没错,这就是transformer,是谷歌公司2017年提出的,本意是替代RNN这个特征提取器,当然也确实在NLP任务上表现出来了一定的成绩。当时没有人认为这篇文章能够怎么样,也就慢慢的尘封了---->直到OpenAI的ChatGPT的出现(据说谷歌高层,为此事耿耿于怀)

论文意义:里程碑式的论文,一种全新的特征提取器,一开始只是取代了两架马车中的RNN,但是现在正在慢慢的也要取代CNN。不仅在ChatGPT上应用,而且在Sora上应用。包括国内目前所有的主流语言大模型---文心一言、清华智谱。不过清华智谱死不承认自己是用的transformer,非得叫自己glm,其实就是换汤不换药。

该文章,已经一统NLP领域的江山,马上也要一统CV了。

3、《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》 (2018)---谷歌公司

图片加载中

官方描述:BERT模型通过双向Transformer预训练,显著提高了多种语言理解任务的性能。

老杨描述:在2018年,该论文已经发布,在NLP业界(各大互联网公司),引起了很大的震动,因为用过transformer特征提取器 + bert的神经网络结构,联合训练出来的语言模型。在全部,注意是全部NLP任务上,全部遥-遥-领-先!刷爆了之前所有NLP技术的最好效果--->准确率/召回率

具体任务包含:

  1. 文本分类(小黄文分类、财经体育娱乐等文章分类,都用)
  2. 机器翻译
  3. 序列标注、命名实体、分词等
  4. 情感分析(恶意、辱骂、开心、沮丧等)
  5. 意图识别(搜索引擎的核心技术,当你输入搜索内容,第一步要做的就是识别用户的意图)
  6. 文本摘要(司法、医院经常用到,比如判决书摘要、病例摘要等)
  7. 。。。。

论文意义:当所有的算法工程师都对中文NLP感到绝望的时候,这篇论文给全国的顶级NLP工程师带来了希望,并且一步步的工程化应用,至今都在百度、腾讯、美团、字节跳动公司的平台发光发热。

4、《Deep Residual Learning for Image Recognition》2015---华人之光(也可称为广州之光)何恺明,该论文获得顶会CVPR Best

图片加载中

官方描述:何恺明的残差网络(ResNet)是人工智能视觉算法领域的一个重大突破。ResNet通过引入残差学习框架来解决深度神经网络训练中的退化问题,使得训练深层网络成为可能。ResNet的影响力非常广泛,它不仅在图像分类任务中取得了显著的性能提升,也推动了其他计算机视觉任务的发展,如目标检测和人脸识别等。

老杨描述:如果说辛顿(Hiton)教授定义了神经网络,那么何恺明就定义了深度学习。在没有何恺明的Resnet之前,如何让神经网络层数变得更多、更深,是解决不了的问题。而浅层神经网络在记忆能力、推理能力的表现实在太差。强行提升网络层数,一直因为梯度消失、梯度爆炸的技术难题,无法变成现实。Resnet的出现,一举改变了现状。

**论文Title**:人类文明以来,人工智能方向被引用次数最多的文章,没有之一!

论文意义:有了Resnet,才有了深度学习。没有Resnet,就什么都没有。没有人脸识别、没有目标检测、没有ChatGPT、没有Sora。

5、《Generative Pre-trained Transformer 3 (GPT-3)》2020---OpenAI

官方描述:这是一个强大的语言生成模型,能够执行各种语言任务。

老杨描述:这就是ChatGPT(gpt3.5)的前身,这个是3.0

老杨恶意的揣测(有内行人交流),讯飞星火、360大模型、紫东太初、出门问问,都是基于这个基础模型来做的自己的大模型(或者是Facebook开源Llama开源大模型)。为啥呢?因为3.0是代码、模型全开源的。因为这些提到的公司,公布成本损耗,电费没有明显增长啊!

论文意义:让所有的行业内的技术从业人员,开始将目光投向生成式人工智能技术。但是大部分都是静静的看着,没有动作,普遍心态是--->你这个gpt3,也就是比bert强一丢丢,先看着再说。没想到,3.5的问世,翻天覆地。

6、《You Only Look Once: Unified, Real-Time Object Detection (YOLO)》2015

图片加载中

官方描述:它能够实时进行目标检测,对实时应用产生了重要影响

老杨描述:目标检测的最终胜利者,从2015年问世,直至今天,都是目标检测领域99%的工程师首选。这个技术有啥优点呢?--->识别的不仅精准,而且耗时更短。题外话:该文章的作者,由于不接受该技术被美国军方用于导弹精确视觉制导,黯然消失在大众视野。

论文意义:没有该技术,也就没有所谓的人体检测、人脸检测、旗帜检测等所有目标识别类的国内蓬勃应用。也就不会有所谓的商汤、旷视、依图等公司,海康威视要砍掉一半市值。

笔者的总结

有些论文已经完成了它的历史使命,有些论文仍在发光发热,有些论文将在未来的某天,决定着真正的类人智能体。

笔者以上列举的文章,不是权威的业界排名,只是一个从业10余年的资深用户的深刻体验。有的是极具落地价值的,比如1、3、5、6. 有的是人工智能领域里程碑意义的(堪比人类登月),比如2、4.

下一篇文章预告

《RNN/CNN/Transformer三个特征提取器的爱恨情仇》

声明:本文所有配图,均来自于GPT4作图。

Edit by Biuke Yang

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/588786.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面对汽车充电桩隐私泄露威胁,应该怎么做?

想必各位车主在第一次扫码或刷卡使用汽车充电桩时,都会出现类似于上图的请求,除了上述的定位权限外,运营商还会索要你的网络权限、相机权限、通知权限、设备信息权限、存储权限、电话权限等。 那么你知道这些权限充电桩获取后到底用于什么吗&…

知识融合:知识图谱构建的关键技术

目录 一、引言二、知识图谱基础2.1 知识表示三元组属性图 2.2 知识抽取实体抽取关系抽取属性抽取 三、知识融合的核心问题3.1 实体识别与链接实体识别实体链接 3.2 重复实体合并方法示例 3.3 关系融合挑战方法示例 四、知识融合技术深度解析4.1 基于规则的方法规则设计原则规则…

LeetCode-894. 所有可能的真二叉树【树 递归 记忆化搜索 动态规划 二叉树】

LeetCode-894. 所有可能的真二叉树【树 递归 记忆化搜索 动态规划 二叉树】 题目描述:解题思路一:分治,递归解题思路二:动态规划。关键思路是如果构造节点数目为 n 的真二叉树,此时可以从节点数目序列为 [(1,n−2),(3,…

来成都的国际数字影像产业园,开启文创产业园之旅

走进位于成都金牛区福堤路的国际数字影像产业园,仿佛置身于一个充满创意与活力的场域。这里是成都数字产业的聚集地,汇聚了上百家数字媒体相关企业,为成都文创产业注入了新的活力。在这里,你可以感受到浓厚的创新氛围,…

香港科技大学广州|智能制造学域博士招生宣讲会—东北大学专场

时间:2024年4月11日(星期四)14:00 地点:东北大学南湖校区逸夫楼101室 报名链接:https://www.wjx.top/vm/mmukLPC.aspx# 宣讲嘉宾:汤凯 教授/学域主任 跨学科重点研究领域 •工业4.0 •智能传感器、自动光…

数据安全之认识数据库防火墙

文章目录 一、什么是数据库防火墙二、数据库防火墙的主要功能三、数据库防火墙的工作原理四、数据库防火墙如何防护数据库免受SQL注入攻击五、数据库防火墙的部署方式六、数据库防火墙与网络防火墙的关系与区别七、数据库防火墙的应用场景 随着信息技术的快速发展,数…

蓝色wordpress外贸建站模板

蓝色wordpress外贸建站模板 https://www.mymoban.com/wordpress/7.html

如何利用Flutter将应用成功上架至iOS平台:详细指南

引言 🚀 Flutter作为一种跨平台的移动应用程序开发框架,为开发者提供了便利,使他们能够通过单一的代码库构建出高性能、高保真度的应用程序,同时支持Android和iOS两个平台。然而,完成Flutter应用程序的开发只是第一步…

深度解析C语言——预处理详解

对C语言有一定了解的同学&#xff0c;相信对预处理一定不会陌生。今天我们就来聊一聊一些预处理的相关知识。预处理是在编译之前对源文件进行简单加工的过程&#xff0c;主要是处理以#开头的命令&#xff0c;例如#include <stdio.h>、#define等。预处理是C语言的一个重要…

桥式起重机防摇输入整形

资料&#xff1a; 桥式起重机防摇定位控制系统开发&#xff0c;毕江涛 基于输入整形的桥式起重机货物摆动控制策略研究&#xff0c;王冰清 基于输入整形技术的门座起重机吊重摆动控制研究&#xff0c;王云飞 基于变增益 PID 控制的起重机防摇摆设计与仿真&#xff0c;郭瀛舟 ht…

使用Bitmaps位图实现Redis签到

系列文章目录 文章目录 系列文章目录前言前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 Redis提供了Bitmaps这个“数据类型”可以实现对位的操作: (1) Bitmaps…

基于单片机的汽车尾灯控制系统设计

**单片机设计介绍&#xff0c;基于单片机的汽车尾灯控制系统设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机的汽车尾灯控制系统设计概要主要涵盖利用单片机技术实现对汽车尾灯的智能控制。下面将从系统构成、工作…