深度学习的模型有几类,能干嘛用?

1、基础模型

(1)卷积神经网络

**卷积:**卷积的本质是通过矩阵运算9的方式将输入数据进行空间上的滤波,有效地提取数据中的局
部特征,从而实现特征数据更高程度的抽象表示。
在这里插入图片描述
**池化:**可以理解成“压缩”,用来降低卷积层Q输出的特征维度,减少网络参数和计算量。

在这里插入图片描述
CNN通过多个卷积层和池化层Q对输入图像进行多次特征提取和降采样,最终得到全局特征表示,再通过全连接层Q进行分类。
优点:
参数数量小,训练时间短。
缺点:
不适用于序列数据Q,无法处理时序信息。
CNN的实际应用(更适合图像任务):
图像分类、图像检索、目标检测、人脸识别、文本分类、语音识别

(2)循环神经网络 RNN

在这里插入图片描述
RNN是将CNN进行了改造,简单来说就是把上一次的输出混合下一次的输入再做一次计算,每次计算都对上一次的计算结果有一定的依赖。
优点:
解决了输入数据是连续的序列问题(例如“我喜欢人工智能”每个字之间有时序关系,也有逻辑关
系)。
缺点:
梯度消失Q或梯度爆炸、训川练速度较慢,计算量较大、复杂序列数据支持得不够好
RNN的实际应用(更适合NLPQ任务):
机器翻译、语音识别、图片描述、时间序列分析等任务。

(3)长短期记忆网络 LSTM(long short-term memory)(基于RNN的扩展)

在这里插入图片描述
LSTM是RNN的一种变体,通过“门”结构引入“选择性遗忘Q“机制,解决RNN的这一弊端。
优点:
解决了传统RNN中存在的梯度消失和梯度爆炸问题,从而更好地处理长序列数据。
缺点
因为LSTM是RNN的一种变体,因此缺点方面,仍然是RNN的那些缺点。
LSTM的实际应用(更适合NLP任务):
文本情感分析、语音识别、机器翻译、序列预测、图像分析、语音生成、时间序列分析。

2、高级模型和技术

(1)生成对抗网络 GAN(Generative Adversarial Networks)

在这里插入图片描述
优点:
生成能力强、不需要显式监督
缺点:
训练过程复杂、数据要求高
GAN的实际应用:
图像生成、图像修复“、风格迁移、去掉图像遮挡、年龄转移、语音合成“等。

(2)Transformer:

2017年,Google发表论文《Attention is all you need)》Q,成为Transformer开山之作。通过引入自注意力机制、多头自注意力机制°、前馈神经网络和位置编码等技术,Transformer实现了高效的并行计算和强大的表示能力。

在这里插入图片描述
自此,Transformer架构一路开挂,形成了一个枝繁叶茂的大家族,在文本分类、命名实体识别Q、
情感分析、问答系统、机器翻译、语音识别、图像分类Q等领域都取得了显著的成果。

3、大型预训练语言模型(Large Language Model)(通常基于Transformer架构)

近年来,BERT、GPT4、LLaMa等一大批优秀大模型纷纷亮相,开启了大模型新时代的新篇章。
前不久,谷歌多模态大模型RGemini Ultra也重磅发布,如今大模型不能说是热点,而要说是沸点
了。
在这里插入图片描述
对于技术人员来说,无论是从原理还是从使用上,大模型都注定成为“兵家必争之地”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/615533.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图片合成二维码怎么实现?图片二维码的生成技巧

图片合成二维码如何制作呢?现在很多的二维码都会提供图片预览的功能,我们可以用手机扫描二维码来查看图片的信息,比如很多的产品信息、旅游攻略、产品海报等等类型经常会制作这种类型的二维码。 其实图片制作二维码的方法很简单,…

MySQL:MySQL的查询(上)

文章目录 MySQL的增加单行数据插入多行数据插入插入否则更新替换 MySQL的查询select列where语句 本篇开始总结的是MySQL当中的基本查询语句 对于数据库的查询,无非大致就是增删查改,因此对于这些内容进行一一解释: MySQL的增加 单行数据插…

【Qt 学习笔记】Qt控件概述

博客主页:Duck Bro 博客主页系列专栏:Qt 专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ Qt控件概述 文章编号:Qt 学习笔记 / 14 文章目录 Qt控件概…

如何申请阿里云服务器学生优惠,入口在这呢!

阿里云学生服务器免费申请,之前是云翼计划学生服务器9元/月,现在是高校计划,学生服务器可以免费申请,先完成学生认证即可免费领取一台云服务器ECS,配置为2核2G、1M带宽、40G系统盘,在云服务器ECS实例过期之…

【软考】哈希表

目录 一、概念1.1 定义 二、哈希函数的构造方法2.1 说明2.2 特性 三、处理冲突的方法3.1 说明3.2 开放定址法3.2.1 说明3.2.2 线性探测 3.3 链地址法3.4 再哈希法3.5 建立公共溢出区 四、哈希表的查找4.1 查找过程4.2 查找特点4.3 装填因子 一、概念 1.1 定义 1.一般存储结构由…

Golang | Leetcode Golang题解之第19题删除链表的倒数第N个结点

题目&#xff1a; 题解&#xff1a; func removeNthFromEnd(head *ListNode, n int) *ListNode {dummy : &ListNode{0, head}first, second : head, dummyfor i : 0; i < n; i {first first.Next}for ; first ! nil; first first.Next {second second.Next}second.N…

同态滤波的Python源码

同态滤波前 &#xff08;左&#xff09; 同态滤波后&#xff08;右&#xff09; 源码见下面链接&#xff1a; https://download.csdn.net/download/qqqweiweiqq/89129996?spm1001.2014.3001.5501

Leetcode算法训练日记 | day25

一、组合总和Ⅲ 1.题目 Leetcode&#xff1a;第 216 题 找出所有相加之和为 n 的 k 个数的组合&#xff0c;且满足下列条件&#xff1a; 只使用数字1到9每个数字 最多使用一次 返回 所有可能的有效组合的列表 。该列表不能包含相同的组合两次&#xff0c;组合可以以任何顺…

HDFS [MSST‘10] 论文阅读笔记

原论文&#xff1a;The Hadoop Distributed File System (MSST’10) HDFS关键技术要点概览 设计目标&#xff1a;HDFS旨在可靠地存储大型数据集&#xff0c;并以高带宽流式传输这些数据集到用户应用程序。它通过在大量服务器上分布存储和计算资源&#xff0c;使得资源可以随着…

A Learning-Based Approach for IP Geolocation(2010年)

下载地址:Towards IP geolocation using delay and topology measurements | Proceedings of the 6th ACM SIGCOMM conference on Internet measurement 被引次数:185 Eriksson B, Barford P, Sommers J, et al. A learning-based approach for IP geolocation[C]//Passive …

WebService反向代理的配置和

WebService反向代理的配置和 家都知道&#xff0c;联网上有很多被墙了的网站&#xff0c;虽然这是让人很伤心的一件事情&#xff0c;但还好咱们有办法绕过这个限制&#xff0c;那就是使用IP代理。今天我就来给大家讲讲如何配置和使用WebService反向代理。 什么是WebService反向…

二叉树遍历算法和应用

二叉树是指度为 2 的树。它是一种最简单却又最重要的树&#xff0c;在计算机领域中有这广泛的应用。 二叉树的递归定义如下&#xff1a;二叉树是一棵空树&#xff0c;或者一棵由一个根节点和两棵互不相交的分别称为根节点的左子树和右子树所组成的非空树&#xff0c;左子树和右…