【深度学习】S2 数学基础 P1 线性代数(上)

目录

  • 基本数学对象
    • 标量与变量
    • 向量
    • 矩阵
    • 张量
    • 降维求和
    • 非降维求和
    • 累计求和
  • 点积与向量积
    • 点积
    • 矩阵-向量积
    • 矩阵-矩阵乘法

深度学习的三大数学基础 —— 线性代数、微积分、概率论;
自本篇博文以下几遍博文,将对这三大数学基础进行重点提炼。

本节博文将介绍线性代数知识,为线性代数第一部分。包含基本数学对象、算数和运算,并用数学符号和相应的张量代码实现表示它们。


基本数学对象

基本数学对象包含:

  • 0维:标量与变量
  • 1维:向量
  • 2维:矩阵

标量与变量

一个简单的温度转换计算表达式,
c = 5 9 ( f − 52 ) c = \frac 5 9 (f-52) c=95(f52)

其中 c 代表摄氏度,而 f 代表华氏度。
而这个计算表达式中,数值 5、9、52 是标量值,而未知的标量值,即自变量 f 与因变量 c,都是变量值。

标量与变量在张量中,由只有一个元素的张量来表示。

import torch
# 实例化两个标量
x = torch.tensor(3.0)
y = torch.tensor(2.0)# 执行算数运算
print("x+y=", x+y, "\nx*y=", x*y, '\nx/y=', x/y, '\nx**y=', x**y)
x+y= tensor(5.) 
x*y= tensor(6.) 
x/y= tensor(1.5000) 
x**y= tensor(9.)

P.S. 在线性代数中,标量与变量通常用小写不加粗的字母表示, a a a


向量

向量可以视为由一系列标量值组成的列表,这些标量值被称为向量的元素或者分量。当使用向量来表示数据集中的样本时,它们通常具有一定的现实意义。例如一个用于表征用户个人信息的样本可以使用向量表示用户的年龄、性别、收入等标量信息。

使用张量表示向量,通常使用一维张量;

import torchx = torch.arange(4)
print(x)
tensor([0, 1, 2, 3])

索引: 访问向量中的元素,可以直接通过索引值来访问;

print(x[-1])

长度: 所谓向量的长度,指的是向量中标量的个数,通过 len() 函数获取;

print(len(x))

形状: 通过 .shape 属性访问向量的形状。形状是一个元素组,列出张量沿每个轴的长度(维数)。而对于只有一个轴的张量,其形状只有一个元素。

print(x.shape)

P.S. 在线性代数中,向量通常使用粗体小写字母表示: a \mathbf{a} a


矩阵

正如向量是将标量从零阶推广到一阶,矩阵则是将向量从一阶推广到二阶。矩阵 A m n \mathbf{A_{mn}} Amn m m m n n n 列标量组成,其中每个元素 a i j a_{ij} aij 是矩阵中第 i i i j j j 列元素。

使用张量表示矩阵,使用二维张量;

import torchx = torch.arange(20).reshape(5, 4)
print(x)
tensor([[ 0,  1,  2,  3],[ 4,  5,  6,  7],[ 8,  9, 10, 11],[12, 13, 14, 15],[16, 17, 18, 19]])

索引: 访问矩阵中元素,通过行索引( i i i)和列索引( j j j)来访问矩阵中的标量元素 a i j a_{ij} aij

# 访问第二行第三个元素
print(x[1][2])

转置: 交换矩阵的行和列称为矩阵的转置( A T \mathbf{A^T} AT)。对于 B = A T \mathbf{B}=\mathbf{A^T} B=AT,有 b i j = a j i b_{ij}=a_{ji} bij=aji

print(x.T)
tensor([[ 0,  4,  8, 12, 16],[ 1,  5,  9, 13, 17],[ 2,  6, 10, 14, 18],[ 3,  7, 11, 15, 19]])

对称矩阵: 对称矩阵是特殊的方阵,方阵是特殊的矩阵。对于矩阵 A m n \mathbf{A_{mn}} Amn,有方阵( m = n m=n m=n),对称矩阵( A = A T \mathbf{A}=\mathbf{A^T} A=AT

B = torch.tensor([[1, 2, 3],[2, 0, 4],[3, 4, 5]])print(B == B.T)
tensor([[True, True, True],[True, True, True],[True, True, True]])

矩阵是很有用的数据结构,其中的行可对应于不同的数据样本,列对应着不同的属性。


张量

现实世界并非是单纯的二维世界。图片,通常由 RGB 三个颜色通道构成,这就需要一个三维的数据结构来表示。而张量,可以用来表示任意维度数的数据结构。例如:向量是一阶张量,矩阵是二阶张量。

张量算法有两个基本性质:

  • 按元素运算: 两个张量按元素运算,要求其形状 shape 必须相同,张量中对应位置的标量将进行运算操作。
import torchx = torch.tensor([1.0, 2, 4, 8])
y = torch.tensor([2, 2, 2, 2])
print("x=", x)
print("y=", y)
print("x+y=", x+y)
x= tensor([1., 2., 4., 8.])
y= tensor([2, 2, 2, 2])
x+y= tensor([ 3.,  4.,  6., 10.])
  • 广播机制: 张量的广播机制用于将张量扩展,要求两个向量要分别满足形状( x x x, y y y)与( y y y, z z z)方才可以进行运算。
import torcha = torch.arange(3).reshape(3, 1)
b = torch.arange(2).reshape(1, 2)print("a=", a)
print("b=", b)
print("a*b=", a*b)
a= tensor([[0],[1],[2]])
b= tensor([[0, 1]])
a*b= tensor([[0, 0],[0, 1],[0, 2]])

更多关于张量的操作博文,请移步:【深度学习】S1 预备知识 P1 张量


降维求和

对于一个张量,我们可以使用函数 sum() 进行简答求和;

import torchx = torch.arange(12).reshape(3, -1)
print(x)
print(x.sum())
tensor([[ 0,  1,  2,  3],[ 4,  5,  6,  7],[ 8,  9, 10, 11]])
tensor(66)

在默认情况下,调用求和函数会降低张量的维度直到变成一个标量。但是我们也可以通过 sum() 函数中的变量 axis= 来指定张量沿哪一个轴来进行求和操作。比如;

print(x.sum(axis=0))
tensor([[ 0,  1,  2,  3],[ 4,  5,  6,  7],[ 8,  9, 10, 11]])
tensor([12, 15, 18, 21])

通过在函数 sum() 中设置 axis= 参数,我们可以沿着二维张量的横坐标将其合并成一维的张量向量。

另外,针对多维张量,我们还可以通过将 axis 参数设置为一个数组,来实现同时降低多个维度到指定的维度。

print(x.sum(axis=[0, 1]))
tensor(66)

观察结果可知,数据维度降至默认的标量形式。


非降维求和

然而,在某些情况下,我们可能希望保留计算出的和的结果的原始维度,此时,在 sum(axis=) 函数中需要增加设置 keepdims 参数;

print(x.sum(axis=0))
print(x.sum(axis=0, keepdims=True))
# 打印维度信息
print((x.sum(axis=0)).shape)
print((x.sum(axis=0, keepdims=True)).shape)
tensor([12, 15, 18, 21])
tensor([[12, 15, 18, 21]])
# 维度信息
torch.Size([4])
torch.Size([1, 4])

观察两个结果的对比,明显可以看出它们的维度存在差异。


累计求和

使用 cumsum() 函数,可以实现张量在某一维度上的累加求和操作。

import torchx = torch.arange(12).reshape(3, -1)
print(x)
print(x.cumsum(axis=0))
tensor([[ 0,  1,  2,  3],[ 4,  5,  6,  7],[ 8,  9, 10, 11]])
tensor([[ 0,  1,  2,  3],[ 4,  6,  8, 10],[12, 15, 18, 21]])

可以观察到,张量在其维度上进行逐层累加求和。如上,便是 cumsum() 函数。


点积与向量积

点积

点积(也称为内积)是指两个张量在对应位置上元素相乘后的和。

import torchx = torch.arange(4, dtype=torch.float32)
y = torch.ones(4, dtype=torch.float32)
print("x=", x)
print("y=", y)
print(torch.dot(x, y))
x= tensor([0., 1., 2., 3.])
y= tensor([1., 1., 1., 1.])
tensor(6.)

上述结果: 6 = 0 ∗ 1 + 1 ∗ 1 + 2 ∗ 1 + 3 ∗ 1 6 = 0*1+1*1+2*1+3*1 6=01+11+21+31


矩阵-向量积

矩阵向量积,指的是矩阵与向量的乘法,也就是将矩阵与向量相乘得到一个新的向量。

e . g . e.g. e.g. 假设我们有矩阵 A \mathbf{A} A 和向量 v \mathbf{v} v,其中 A \mathbf{A} A 是一个 m ∗ n m*n mn 矩阵, v \mathbf{v} v 是一个 n n n 维向量,那么它们的向量积 A v \mathbf{Av} Av 是一个 m m m 维向量;

在这里插入图片描述

读者可以借助以下张量的示例来增进理解。

在张量中,通过 mv() 函数来实现矩阵向量积;其中 m m m 意味着矩阵 matrix, v v v 意味着向量 vector;

import torchx = torch.arange(20, dtype=torch.float32).reshape(5, 4)
y = torch.ones(4, dtype=torch.float32)
print("x=", x)
print("y=", y)
print(torch.mv(x, y))
x= tensor([[ 0.,  1.,  2.,  3.],[ 4.,  5.,  6.,  7.],[ 8.,  9., 10., 11.],[12., 13., 14., 15.],[16., 17., 18., 19.]])
y= tensor([1., 1., 1., 1.])
tensor([ 6., 22., 38., 54., 70.])

矩阵-矩阵乘法

矩阵与矩阵乘法,可以看作简单地执行多次矩阵-向量积,并将结果拼接在一起形成矩阵。假设有两个矩阵 A \mathbf{A} A B \mathbf{B} B,其中 A \mathbf{A} A 是一个 m × n m×n m×n 的矩阵, B \mathbf{B} B 是一个 n × p n×p n×p 的矩阵,那么它们的乘积 C = A × B C=A×B C=A×B 是一个 m × p m×p m×p 的矩阵。

在这里插入图片描述

e . g . e.g. e.g. 矩阵-矩阵乘法使用 mm() 函数实现;

import torchx = torch.arange(20, dtype=torch.float32).reshape(5, 4)
y = torch.ones(12, dtype=torch.float32).reshape(4, 3)
print("x=", x)
print("y=", y)
print(torch.mm(x, y))
x= tensor([[ 0.,  1.,  2.,  3.],[ 4.,  5.,  6.,  7.],[ 8.,  9., 10., 11.],[12., 13., 14., 15.],[16., 17., 18., 19.]])
y= tensor([[1., 1., 1.],[1., 1., 1.],[1., 1., 1.],[1., 1., 1.]])
tensor([[ 6.,  6.,  6.],[22., 22., 22.],[38., 38., 38.],[54., 54., 54.],[70., 70., 70.]])

以上便是深度学习数学基础,线性代数第一部分;
线性代数第二部分将讲述 L 1 L1 L1 范数以及 L 2 L2 L2 范数,以及其张量实现。

如有任何问题,请留言或联系!谢谢!!

2024.2.13

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/467476.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Illegal escape character in string literal

问题 笔者进行Android项目开发,编译器提示报错 Illegal escape character in string literal详细问题 textView.setText(“A\B”); 解决方案 修改代码为A\B textView.setText(“A\B”) 产生原因 问题产生的原因是在字符串字面值中使用了非法的转义字符。在…

猫头虎分享已解决Bug ‍ || 错误SyntaxError: invalid syntax(Python)的解决方法

博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的宝典!《IDEA开发秘籍》 — 提升你的IDEA技能!《100天精通鸿蒙》 …

编写代码(LLVM的第一个项目)

下面这个完整代码 它相对较短,因为它建立在LLVM 流程的基础设施上 后者替我们完成大部分工作 我们从程序使用cl命名空间中的llvm工具(cl代表命令行)来实现我们的命令行接口 需要调用ParseCommandLineOption函数声明cl:&#xff…

滑动小短剧影视微信小程序源码/带支付收益等模式

仿抖音滑动小短剧影视微信小程序源码,带支付收益等模式、支持无限滑动;高性能滑动、预加载、视频预览,支持剧情介绍,集合壁纸另外仿抖音滑动效果;支持会员模式,支持用户单独购买等等多功能。 丰富的后台设…

Vscode 在汇编文件中添加调试断点

Vscode 在汇编文件中添加调试断点 vscode默认不支持汇编文件添加断点, 可以在设置里面打开

开发自定义标记应用程序

开发自定义标记应用程序 问题陈述 Larry Williams 是ABC Inc.公司的CEO,他希望公司能够拥有一个交互式网站以向访问网站的用户表示问候并显示当前时间。他还希望最终用户能够指定主页的背景颜色。您是公司的网站管理员。Larry要您修改网站的主页,以便向最终用户显示自定义问…

19 删除链表的倒数第 N 个结点

19. 删除链表的倒数第 N 个结点 中等 相关标签 相关企业 提示 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 这段代码使用了双指针的方法,其中一个指针先走 n 步,然后两个指针一起走,直到第一…

Java强训day20(选择题编程题)

选择题 编程题 题目1 import java.util.Scanner;public class Main { public static void main(String[] args) {Scanner sc new Scanner(System.in);String s sc.nextLine();StringBuffer ss new StringBuffer(s);System.out.println(ss.reverse());sc.close();} }

数学建模:K-means聚类手肘法确定k值(含python实现)

原理 当K-means聚类的k值不被指定时,可以通过手肘法来估计聚类数量。   在聚类的过程中,随着聚类数的增大,样本划分会变得更加精细,每个类别的聚合程度更高,那么误差平方和(SSE)会逐渐变小&am…

有趣儿的组件(HTML/CSS)

分享几个炫酷的组件&#xff0c;起飞~~ 评论区留爪&#xff0c;继续分享哦~ 文章目录 1. 按钮2. 输入3. 工具提示4. 单选按钮5. 加载中 1. 按钮 HTML&#xff1a; <button id"btn">Button</button>CSS&#xff1a; button {padding: 10px 20px;text-tr…

Python中多种生成随机密码超实用实例

前言 密码是信息安全的基石&#xff0c;它用于保护我们的账户、数据和隐私。为了确保密码足够强大&#xff0c;需要生成随机密码。在本文中&#xff0c;将讨论多种Python方法&#xff0c;用于生成随机密码的实用示例和技巧。 目录 ​编辑 前言 密码生成的要求 使用secrets…

给你介绍一款适合教培行业的手机软件,很好用,关键还是免费的

给你介绍一款适合教培行业的手机软件&#xff0c;很好用&#xff0c;关键还是免费的&#xff0c;DT浏览器不同于普通意义上的浏览器&#xff0c;DT的含义就是数据资料的意思&#xff0c;更专注于资料的收集和管理&#xff0c;是一款资料管理类的浏览器&#xff0c;也是一款面向…