用 PyTorch 构建液态神经网络(LNN)

用 PyTorch 构建液态神经网络(LNN)

在这里插入图片描述

文章目录

    • 什么是液态神经网络
    • 为什么需要液态神经网络
    • LNN 与 RNN 的区别
    • 用 PyTorch 实现 LNN
      • Step 1. 导入必要的库
      • Step 2. 定义网络架构
      • Step 3. 实现 ODE 求解器
      • Step 4. 定义训练逻辑
    • LNN 的缺陷
    • 总结

什么是液态神经网络

2020年,麻省理工学院(MIT)的两名研究人员带领团队推出了一种基于现实生活中的自然智能、而非人工智能的新型神经网络。他们从微小的秀丽隐杆线虫(Caenorhabditis elegans)中汲取灵感,尽管这种微生物的神经系统只有302个神经元,但却能够产生复杂的行为。受此启发,研究团队创造了所谓的 “液态神经网络” (Liquid Neural Networks)。经过2022年的突破,这种新型网络已经足够灵活,足以在某些应用中取代传统的神经网络。

在这里插入图片描述

液态神经网络(LNN)是一种神经网络,它顺序处理数据并能够实时适应变化的数据,非常类似于人类大脑。

在这里插入图片描述

LNN 架构

本质上,液态神经网络是一种时间连续的递归神经网络(RNN),它顺序处理数据,保留过去输入的记忆,根据新输入调节其行为,并能够处理可变长度的输入以增强神经网络的任务理解能力。强大的可适应性赋予了液态神经网络持续学习和适应的能力,并最终使其能够比传统神经网络更有效地处理时间序列数据。

一个连续时间神经网络是具有以下特点的神经网络 f f f
d x d t = f ( n , k , l t y p e ) ( x ( t ) , I ( t ) , θ ) \frac{dx}{dt} = f(n,k,l_{type})(x(t),I(t),\theta) dtdx=f(n,k,ltype)(x(t),I(t),θ)
其中

  • n n n: 层数
  • k k k: 宽度
  • l t y p e l_{type} ltype: 激活函数
  • x ( t ) x(t) x(t): 隐藏状态
  • I ( t ) I(t) I(t): 输入
  • θ \theta θ: 模型参数

如果 f f f 参数化了隐藏状态的导数,我们可以从离散的计算图转变为连续的时间图。这使得我们能够实现液态神经网络(LNN)的以下两个特性:

  1. 由于液态状态,可能的函数空间大大增加。
  2. 可以计算任意时间帧使得 LNN 非常适合序列数据处理。

为什么需要液态神经网络

过去的35年里,我们构建的都是基于数据和学习参数( θ \theta θ​)输出预测结果的概率模型。每个神经元都是一个逻辑回归门。将其与反向传播结合起来——一种基于模型损失重新训练参数权重的方法,就得到了神经网络。

然而,神经网络在现代世界中存在一些局限:

  1. 神经网络在单一任务上表现良好,但无法跨任务泛化知识,即具有固态性。
  2. 神经网络以非顺序方式处理数据,使其在处理实时数据时效率不高。

液态神经网络就是为了弥补传统神经网络的不足,它是一种在工作中学习的神经网络,不仅仅在训练阶段学习。液态神经网络提供了许多核心优势,包括:

  • 实时决策能力;
  • 快速响应各种数据分布;
  • 具有韧性,并能过滤异常或噪声数据;
  • 比黑箱机器学习算法具有更高的可解释性;
  • 降低计算成本。

LNN 与 RNN 的区别

  1. 神经元状态架构:在液态状态机(LSM)中,递归连接是随机生成并固定的。输入信号被送入这个随机连接的网络,网络对这些输入的响应进一步用于分类或预测等任务。
  2. 训练:递归神经网络(RNN)通常通过时序反向传播(BPTT)进行训练,而液态神经网络(LNN)通常依赖于一种称为“蓄水池计算”的无监督学习形式。在这种方法中,递归连接(蓄水池)是随机生成并保持固定的。只有读出层,即将蓄水池的动态映射到所需输出的层,使用监督学习技术进行训练。这使得 LSM 的训练相比于 RNN 来说更为简单。
  3. 梯度消失问题:由于固定的递归连接,LNN 通常被认为对参数变化更为稳健。
  4. 应用:RNN 非常适合顺序建模,而 LNN 可以用来解决各种任务,包括语音识别、机器人控制和时间模式识别等。

用 PyTorch 实现 LNN

在 PyTorch 中训练液态神经网络(LNN)包括如下步骤:定义网络架构、实现常微分方程(ODE)求解器和优化网络参数。下面我们一步一步在 PyTorch 中实现一个 LNN :

Step 1. 导入必要的库

import torch
import torch.nn as nn
import torch.optim as opt
import numpy as np

Step 2. 定义网络架构

LNN 由一系列层组成,每一层对输入应用非线性变换。每层的输出都会通过一个 Leaky ReLU 激活函数,该函数有助于在网络中引入非线性。

class LiquidNeuralNetwork(nn.Module):def __init__(self, input_size, hidden_size, num_layers):super(LiquidNeuralNetwork,self).__init__()self.hidden_size = hidden_sizeself.num_layers = num_layersself.layers = nn.ModuleList([self._create_layer(input_size,hidden_size) for _inrange(num_layers)])def _create_layer(self, input_size, hidden_size):return nn.Sequential(nn.Linear(input_size, hidden_size),nn.LeakyReLU(),nn.Linear(hidden_size, hidden_size))def forward(self,x):for i, layer in enumerate(self.layers):x = layer(x)return x

Step 3. 实现 ODE 求解器

ODE 求解器负责根据输入数据更新网络的权重。我们可以使用 PyTorch 的自动微分系统(autograd)来实现 ODE 求解器。

class ODESolver(nn.Module):def __init__(self, model, dt):super(ODESolver, self).__init__()self.model = modelself.dt = dtdef forward(self, x):with torch.enable_grad():outputs = []for i, layer in enumerate(self.model):outputs.append(layer(x))x = outputs[-1]return xdef loss(self, x, t):with torch.enable_grad():outputs =[]for i,layer in enumerate(self.model):outputs.append(layer(x))x = outputs[-1]return x

Step 4. 定义训练逻辑

训练逻辑根据输入数据和 ODE 求解器来更新网络的权重。

def train(model, dataset, optimizer, epochs, batch_size):model.train()total_loss = 0for epoch in range(epochs):for batch in dataset:inputs,labels = batchoptimizer.zero_grad()outputs = model(inputs)loss = model.loss(inputs,outputs)loss.backward()optimizer.step()total_loss += loss.item()print(f'Epoch {epoch+1}, Loss:{total_loss /len(dataset)}')

LNN 的缺陷

虽然液态神经网络非常有用,但它们也存在一些不足,包括:

  • 在处理静态或固定数据时会遇到困难;
  • 由于梯度爆炸或消失,训练难度增加;
  • 由于梯度问题而在学习长期依赖性方面存在限制;
  • 缺乏对液态神经网络功能进行广泛研究;
  • 参数调整过程非常耗时;

这些问题需要通过进一步的研究和技术改进来解决,以便更好地利用液态神经网络的潜力。

总结

在人工智能领域,液态神经网络是最关键的新兴模型之一。

它与传统的深度学习神经网络并存,却更适合处理如自动驾驶汽车、温度或气候监测、股市评估等极其复杂的任务,而传统的深度学习神经网络则更擅长处理静态或一次性数据。

麻省理工学院的计算机科学与人工智能实验室(CSAIL)的研究人员一直在尝试将液态神经网络的能力扩展到更多的应用场景,但这需要时间。

液态神经网络和传统的深度学习神经网络在更广泛的人工智能领域中都有其确定的角色,二者配合使用其效果这绝对是 1+1>2。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/660817.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux的vim下制作进度条

目录 前言: 回车和换行有区别吗? 回车和换行的区别展示(这个我在Linux下演示) 为什么会消失呢? 回车和换行的区别 为什么\r和\n产生的效果不同? 打印进度条: (1)打印字符串 …

【Mac】mac 安装 prometheus 报错 prometheus: prometheus: cannot execute binary file

1、官网下载 Download | Prometheus 这里下载的是prometheus-2.51.2.linux-amd64.tar.gz 2、现象 解压之后启动Prometheus 启动脚本: nohup ./prometheus --config.fileprometheus.yml > prometheus.out 2>&1 & prometheus.out日志文件&#xff…

量子城域网建设设备系列(一):光量子交换机

通过一段时间的讨论,我们已经对城域网的建设有了一定的基础概念,从本文开始,我们将逐步开始讨论量子城域网建设过程中的设备。本文我们讨论光量子交换机。 1.光量子交换机的基本概念 如下图为两个国产光量子交换机,这两款设备均用…

IDEA 中 git fetch 验证报错 The provided password or token is incorrect

参考链接: 【GitLab】-HTTP Basic: Access denied.remote:You must use a personal access token_http basic: access denied. the provided password o-CSDN博客 idea使用gitLab报错:remote: HTTP Basic: Access denied_idea remote: http basic: acc…

【webrtc】MessageHandler 3: 基于线程的消息处理:以sctp测试为例

消息处理可以用于模拟发包处理G:\CDN\rtcCli\m98\src\net\dcsctp\socket\dcsctp_socket_network_test.cc 这个实现中,onMessage还是仅对了一种消息进行处理,就是接收则模式下,打印带宽。当然,可能程序有多个消息,分别在不同的onmessage中执行?SctpActor:以一个恒定的速率…

【webrtc】MessageHandler 4: 基于线程的消息处理:以Fake 收发包模拟为例

G:\CDN\rtcCli\m98\src\media\base\fake_network_interface.h// Fake NetworkInterface that sends/receives RTP/RTCP packets.虚假的网络接口,用于模拟发送包、接收包单纯仅是处理一个ST_RTP包 消息的id就是ST_RTP 类型,– 然后给到目的地:mediachannel处理: 最后消息消…

Django后台项目开发实战五

完成两个功能: HR 可以维护候选人信息面试官可以录入面试反馈 第五阶段 创建 interview 应用,实现候选人面试评估表的增删改功能,并且按照页面分组来展示不同的内容,如候选人基础信息,一面,二面的面试结…

思考!思考!jmeter线程数≠用户并发数

最近又在搞性能测试了,相较于之前的写脚本出数据就完事,这次深入的思考了一下测试出来的指标,到底有什么意义??? 绞尽脑汁思考了好几天,终于有了点思路,写出来与大家分享&#xff0…

一个单例模式中使用std::unique_ptr引起的莫名其妙的COFF损坏的问题(未解决)

使用static std::unique_ptr和static std::shared_ptr都不行struct IElementAgendaEvents {//! Called to allow listeners to modify the agenda by adding/removing entries before applying tool operation. Return true if entries added or invalidated.virtual bool …

如何给MP3添加专辑封面

MP3的专辑封面可以直接显示在音频播放器上,但如果我们的音乐文件没有专辑封面怎么办?下面来给大家介绍如何添加mp3封面 打开智游剪辑(官网:zyjj.cc),搜索音乐封面添加 我们上传一下音乐文件和专辑封面&…

2024最新版JavaScript逆向爬虫教程-------基础篇之常用的编码与加密介绍(python和js实现)

目录 一、编码与加密原理1.1 ASCII 编码1.2 详解 Base641.2.1 Base64 的编码过程和计算方法1.2.2 基于编码的反爬虫设计1.2.3 Python自带base64模块实现base64编码解码类封装 1.3 MD5消息摘要算法1.3.1 MD5 介绍1.3.2 Python实现md5以及其他常用消息摘要算法封装 1.4 对称加密与…

搭建和配置Stable Diffusion环境,超详细的本地部署教程

跃然纸上的创意、瞬息万变的想象,Stable Diffusion以AI的力量赋予您无限创作可能。在这篇详尽的本地部署教程中,我们将携手走进Stable Diffusion的世界,从零开始,一步步搭建和配置这个强大的深度学习环境。无论您是热衷于探索AI艺…