从代码的层面掌握LLM的路线

原则:从易到难,只用 pytorch

从第一个项目来熟悉 transformer 的使用;

从第二个项目来掌握对训练数据的使用方法及 transformer 的 decoder 的细节;

从第三个项目来理解 LLM 的整个过程;

1,Transformer tutorial 阶段的教程

https://github.com/wmathor/nlp-tutorial/blob/master/5-1.Transformer/Transformer_Torch.pyicon-default.png?t=N7T8https://github.com/wmathor/nlp-tutorial/blob/master/5-1.Transformer/Transformer_Torch.py

    参考:

            Transformer详解 - mathor

            Transformer的PyTorch实现 - mathor

 

2,Transformer 原论文复现项目

The Annotated TransformerThe Annotated Transformericon-default.png?t=N7T8http://nlp.seas.harvard.edu/2018/04/03/attention.html

    参考:

            The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time.

3,自然语言处理实战——预训练模型应用及其产品化

这是一本书,通过本书可以掌握自然语言处理的常用技术

如果之前没有基础,则可以对其中的技术做一些扩充掌握,比如词嵌入向量的技术细节。

4, 开源 LLM 模型项目 OLMo

GitHub - allenai/OLMo: Modeling, training, eval, and inference code for OLMoModeling, training, eval, and inference code for OLMo - allenai/OLMoicon-default.png?t=N7T8https://github.com/allenai/OLMo

    OLMo 的项目论文:

    https://arxiv.org/abs/2402.00838

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/473981.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一起学量化之RSI指标

RSI指标 Relative Strength Index,相对强弱指数(RSI),是一个衡量资产过度买入或过度卖出状态的技术指标。 1. RSI的基本概念 当RSI超过70时,通常被认为是超买状态。当RSI低于30时,通常被认为是超卖状态。RSI超过80,被认为是严重超买状态。RSI低于20,被认为是严重超卖状…

使用Python编写脚本-根据端口号杀掉进程

我的GitHub:Powerveil - GitHub 我的Gitee:Powercs12 - Gitee 皮卡丘每天学Java 从前段开始遇到一个问题,服务在启动的时候总是端口被占用,发现还是Java程序,但是当时并没有启动Java程序,电脑出问题了。 一…

一起学量化之Aroon指标

Aroon指标是由Tushar Chande于1995年开发的技术分析工具,旨在识别股票是否处于趋势中及趋势的强度。它通过分析股票价格在一定周期内创下的新高和新低来预测趋势的变化,这基于一种观念:强势趋势通常伴随着频繁的新高或新低。 1. Aroon指标的组成 Aroon指标由两个部分组成:…

关于DVWA靶场Could not connect to the database service的几种解决办法

总的来说这个问题都是 config 配置文件没有修改正确 一般修改数据库的用户名和密码与 phpstudy 一致并且添加了 key 就能初始化成功的 但是我还遇到过另一种情况,修改了上面的东西依旧无法连接到数据库 Could not connect to the database service. Please check …

Code Composer Studio (CCS) - 文件比较

Code Composer Studio [CCS] - 文件比较 References 鼠标单击选中一个文件,再同时按住 Ctrl 鼠标左键来选中第二个文件,在其中一个文件上鼠标右击选择 Compare With -> Each Other. References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.n…

使用MinIO S3存储桶备份Weaviate

Weaviate 是一个开创性的开源向量数据库,旨在通过利用机器学习模型来增强语义搜索。与依赖关键字匹配的传统搜索引擎不同,Weaviate 采用语义相似性原则。这种创新方法将各种形式的数据(文本、图像等)转换为矢量表示形式&#xff0…

VS Code主题设置(美化VS Code)(主题+背景+图标+特效+字体)

目录 切换整体主题(整体主题) 切换文件图标主题 设置VS Code背景图案 字体特效 连击特效 字体设置 主题的具体效果放在了文章末尾,这篇文章后续也会进行更新 ————————————————————————————…

【plt.scatter绘制散点图】:从入门到精通,只需一篇文章!【Matplotlib】

【plt.scatter绘制散点图】:从入门到精通,只需一篇文章!【Matplotlib】!🚀 利用Matplotlib进行数据可视化示例 🌵文章目录🌵 一、plt.scatter入门:轻松迈出第一步 👣二、…

项目架构梳理

单点登录组件 CREATE TABLE user_info (id int(11) NOT NULL AUTO_INCREMENT COMMENT 自增主键,用户id,username varchar(30) NOT NULL COMMENT 用户姓名,password varchar(60) NOT NULL COMMENT 密码,token varchar(60) DEFAULT NULL COMMENT token,token_expire datetime DEF…

组合数的计算

1.由定义式直接算&#xff1a;n!/m!*(n-m)! #include <iostream> using namespace std; long long combine(long long m,long long n ){long long result1;for(int i1;i<n1;i){//n!result*i;}for(int i1;i<m1;i){//n!/m!result/i;}for(int i1;i<n-m1;i){//n!/(…

SpringBoot实战第五天

最后在开发一个文件上传接口&#xff0c;结束后端部分开发 文件上传接口 先看接口文档 阅读接口文档&#xff0c;唯一问题就是项目暂时还没有传到服务器上&#xff0c;所以对文件的存储与读取暂时在项目本地进行 Controller层 RestController public class FileUploadCont…

每日OJ题_二叉树dfs①_力扣2331. 计算布尔二叉树的值

目录 力扣2331. 计算布尔二叉树的值 解析代码 力扣2331. 计算布尔二叉树的值 2331. 计算布尔二叉树的值 难度 简单 给你一棵 完整二叉树 的根&#xff0c;这棵树有以下特征&#xff1a; 叶子节点 要么值为 0 要么值为 1 &#xff0c;其中 0 表示 False &#xff0c;1 表示…