Llama3中文聊天项目全能资源库

Llama3 中文聊天项目综合资源库,集合了与Lama3 模型相关的各种中文资料,包括微调版本、有趣的权重、训练、推理、评测和部署的教程视频与文档。1. 多版本支持与创新:该仓库提供了多个版本的Lama3 模型,包括基于不同技术和偏好的微调版本,如直接中文SFT版、Instruct偏好强化学习版、趣味版等。此外,还有Phi3模型中文资料仓库的链接,和性能超越了8b版本的Llama3。2. 部署与使用:项目提供了网页部署的代码和教程,使用户可以轻松地在网页上使用这些模型。部署教程包括如何在Streamlit上部署这些模型进行在线体验。3. 训练与推理资源:除了已经提供的模型,仓库还包括多种训练和推理的资源,如训练教程、推理脚本、优质训练数据集的整理等。4. 扩展和增强:项目还在计划中包括增加更多的扩展如角色扮演增强模型、长上下文支持等,旨在提升模型的功能和适应更多复杂场景的能力。
808cb24a80fcdc5c41d499229164f4ee.jpeg添加图片注释,不超过 140 字(可选)


da178585c785478c4552ce76eb09533a.jpeg添加图片注释,不超过 140 字(可选)
可用Chat版模型整理lama3相关对话版本优质权重整理:shareAl系列:1.base预训练+直接中文SFT版训练数据:https://modelscope.cn/datasets/baicai003/Llama3-Chinese-dataset/summaryV1版0penCSG满速下载:https://opencsg.com/models/shareAl/llama3-Chinese-chat-8bWiseModel满速下载:https://wisemodel.cn/models/shareAl/llama3-Chinese-chat-8bV2版modelscope:https://modelscope.cn/models/baicai003/Llama3-Chinese_v2/summary2.Instruct+继续中文SFT版modelscope模型下载:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary3.Instruct+强化学习中文版

  • DPO 表情趣味版(10分钟左右可训练好,对原多语言instruct版最小化性能损伤,实测超过大多中文大量训练版)
  • Modelscope:下载:https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5/summary
  • 偏好学习数据集:DP0-zh-en-emoji
  • Base预训练+海量中文优质数据增量预训练:正在进行中
  • 70b 中文版:计划中。

4.下面几个版本因对话模版格式不同暂时不支持网页部署推理,需要用fastchat体验

  • Base+ 中文SFT: https://modelscope.cn/models/zhuangxialie/Llama3_Chinese_Sft/files
  • Base+ ORPO: https://modelscope.cn/models/zhuangxialie/Llama3-Chinese-ORPO/summary 偏爱长对话
  • Instruct + DPO: https://www.modelscope.cn/models/zhuangxialie/Llama3-Chinese-DPO/summary 偏爱长对话

5.llama3 Pro(加block版,推荐网友积极在该方案上做更多尝试、探索)linjh1118网友(第一个ORPO偏好对齐+扩展2*blocks):htps://github.com/linjh1118/Llama3-Chinese-0RPO6.llama3 Moe增强版cooper12121-lama3-8x8b-MoE: https://github.com/cooper12121/llama3-8x8b-MoE7.长上下文版本联通微调版v2(中文,28k上下文):https://huggingface.co/UnicomLLM/Unichat-llama3-Chinese-8B-28K

  • 262k上下文(英文):https://huggingface.co/gradientai/Llama-3-8B-nstruct-262k
  • 262k上下文(中文):计划中
  • 无限上下文版本:计划中,参考:https://medium.com/neoxia/lm-infini-attention-with-linear-complexity-3209b87a77c3

8.其他普通中文微调版本

  • 联通微调版(SFT,网友尝试反馈幻觉多):
  • https://www.modelscope.cn/models/UnicomAl/Unichat-llama3-Chinese/summary-
  • Openbuddy微调版(SFT,据说不错):
  • https://www.modelscope.cn/models/0penBuddy/openbuddy-llama3-8b-v21.1-8k/summary
  • zhichen微调版(ORPO方法,应该是第一个orpo):https://github.com/seanzhang-zhichen/llama3-chinese
  • shenzhi-wang微调版(ORPO方法,说是第一个orpo):https:/huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat
  • Rookie微调版(SFT):https://github.com/Rookie1019/Llama-3-8B-nstruct-Chinese-hit-sz klc lab
  • 微调版本:https://github.com/zyg18181818/Llama-3-Chinese

9.破解安全限制系列(暂时只支持英文)

  • Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8B
  • neural-chat: https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b
  • dolphin: https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b

10.v-llama3 多模态图文版 (英文,支持视觉问答)

  • Bunny-Llama-3-8B-V:https://wisemodel.cn/models/BAAl/Bunny-Llama-3-8B-V
  • llava-llama-3-8b: https://huggingface.co/xtuner/llava-llama-3-8b-v1_1

11.agent工具能力增强版ModelScope Chinese Agent版V1(中文,可根据要求帮你选择工具)https://modelscope.cn/models/swift/Llama3-Chinese-8B-nstruct-Agent-v1/summary基于EmoLLM心理数据微调的Llama3-8B-Instruct 模型

  • EmoLLM 3.0 在线体验链接
  • EmoLLM Llama3心理咨询室V3.0 https://st-app-center-006861-9746
  • ilroxvg.openxlab.space/
  • 或者前往0penXLab EmoLLM3.0-Llama3启动

https://openxlab.org.cn/apps/detai/chg0901/EmoLLM-Llama3-8B-nstruct3.0模型链接**OpenXLab**https://openxlab.org.cn/models/detai/chg0901/EmoLLM-Llama3-8B.-Instruct3.0ModelScopehttps://modelscope.cn/models/chg0901/EmoLLM-Llama3-8B-Instruct3.0/summary新增Phi3模型中文资料仓库(性能超越llama3 8b,以小搏大),正在适配中https://github.com/CrazyBoyM/phi3-Chinese新增趣味版,数据集已开源:https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DP0-beta0.5/summary模型测评
284f1b2a2e19e658c7a83146fca806e1.jpeg添加图片注释,不超过 140 字(可选)

ac61257390536959ae236f25556ecb87.jpeg添加图片注释,不超过 140 字(可选)
可用训练工具整理下面的库都是相当好用的,代码封装简洁又清晰,如果你也想微调个自己的llama3 中文定制版,不要错过

  • Firefly-https://github.com/yangjianxin1/Firefly
  • 萤火虫-https://github.com/yangjianxin1/Firefly
  • LLaMA-Factory-https://github.com/hiyouga/LLaMA-Factory
  • unsloth-https://github.com/unslothai/unsloth
  • Xtuner-https://github.com/SmartFlowAl/Llama3-XTuner-CN
  • SWlFT-https://github.com/modelscope/swift
  • 高性价比gpu资源:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_697558837_tongyong_toutiao

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/697781.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

01 | 为什么需要消息队列?

哪些问题适合使用消息队列来解决? 1. 异步处理 2. 流量控制 使用消息队列隔离网关和后端服务,以达到流量控制和保护后端服务的目的。 3. 服务解耦 无论增加、减少下游系统或是下游系统需求如何变化,订单服务都无需做任何更改&#xff0c…

免费的GPT4终于要来了!OpenAI直播发布会详细解读!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识…

sql注入中的替换技巧。

目录 1:注释的替换 2:空格替换 3:大小写混合绕过及双写绕过 4:等号的绕过 5:单双引号的绕过 1:注释的替换 注释在sql注入中非常重要,因为会使用它来闭合我们注入的sql语句。 当以get方式提…

通过钉钉卡片进行工单审批

我们通常通过钉钉机器人来发送通知,提醒审批人名下有待办工单需要处理。这种通知方式仅能提醒审批人到ITSM中处理,审批人需要打开电脑登陆平台处理,我们就考虑是否能有一种方式能够满足移动端审批? 这里我们可以使用ITSM的移动端版…

使用Pyramid、Mako和PyJade生成 HTML

Pyramid 是一个流行的 Python Web 框架,而 Mako 和 PyJade 是用于模板引擎的工具,它们可以与 Pyramid 配合使用来生成 HTML 内容。但是在实际使用中还是有些差别的,尤其会遇到各种各样的问题,下面我将利用我所学的知识一一为大家解…

Django模型进阶

接上一节 4.查询数据 在Django中,正向查询(Forward Query)和反向查询(Reverse Query)是ORM(Object-Relational Mapping,对象关系映射)中用于处理数据库表间关系时的两种查询方式&a…

江门水文分局开展防灾减灾主题宣传活动

5月11日,第16个全国防灾减灾日到来之际,广东省水文局江门水文分局联合江门市五邑义工联合会直属义工服务总队(亲子服务队)在江门市万达广场举办了一场别开生面的防灾减灾主题宣传活动,进一步培育孩子们的防灾减灾的意识…

FPGA verilog LVDS通信协议笔记

一幅图胜过千言万语 直接开始挫代码,先写top.v。 module top();reg clk; // 生成时钟的寄存器 reg rst; // 生成复位信号的寄存器initial clk 1; // 初始值取1 always #1 clk ~clk; //1ns取反一次initial begin // 复位信号,先0,过段时间赋…

4.2 文本相似度(三)

换个思路,再训练一次。 1 基本框架 试想,如果有一个语句需要从预料库中匹配,每一次匹配都会伴随着大量的耗时: 一次匹配20ms, 1 000 000次呢,1 000 000 *20/ 1000 20 000S ~5.56H。效率极其的低&#x…

【PB案例学习笔记】-01创建应用、窗口与控件

写在前面 这是PB案例学习笔记系列文章的第一篇,也是最基础的一篇。后续文章中【创建程序基本框架】部分操作都跟这篇文章一样, 将不再重复。该系列文章是针对具有一定PB基础的读者,通过一个个由浅入深的编程实战案例学习,提高编…

今天开发了一款软件,我竟然只用敲了一个字母(文末揭晓)

软件课题:Python实现打印100内数学试题软件及开发过程 一、需求管理: 1.实现语言:Python 2.打印纸张:A4 3.铺满整张纸 4.打包成exe 先看效果: 1. 2.电脑打印预览 3.打印到A4纸效果(晚上拍的&#x…

JavaEE初阶-多线程5

文章目录 一、线程池1.1 线程池相关概念1.2 线程池标准类1.3 线程池工厂类1.4 实现自己的线程池 二、定时器2.1 java标准库中的定时器使用2.2 实现一个自己的定时器2.2.1 定义任务类2.2.2 定义定时器 一、线程池 1.1 线程池相关概念 池这个概念在计算机中比较常见&#xff0c…