浦语大模型笔记

书生·浦语大模型全链路开源体系

  • 浦语大模型全链路开源体系
    • 大模型成为发展通用人工智能的重要途径
    • 书生·浦语 2.0(InternLM2)核心理念
    • 书生·浦语 2.0(InternLM2)的主要亮点
      • 主要亮点 1:超长上下文支持
      • 主要亮点 2:性能全方位提升
      • 主要亮点 3:优秀的对话和创作体验
      • 主要亮点 4:工具调用能力升级
      • 主要亮点 5:数理能力突出
      • 从模型到应用典型流程
    • 书生·浦语全链条开源开放体系
      • 全链条开源开放体系|数据
      • 全链条开源开放体系|开放高质量语料数据
      • 全链条开源开放体系|预训练
      • 全链条开源开放体系|微调
      • 全链条开源开放体系|评测
      • 全链条开源开放体系|部署
      • 全链条开源开放体系|智能体

浦语大模型全链路开源体系

大模型成为发展通用人工智能的重要途径

  • 专用模型:针对特定任务,一个模型解决一个问题
  • 通用大模型:一个模型应对多种任务、多种模态
    在这里插入图片描述在这里插入图片描述
  • 大模型发展时间线
    在这里插入图片描述
  • LLaMA 模型家族
    在这里插入图片描述
  • 书生·浦语大模型开源历程
    在这里插入图片描述

书生·浦语 2.0(InternLM2)核心理念

  • 面向不同的使用需求 ,每个规格包含三个模型版本

7B:为轻量级的研究和应用提供了一个轻便但性能不俗的模型
20B:模型的综合性能更为强劲,可有效支持更加复杂的实用场景

  • InternLM2-Base

高质量和具有很强可塑性的模型基座是模型进行深度领域适配的高质量起笈

  • InternLM2

在 Base 基础上,在多个能力方向进行了强化 ,在评测中成绩优异,同时保持了很好的通用语言能力,是我们推荐的在大部分应用中考虑选用的优秀基座

  • InternLM2-Chat

在 Base 基础上,经过 SFT 和 RLHF,面向对话交互进行了优化,具有很好的指令遭循、共情聊天和调用工具等的能力

  • 回归语言建模的本质
  • 致力于通过更高质量的语料以及更高的信息密度,实现模型基座语言建模能力的质的提升
    在这里插入图片描述

书生·浦语 2.0(InternLM2)的主要亮点

在这里插入图片描述

主要亮点 1:超长上下文支持

模型在 20 万字长输入中几乎完美地实现长文“大海捞针”
在这里插入图片描述

主要亮点 2:性能全方位提升

在各能力维度全面进步,在推理、数学、代码等方面的能力提升尤为显著,综合性能达到同量级开源模型的领先水平,在重点能力评测上 InternLM2-Chat-20B 甚至可以达到比肩 ChatGPT (GPT-3.5)的水平
在这里插入图片描述

主要亮点 3:优秀的对话和创作体验

  • 贴心又可靠的 Al 助手
  • 充满人文关怀的对话
  • 富有想象力的创作

AlpacaEval2 英文主观对话榜单(斯坦福大学发布)IntemLM2-Chat-20B胜率(21.75%)超越了 GPT-3.5(14.13%),GeminiPro(16.85%)和Claude-2 (17.19%)
指令遵循能力评测集 IFEval(谷歌发布): InternLM2-Chat-208 的指令遵循率超越了 GPT-4(79.5%vs 79.3%)
在这里插入图片描述
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/dd2c160c38cc486fbf98eeba2c043bff.png x=x300)
在这里插入图片描述

主要亮点 4:工具调用能力升级

工具调用能够极大地拓展大语言模型的能力边界 ,使得大语言模型能够通过搜索、计算、代码解释器等获取最新的知识并处理更加复杂的问题。InternLM2进一步升级了模型的工具调用能力,能够更稳定地进行工具筛选和多步骤规划,完成复杂任务

主要亮点 5:数理能力突出

  • 强大的内生计算能力

在预训练阶段,模型吸收了丰富的数学相关的语料,在微调阶段模型全面学习了覆盖不同学段各类知识点的题目,使得模型内生的计算能力得到了大大增强
在这里插入图片描述

  • 代码解释器:更上一层楼

借助代码解释器,模型能够编写代码进行更复杂的计算,或者对推理的结果进行形式化验证,从而可以解决计算要求更高或者演算过程更加复杂的问题
在这里插入图片描述

  • 数据分析和可视化

基于在计算及工具调用方面强大的基础能力,InternLM2在语言模型中具备了数据分析和可视化实用能力,进一步贴近用户使用场景
在这里插入图片描述

从模型到应用典型流程

在这里插入图片描述

书生·浦语全链条开源开放体系

在这里插入图片描述

全链条开源开放体系|数据

在这里插入图片描述

全链条开源开放体系|开放高质量语料数据

在这里插入图片描述

全链条开源开放体系|预训练

在这里插入图片描述

全链条开源开放体系|微调

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

全链条开源开放体系|评测

在这里插入图片描述

  • OpenCompass 2.0 司南大模型评测体系开源历程
    ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/8bf1289ac62d4b4eb3977bfc3f5d209b.png #pic_center)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • CompassRank:中立全面的性能榜单
    在这里插入图片描述

  • CompassKit:大模型评测全栈工具链
    在这里插入图片描述

  • CompassHub:高质量评测基准社区
    在这里插入图片描述

  • OpenCompass 2.0 能力维度全面升级
    在这里插入图片描述

  • 夯实基础:自研高质量大模型评测基准
    在这里插入图片描述

  • 洞见未来:年度榜单与能力分析

  • 洞见未来:OpenCompass 年度榜单(主观评测-对战胜率)

  • 洞见未来:OpenCompass 年度榜单(综合性客观评测)

  • 群策群力:携手行业领先共建繁荣生态

全链条开源开放体系|部署

在这里插入图片描述
在这里插入图片描述

全链条开源开放体系|智能体

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/696302.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java面试八股之Java中的IO流分为几种

Java中的IO流分为几种 按数据单位分类: 字节流(Byte Stream):以字节(8位二进制数)为基本单位进行数据读写。字节流适合处理所有类型的数据,包括文本、图像、音频、视频等二进制文件。抽象基类…

ECMAScript 2024 新特性

ECMAScript 2024 新特性 ECMAScript 2024, the 15th edition, added facilities for resizing and transferring ArrayBuffers and SharedArrayBuffers; added a new RegExp /v flag for creating RegExps with more advanced features for working with sets of strings; and …

Python练习04

目录 制作一个简易的注册登陆系统 实现过程 声明需要用到的库 构造一个判断用户文件是否存在的函数 构造一个存储用户文件的函数 制作UI 制作系统主体 运行效果 制作一个简易的注册登陆系统 通过所学知识制作一个简易的注册登陆系统,要求可以存储账户及密码&#…

疯狂为你省钱 - Al一键虚拟试衣整合包

在今天的数字时代,中小服装商家以及各种带货人,面临着各种挑战,其中之一就是模特拍摄的高成本。为此,一个名为OMS-Diffusion的新开源项目应运而生,旨在帮助大家通过虚拟试衣来降低成本。使用这个工具,只需要…

SSRF(服务器端请求伪造)的学习以及相关例题(上)

目录 一、SSRF的介绍 二、漏洞产生的原因 三、利用SSRF可以实现的效果(攻击方式) 四、SSRF的利用 五、SSRF中的函数 file_get_content() 、fsockopen() 、curl_exec() 1.file_get_content(): 2.fsockopen(): 3.curl_exec()&#xff1…

【C++】string类的使用④(字符串操作String operations || 常量成员Member constants)

🔥个人主页: Forcible Bug Maker 🔥专栏: STL || C 目录 前言🔥字符串操作(String operations)c_strdataget_allocatorcopyfindrfindfind_first_offind_last_offind_first_not_offind_last_not…

Android 老年模式功能 放大字体

1 配置属性 <attr name"text_size_16" format"dimension"/><attr name"text_size_18" format"dimension"/><attr name"text_size_14" format"dimension"/><attr name"text_size_12&quo…

LVGL移植到ARM开发板(GEC6818)

源码下载&#xff1a;点击跳转 下载好三个文件后&#xff0c;将其解压缩&#xff0c;并合到一个文件夹里面—— 1、修改 Makefile 删除 -Wshift-negative-value 2、修改 main.c 3、修改 lv_drv_conf.h 在lv_drv_conf.h文件屏幕驱动文件刚好与开发板LCD驱动文件一致&#xff0c…

基于 Spring Boot 博客系统开发(六)

基于 Spring Boot 博客系统开发&#xff08;六&#xff09; 本系统是简易的个人博客系统开发&#xff0c;为了更加熟练地掌握 SprIng Boot 框架及相关技术的使用。&#x1f33f;&#x1f33f;&#x1f33f; 基于 Spring Boot 博客系统开发&#xff08;五&#xff09;&#x1f…

区块链媒体发布推广7个的神奇方法助你脱颖而出-华媒舍

区块链技术的发展已经掀起了一场数字革命&#xff0c;引发了全球范围内的热议。在这个充满竞争的市场中&#xff0c;如何让自己的区块链项目脱颖而出&#xff0c;吸引更多的关注和参与呢&#xff1f;下面就为大家介绍7个神奇的区块链媒体发布推广方法&#xff0c;帮助你在激烈的…

实验名称:TCP 连接管理

目录 前言 TCP报文段格式 TCP建立连接 TCP释放连接 实验目的 实验原理 实验步骤 1. 启动WireShark&#xff0c;设置抓包状态 2. 访问指定服务器 &#xff0c;通过Wireshark抓取通信数据报文 3. 分析TCP连接建立的三次握手和连接释放的四次握手过程 原始数据记录 实验…

触摸OpenNJet,云原生世界触手可及

&#x1f308;个人主页: Aileen_0v0 &#x1f525;热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​&#x1f4ab;个人格言:“没有罗马,那就自己创造罗马~” 文章目录 导言OpenNJet云原生引擎介绍云原生平台的介绍优化与创新 为什么选择OpenNJet云原生引擎如何在windo…