[NLP/AIGC] 大语言模型:零一万物

news/2024/11/16 13:24:17/文章来源:https://www.cnblogs.com/johnnyzen/p/18411265

1 概述:零一万物 - 首款开源中英双语大模型

公司背景

  • 公司名称:零一万物(01.AI)
  • 创始人:李开复博士(知名投资人、创新工场董事长兼CEO)

产品介绍

  • 产品名称:Yi 系列大模型
    • Yi-6B:数据参数量为60亿的双语(英文/中文)开源模型
    • Yi-34B:数据参数量为340亿的双语(英文/中文)开源模型,全球多项评测基准中领先

Yi-34B 模型亮点

  • 全球领先:在多项评测中取得SOTA(国际最佳性能)指标,英文和中文权威排行榜榜首
  • 成本效益:基于超强Infra下模型训练成本实测下降40%,模拟千亿规模训练成本可下降多达50%
  • 超长上下文:支持200K超上下文窗口,能够处理大约40万汉字的超文本输入
  • 功能丰富:支持通用聊天、问答、对话、写作、翻译等功能

官方资源

  • Github开源地址
  • https://github.com/01-ai/Yi
  • 项目地址
  • https://www.lingyiwanwu.com/
  • 免费试用
  • Hugging Face
  • ModelScope

论文与API

  • 论文地址:https://arxiv.org/abs/2403.04652
  • API开放平台:https://platform.lingyiwanwu.com/

模型特性

  • Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能
  • Yi-34B-Chat-200K:超长上下文版本,适合多篇文档内容理解、海量数据分析挖掘和跨领域知识融合
  • Yi-VL-Plus:多模态模型,支持文本、视觉多模态输入,中文图表体验超过GPT-4V

应用场景

  • 专业书籍翻译:如《机器学习工程》电子书,一天内完成264页翻译
  • 金融分析:快速阅读报告并预测市场趋势
  • 法律解读:精准解读法律条文
  • 科研辅助:高效提取论文要点

技术优势

  • 全球领跑:在MMLU等评测中取得多项SOTA性能指标
  • 模型尺寸轻巧:以更小模型尺寸评测超越大尺寸开源模型
  • 满足多元需求:Yi-6B适合个人及研究用途,Yi-34B适合多元场景
  • 免费商业授权:对学术研究完全开放,同步开放申请免费商业授权

用户体验

  • 超长上下文:提升模型理解深度,适合长篇文本处理
  • 多模态能力:支持图片、表格、图表等识别与理解,中文体验超过GPT-4V

部署与启动

  • 一键启动包:无需配置Python环境,简单点击即可启动
  • 步骤
    1. 下载压缩包并解压
    2. 根据显卡类型选择启动软件(NVIDIA、CPU、AMD)
    3. 点击Launch按钮并选择模型文件启动
    4. 在浏览器中访问 http://localhost:5001/ 免费使用

X 参考文献

  • 零一万物 – 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~ - 山鲸AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/796258.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jackson 原生反序列化触发 getter 方法

jackson 原生反序列化触发 getter 方法jackson的POJONode方法可以任意调用getterjackson序列化会任意调用getter分析 jackson 序列化会调用任意 getter 方法,jackson 反序列化也会任意调用 getter ,这两个都不需要多说什么了,在前面的 jackson 反序列化中的 TemplatesImpl 链…

urllib发送get请求_中文传参问题

GET请求是HTTP协议中的一种基本方法,当需要在GET请求中传递中文参数时需要额外对中文进行编码(英文不需要),因为url中只能包含ascii字符。 可以使用urllib.parser.urlencode()或urllib.parse.quote()方法对中文转码。 详细查官方文档: https://docs.python.org/3.12/libra…

jackson 反序列化学习

jackson 反序列化学习 jackson 介绍 Jackson 是一个用于处理 JSON 数据的开源 Java 库。Spring MVC 的默认 json 解析器便是 Jackson。 Jackson 优点很多。 Jackson 所依赖的 jar 包较少,简单易用。与其他 Java 的 json 的框架 Gson 等相比, Jackson 解析大的 json 文件速度比…

LeetCode算法—递归

纵有疾风起;人生不言弃!一:递归 1、定义:函数直接或者间接的调用自己 2、四个要素 (1)接受的参数 (2)返回的值 (3)终止条件 (4)如何拆解 二:LeetCode 509 斐波那契数列 def func(n):if n<2:return nelse:return func(n-1)+func(n-2)n=int(input()) print(func(…

2024年9月最新Youtube转WAV高质量音频最新教程

​1.利用在线转换工具(最推荐的一种方式): YoutubeToWAV:打开浏览器,访问 https://www.youtubetowav.cc/的官方网站。在 YouTube 网站上找到您想要转换的视频,复制该视频的链接。回到网页,将复制的 YouTube 视频链接粘贴到指定的输入框中。点击Convert默认为audio标签的格…

[GDOUCTF 2023]ez_ze!

这题是一个jinja2的ssti模板注入,经过测试过滤了 _ {{}} . [] os popen getitem 输入{% print(lipsum|string|list) %}或者{% print(config|string|list) %}从这里面获取我们需要的字符 获取下划线和空格 {% set pop=dict(pop=1)|join %} {% set xia=(lipsum|string|list)|at…

dc-4

靶机下载地址:dc-4 找靶机 nmap -sV 192.168.6.0/24查看一下端口服务很明显就只是一个简单的登录框 我们爆破一下 最终得到用户名:admin 密码:happy 进去看看怎么个事很明显是一个选择既定的命令进行命令执行 我们可以抓包然后即可使用我们自己设计的命令直接拿shell然后再实现…

java方法:什么是方法?

java方法是语句的集合,它们在一起执行一个功能:方法是解决一类问题的步骤的有序组合 方法包含于类或对象中 方法在程序中被创建,在其他地方被引用 例如:即 ______()是方法 设计方法的原则:方法的本意时功能块,就是实现某个功能块,就是实现某个功能的语句块的集合,所以…

pediatrics_llm_qa:儿科问诊小模型

项目简介 本项目开源了基于儿科医疗指令微调的问诊模型:pediatrics_llm_qa(GitHub - jiangnanboy/pediatrics_llm_qa),目前模型的主要功能如下:智能问诊:问诊后给出诊断结果和建议。更新[2024/09/11] 开源了基于Qwen2-1.5B-instruct lora指令微调的儿科问诊模型开源模型模型…

WPF 已知问题 包含 NaN 的 Geometry 几何可能导致渲染层抛出 UCEERR_RENDERTHREADFAILURE 异常

本文记录一个 WPF 已知问题,当传入到渲染的 Geometry 几何里面包含了 NaN 数值,将可能让应用程序收到从渲染层抛上来的 UCEERR_RENDERTHREADFAILURE 异常,且此异常缺乏必要信息,比较难定位到具体错误逻辑此问题是小伙伴报告给我的,详细请看 https://github.com/dotnet/wpf…

WPF 尝试使用 WinML 做一个简单的手写数字识别应用

最近我看了微软的 AI 训练营之后,似乎有点了解 Windows Machine Learning 和 DirectML 的概念,于是我尝试实践一下,用 WPF 写一个简单的触摸手写输入的画板,再使用大佬训练好的 mnist.onnx 模型,对接 WinML 实现一个简单的手写数字识别应用最近我看了微软的 AI 训练营之后…

VisualStudio 2022 找不到内存 反汇编 寄存器调试工具

本文将告诉大家如何解决在 VisualStudio 2022 的 调试-窗口 里面找不到内存、 反汇编、 寄存器这三个调试工具的问题找不到的原因是没有启用地址级调试 只需要在“工具”(或“调试”)>“选项”>“调试”中选择“启用地址级调试” 然后进行调试即可看到开启之后,即可在…