1 概述:零一万物 - 首款开源中英双语大模型
公司背景
- 公司名称:零一万物(01.AI)
- 创始人:李开复博士(知名投资人、创新工场董事长兼CEO)
产品介绍
- 产品名称:Yi 系列大模型
- Yi-6B:数据参数量为60亿的双语(英文/中文)开源模型
- Yi-34B:数据参数量为340亿的双语(英文/中文)开源模型,全球多项评测基准中领先
Yi-34B 模型亮点
- 全球领先:在多项评测中取得SOTA(国际最佳性能)指标,英文和中文权威排行榜榜首
- 成本效益:基于超强Infra下模型训练成本实测下降40%,模拟千亿规模训练成本可下降多达50%
- 超长上下文:支持200K超上下文窗口,能够处理大约40万汉字的超文本输入
- 功能丰富:支持通用聊天、问答、对话、写作、翻译等功能
官方资源
- Github开源地址:
- https://github.com/01-ai/Yi
- 项目地址:
- https://www.lingyiwanwu.com/
- 免费试用:
- Hugging Face
- ModelScope
论文与API
- 论文地址:https://arxiv.org/abs/2403.04652
- API开放平台:https://platform.lingyiwanwu.com/
模型特性
- Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能
- Yi-34B-Chat-200K:超长上下文版本,适合多篇文档内容理解、海量数据分析挖掘和跨领域知识融合
- Yi-VL-Plus:多模态模型,支持文本、视觉多模态输入,中文图表体验超过GPT-4V
应用场景
- 专业书籍翻译:如《机器学习工程》电子书,一天内完成264页翻译
- 金融分析:快速阅读报告并预测市场趋势
- 法律解读:精准解读法律条文
- 科研辅助:高效提取论文要点
技术优势
- 全球领跑:在MMLU等评测中取得多项SOTA性能指标
- 模型尺寸轻巧:以更小模型尺寸评测超越大尺寸开源模型
- 满足多元需求:Yi-6B适合个人及研究用途,Yi-34B适合多元场景
- 免费商业授权:对学术研究完全开放,同步开放申请免费商业授权
用户体验
- 超长上下文:提升模型理解深度,适合长篇文本处理
- 多模态能力:支持图片、表格、图表等识别与理解,中文体验超过GPT-4V
部署与启动
- 一键启动包:无需配置Python环境,简单点击即可启动
- 步骤:
- 下载压缩包并解压
- 根据显卡类型选择启动软件(NVIDIA、CPU、AMD)
- 点击Launch按钮并选择模型文件启动
- 在浏览器中访问 http://localhost:5001/ 免费使用
X 参考文献
- 零一万物 – 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~ - 山鲸AI