国内估值最高的大模型公司,“国产大模型五虎”系列之——智谱AI

前言:

上次我们介绍了同为“国产大模型五虎”的MiniMax,今天就继续来盘点一下国内估值最高的大模型企业智谱AI,同时也是五虎中的另外一虎。

“国产大模型五虎”指的是由阿里投资的五家大模型独角兽:智谱 AI、百川智能、月之暗面、零一万物和Minimax(排名不分先后)


智谱AI:智谱AI开放平台 (aminer.cn)

我们先来简单的介绍一下智谱AI是一家什么样的大模型企业

智谱AI是一家源自清华大学计算机系技术成果的高科技公司

由张鹏作为CEO领军,核心成员多为清华大学等顶尖学府的学者

自2019年成立以来,一直致力于在认知智能领域拓宽人工智能技术的边界

公司的核心愿景是实现让机器具备类似人类的思考方式,向AGI的方向发展。

再来回顾一下智谱AI的发展时间线

2019年,依托清华大学的知识工程实验室,致力于端侧大模型技术,成立了智谱AI

2020年,智谱AI开始研发GLM预训练架构,并训练了百亿参数模型GLM-10B

2021年,公司利用MoE架构成功训练出万亿稀疏模型

2023年10月,完成超25亿元人民币融资,成为国内估值最高的大模型公司,超100亿人民币

目前,智谱AI的核心技术为端侧大模型

ChatGLM系列大模型基于GLM预训练架构,具备高性能、低延迟的特性,包括多个不同规模的版本,早起的产品有ChatGLM-6B、ChatGLM-10B等,截止到目前已经迭代了三款旗舰大模型,分别为:

ChatGLM2(2023年6月

ChatGLM3(2023年10月

GLM-4(2024年1月16日

在中文能力的方面,GLM-4可以比肩ChatGPT-4。该模型在多个英文数据集上达到了GPT-4的90%至100%的水平,在中文对齐能力上甚至整体超过了GPT-4。

GLM-4可以支持128k的上下文窗口长度,单次提示词可以处理的文本长度相当于300页

且在“大海捞针”测试中,GLM-4模型在128K文本长度内能够实现几乎100%的精度召回

并且ChatGLM系列大模型集成了自研的AgentTuning技术,能够通过训练和调整模型,使其更好地适应特定任务的需求

另外,智谱AI还开发了文生图的大模型CogView

CogView模型采用了Transformer+VQVAE架构,这种架构的优势在于它能够同时学习模态间和模态内的多种关联性,从而提升图像与文本之间跨模态语义匹配的效果

其在MS COCO数据集上的表现超过了OpenAI的DALL·E

值得一提的是,CogView的代码已经在GitHub上开源了

目前,智谱AI开放了通用大模型等诸多主流大模型接口


下面我们就简单的从几个方面来测试一下他们最新的模型GLM-4,结果仅供参考哈

我问了一个这两天网上流行的新梗“成都迪士尼”,结果与实际内容相差不二


再试一下数学计算能力

显而易见,在数学计算能力这块,还是答错了,不过数学计算能力一直是大模型需要攻克的难题,强如Claude3也会在这种问题上出错


继续让它帮我们写一篇题为:大模型浪潮来袭,普通人应如何把握机会的文章 

这里我的要求是不分点,不少于800字,看看效果如何

通篇读下来,感觉中规中矩,顺序词用的太多了,且“此外”,“总之”重复出现,但是字数的要求达到了,整篇内容大约九百多字


总之,智谱AI作为国内估值最高的大模型公司,产品有自身的独特之处,研发了自主的大模型创新技术,单就这一点,就能够使其在众多的大模型公司中脱颖而出。实际的效果到底怎么样,还是需要大家自己体验才尚可得知。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/598202.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能大模型+智能算力,企商在线以新质生产力赋能数字化转型

2024 年3月28 日,由中国互联网协会主办、中国信通院泰尔终端实验室特别支持的 2024 高质量数字化转型创新发展大会暨铸基计划年度会议在京召开。作为新质生产力代表性企业、数算融合领导企业,企商在线受邀出席大会主论坛圆桌对话,与行业专家共…

C++初级----string类(STL)

1、标准库中的string 1.1、sring介绍 字符串是表示字符序列的类,标准的字符串类提供了对此类对象的支,其接口类似于标准字符容器的接口,但是添加了专门用于操作的单字节字符字符串的设计特性。 string类是使用char,即作为他的字符…

【蓝桥杯嵌入式】12届程序题刷题记录及反思

一、题目解析 按键短按LCD显示两个界面LED指示灯PWM脉冲输出 二、led控制 控制两个led灯&#xff0c;两种状态 //led void led_set(uint8_t led_dis) {HAL_GPIO_WritePin(GPIOC,GPIO_PIN_All,GPIO_PIN_SET);HAL_GPIO_WritePin(GPIOC,led_dis << 8,GPIO_PIN_RESET);HAL…

高度不同的流体瀑布css实现方法

商城商品列表 实现瀑布流展示&#xff0c;通过flex或grid实现会导致每行中的列高度一致&#xff0c;无法达到错落有致的感觉&#xff1b; 为此需要用到&#xff1a; CSS columns 属性 columns 属性是一个简写属性&#xff0c;用于设置列宽和列数。 CSS 语法 columns: column-wi…

一些增强生产力的 AI 工具

engshell 支持自然语言交互的 shell engshell 是一个适用于任何操作系统的英语 shell&#xff0c;由 LLM 提供自然语言交互支持 Paints Chainer 漫画线稿上色 AI Paints Chainer 是一款用于为漫画上色的工具&#xff0c;只需上传一张黑白线稿&#xff0c;点击按钮&#xff0…

JQuery(二)---【使用JQuery对HTML、CSS进行操作】

零.前言 JQuery(一)---【JQuery简介、安装、初步使用、各种事件】-CSDN博客 一.使用JQuery对HTML操作 1.1获取元素内容、属性 使用JQ可以操作元素的“内容” text()&#xff1a;设置或返回元素的文本内容html()&#xff1a;设置或返回元素的内容(包括HTML标记)val()&#…

Leetcode 102. 二叉树的层序遍历

注意的点&#xff1a; 1、队列注意用popleft 2、注意用len(queue)控制层数 # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, leftNone, rightNone): # self.val val # self.left left # self.right righ…

Redis 的主从复制、哨兵和cluster集群

目录 一. Redis 主从复制 1. 介绍 2. 作用 3. 流程 4. 搭建 Redis 主从复制 安装redis 修改 master 的Redis配置文件 修改 slave 的Redis配置文件 验证主从效果 二. Redis 哨兵模式 1. 介绍 2. 原理 3. 哨兵模式的作用 4. 工作流程 4.1 故障转移机制 4.2 主节…

vscode-插件开发-hello world-创建初始模板

目录 前言1.环境配置全局安装 yo, generator-code 2. 新建一个插件项目模板问题1: F5 按键无法启动launch.json调试(解决)问题1 描述:问题1: 找错误问题1: 可行的解决方案 3. 开发插件(添加自定义功能) 参考vscode官方示例&#xff1a;如何创建你的第一个插件开发项目模板的步骤…

Leetcode刷题-哈希表详细总结(Java)

哈希表 当我们想使⽤哈希法来解决问题的时候&#xff0c;我们⼀般会选择如下三种数据结构。 数组set &#xff08;集合&#xff09;map&#xff08;映射&#xff09; 当我们遇到了要快速判断⼀个元素是否出现集合⾥的时候&#xff0c;就要考虑哈希法。如果在做⾯试题⽬的时候…

SpringCloud学习(11)-SpringCloudAlibaba-Nacos数据模型

一、Nacos数据模型 1.1、数据模型 对于Nacos配置管理&#xff0c;通过Namespace、Group、Date ID能够定位到一个配置集。Nacos数据模型如下所示&#xff1a; 1.2、命名空间(Namespace) 可用于进行不同环境的配置隔离。例如&#xff1a; 1)、可以隔离开发环境——测试环境和…

【Linux】进程学习① (进程的PCB(task_struct)进程的标识符详解进程的创建fork函数)

目录 ​编辑 1.进程的概念 1.1进程的描述与组织&#xff1a;进程的PCB 进程&#xff1a;进程是 内核pcb对象可执行程序/内核数据结构可执行程序进程 1.3 task_struct 2.PCB内部属性 3 查看进程 4.获取进程标识符&#xff1a;getpid函数&#xff08;4-6主要围绕进程的标识符展开…