ChatGLM 实践赛之学术工具创意开发丨智谱 AI × 和鲸科技

2022 年底以来,LLM 大规模语言模型备受瞩目。今年 3 月中旬,智谱 AI 与清华大学强强联合,重磅发布了 ChatGLM-6B 开源模型。截止 6 月 24 日,该模型的下载量超过三百万人次,并在 Hugging Face(HF)全球大模型下载排行榜中连续十二天位居第一,性能优异且极具影响力

大模型应被广泛应用于各行各业、推动各领域发展。为最大化利用 ChatGLM-6B 助力学术、科研应用工具的开发工作,智谱 AI 与和鲸科技联合国内最具影响力的学术平台 AMiner,推出本次「ChatGLM 实践大赛 · 学术应用篇」(下简称“大赛”)。大赛也得到了 Hugging Face、揽睿星舟与亚马逊云科技的大力支持。

​大赛共计三个场景、七个赛道,分别为:论文阅读场景,包含论文学科分类、问答式科研知识库、论文综述和对比分析三个赛道;投稿审核场景,包含投稿期刊会议推荐、审稿回复两个赛道;论文发现场景,包含论文检索、论文推荐和科技情报生成两个赛道——均考验参赛者如何通过微调 ChatGLM-6B 开源模型形成应用型学术工具。

作为国内首个大规模语言模型应用赛,自 5 月 8 日上线以来,获得了广泛关注。截至 6 月 16 日,已有来自北京、河南、上海、广东等全国各地的总计 1647 名 LLM 爱好者结成 1551 支参赛队伍于和鲸社区赛事平台参与报名。参赛选手中有来自百度、阿里、北大方正的产品经理、算法工程师,也有来自清华、北大、复旦、上交、浙大的教师及学生。

大赛进程中,和鲸全力为各参赛选手提供支持。ChatGLM 等 LLM 拥有巨幅的模型规模,参数量庞大,需要极高的计算、存储空间,和鲸发放数十张 V100 GPU,解决选手在大模型训练过程中的算力问题

在参赛指导方面,和鲸联合智谱 AI 成功举办两场直播培训,这也是智谱 AI 首次于公开场合针对 ChatGLM 开展培训:首场直播讲解赛题、教授大模型微调,第二场则讲解 ChatGLM + LangChain 的原理及实践,线上会议室场均人数 500+,参与度极高。此外,和鲸在社区赛事页与参赛社群内分赛道为选手提供详尽的参赛指南、赛题指导文件,提升选手参赛体验,社群内学习氛围浓厚。

截至 6 月 16 日,和鲸社区共收到 348 份来自大模型研发爱好者们的参赛作品。

​赛道二 478 位参赛者成功提交 162 份参赛作品

评审阶段,由于 ChatGLM 作为一种生成模型,应从文本质量、相关性、多样性及创新性等多角度评估其质量,因此传统的分类、回归等客观指标无法适用于 LLM 大赛;另一方面,若对大模型文件直接进行人工、主观评估,又会出现复杂的环境配置问题,无法在短期内高效完成评审——综上,本次大赛在评审环节还是存在相当大的挑战。

针对评审的复杂性,和鲸协助智谱 AI 采用自动化 + 轻量人工的形式评估选手的参赛成果:选手上传已完成训练的推理模型,并将模型文件部署为模型服务后,通过线上数据调试验证模型可用性,同时在完成调试后提交最终跑出的模型结果;自动化模型评审针对模型服务的客观性能实时出分,随后的真人评委仅需查看参赛者模型运行的最终产物——两者结合不仅相对公平,同时也大幅提升评审效率。

评审进行过程中,和鲸发现,经选手微调后的 ChatGLM-6B 远超预期:

在问答式科研知识库赛道,有队伍提交的参赛模型不仅能够完成赛道基本任务,并且也在推理能力层面得到了大幅优化。作为 6B 量级的模型,清华官方 GitHub 明确指出 ChatGLM-6B 因参数量较小,在推理能力等方面存在很大不足。而该参赛队伍提交的模型不但能够完成推理、返回知识问答的结果,同时也能够返回生成问答结果的依据,且经过测试可以发现,该“依据”与“结果”间确实存在较强关联——有力约束了大模型应用场景下“不懂装懂”、“答非所问”的幻觉(Hallucination)现象。从以上层面来看,该参赛作品的表现完全能够媲美一些参数量较大的 LLM。

在审稿回复赛道,经部分队伍微调后的 ChatGLM-6B 已能输出一些 openreview 的官方审稿样式——模型跑出的结果不单单是能与待审稿文章高度相关,同时也被部分学术领域专家认定为具备基本的审稿能力与一定的专业度。

7 月 7 日,智谱 AI 在 2023 全球数字经济大会闭幕式上为优秀参赛队伍颁发奖项。按照赛道区分难度等级分别颁奖,共计六支参赛队伍获得 ChatGLM 官方认证的优秀证书、价值 2000-5000 元人民币不等的 ChatGLM API 支持及价值 2000-5000 元人民币不等的 GPU 云计算资源。

「ChatGLM 实践大赛 · 学术应用篇」是国内早期的 LLM 应用赛,吸引了数千余人的参与。主办方智谱 AI 更是国内顶级的人工智能科技公司,在全球范围内百亿至千亿参数级大模型领域都有极高的行业地位。和鲸科技十分荣幸能够与智谱 AI 共同承办本赛事,为有意向投身 LLM 大规模语言模型研发的开拓者们提供优质的实践环境。

通过此次大赛,我们可以发现,ChatGLM-6B 开源模型在学术、科研领域、都能发挥比较大的作用,模型使用者能够真正将其在文本识别、总结、预测、生成方面的能力应用于实际,大幅提升科研工作流的效率。而近日升级版 ChatGLM2-6B 已全新发布,在保留了初代模型对话流畅、部署门槛较低等基础之上,引入了更强大的性能、更长的上下文、更高效的推理、更开放的协议等诸多特性。和鲸科技基于旗下和鲸社区约 50 万+的人才储备ModelWhale 数据科学协同平台的强大算力调度管理 ModelOps 理念聚焦大模型全生命周期管理等优势,期待与智谱 AI 在大模型领域共同营造更优质的开发者生态,进一步挖掘 ChatGLM 系列大模型的潜力,推动大模型的应用落地。

未来,和鲸ModelWhale平台也将持续优化,从推理测试、微调训练、应用开发、服务部署的全流程帮助使用者提升研发效率,降低使用门槛,为具有更大参数量的 LLM 提供平台级支撑,同时始终关注中小模型 ModelOps 产品能力的提升,与更多模型领域的开拓者同行!

赛事承办、工具使用,任何相关需求,都欢迎您点击【联系产品顾问(移动端跳转)】与我们展开交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/18754.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

003.PADS VX2.4选项设置及显示颜色设置

文章目录 一、PADS颜色设置及选项设置二、选项设置1.全局2.设计3.栅格和捕获4.显示5.布线选项页6.覆铜平面选项页7.文本和线选项页8.文本和线选项页9.过孔样式选项页 一、PADS颜色设置及选项设置 一、颜色设置 1.点击设置—显示颜色)(快捷键…

操作系统——输入输出IO管理

文章目录 **1 I/O管理概述****1.1 I/O设备****1.2 I/O控制方式****1.2.1 程序直接控制方式****1.2.2 中断驱动方式****1.2.3 DMA方式****1.2.4 通道控制方式** **1.3 I/O软件层次结构****1.4 应用程序I/O接口** **2 设备独立性软件****2.1 高速缓冲与缓冲区****2.2 设备分配和回…

MySQL基础篇第7章(单行函数)

文章目录 1、函数的理解1.1 什么是函数1.2 不同DBMS函数的差异1.3 MySQL的内置函数分类 2、数值函数2.1 基本函数2.2 角度与弧度互转函数2.3 三角函数2.4 指数和对数2.5 进制间的转换 3、字符串函数4、日期和时间函数4.1 获取日期、时间4.2 日期与时间戳的转换4.3 获取月份、星…

【Vue2.0源码学习】模板编译篇-模板解析阶段(整体运行流程)

文章目录 1. 前言2. 什么是模板编译3. 整体渲染流程4. 模板编译内部流程4.1 抽象语法树AST4.2 具体流程 5. 小总结6. 整体流程7. 回到源码8. 总结 1. 前言 在前几篇文章中,我们介绍了Vue中的虚拟DOM以及虚拟DOM的patch(DOM-Diff)过程,而虚拟DOM存在的必…

Matrix Breakout:2 Morpheus(靶机详细渗透测试过程记录)

nmap -sS -p 80 -oG - 192.168.192.0/24 | grep open 探测网段下开放80端口的主机。 扫描目录 发现该界面 存储型xss 发现file参数貌似可以控制读取文件目标。 尝试利用伪协议读取&#xff0c;文件内容。 解码&#xff0c;分析源代码&#xff1a; <?php$file"graff…

Python基础综合案例-数据可视化(柱状图)

今天给大家带来的是Python综合实战开发的数据可视化操作 通过python实现对数据的分析、可视化 数据来源:线上公布数据&#xff0c;需要可私信 前期准备工作&#xff1a;Python可视化准备工作 前期模块安装等前期基础的准备工作大家可以看我之前的文章讲解&#xff0c;有问题可…

双向复制粘贴半监督医学图像分割

文章目录 Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation摘要本文方法实验结果 Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation 摘要 在半监督医学图像分割中&#xff0c;存在标记数据与未标记数据分布不匹配的问题。…

Qt/C++音视频开发46-音视频同步保存到MP4

一、前言 用ffmpeg单独做视频保存不难&#xff0c;单独做音频保存也不难&#xff0c;难的是音视频同步保存到MP4中&#xff0c;重点是音视频要同步&#xff0c;其实这也不难&#xff0c;只要播放那边音视频同步后的数据&#xff0c;写入到文件即可。最难的是在播放过程中不断随…

使用 Docker 在 Windows、Mac 和 Linux 系统轻松部署 PostgreSQL 数据库

&#x1f337;&#x1f341; 博主 libin9iOak带您 Go to New World.✨&#x1f341; &#x1f984; 个人主页——libin9iOak的博客&#x1f390; &#x1f433; 《面试题大全》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33…

数据库基础知识

在介绍数据库基础知识前先推荐大伙关注下博主开的拼多多小店:NICE时尚潮流男装。客服找我输入CSDN送10元无门槛抵用券&#xff0c;有任何技术问题也可以来店里找我&#xff0c;必回&#xff01; 店铺链接 https://mobile.yangkeduo.com/mall_page.html?_x_org2&refer_sh…

Redis实战案例15-基于Redis实现分布式锁

1. 初级版本 注意自动拆箱时的空指针异常 public class SimpleRedisLock implements ILock{private StringRedisTemplate stringRedisTemplate;private String lockName;private static final String KEY_PREFIX "lock:";public SimpleRedisLock(StringRedisTemplat…

设计模式——代理模式

代理模式&#xff08;静态代理&#xff09; 普通代理模式的核心就是&#xff0c;被代理对象和代理对象&#xff08;共属一个接口&#xff09;&#xff0c;被代理对象要执行的操作由代理对象完成&#xff08;此时被代理者需要手动new出来&#xff0c;再传递给代理者&#xff09…