GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?

AI 绘画、机器翻译、多轮对话……对于各类 AI 相关的功能来说,总有一个痛点,困扰着所有训模型的算法工程师们:

想要效果更好,那么 AI 模型一般都很大,耗费的算力更多不说,运行起来还更费时间;

如果希望模型小、运行快,那么效果通常不如前者好。

这就像天平的两端,算法工程师们常常需要根据不同场景和限定条件,在跑得快和效果好之间取得一个平衡。

因此,如果有一项技术可以在两者之间做好平衡,那么,它大概率会成为对业界有贡献的重要技术。

LightSeq 就是这样一项技术。

具体来说,LightSeq 是一个模型训练推理引擎,就像一个炼丹炉,Transformer/GPT/BERT 这种以体积大、效果好、但运行更耗时的 AI 模型都可以扔进去炼一炼,帮助它们提速。

而且 LightSeq 不仅可以在模型训练环节提速,让开发者更便捷的使用;也可以在推理环节提升运行速度,让各类 AI 模型更快地产出效果,降低 AI 翻译、AI 生成文字等任务的耗时,更好地服务用户。

自 2019 年开源以来,LightSeq 受到了很多机器学习从业者的欢迎,在 GitHub 上已经收获了超过 2800 颗星。

在做 LightSeq 之前,一个关于模型运行速度的问题一直让 ByteDance Research 团队的王辉感到困扰:

2019 年,机器翻译行业出现了一轮技术迭代,大家正在由 LSTM 模型切换到更新的 Transformer 模型,以实现更好的翻译效果。

但是,当时效果最好的 Transformer 翻译一句话,要耗费长达 1 秒钟的时间,这将大大影响用户体验。

于是王辉拉着几位同学,开始研究 GPU 模型加速,从头进行 CUDA 编程,开始了 LightSeq 的研发过程。

在学习了大量的底层技术知识、进行了不少优化研发后,LightSeq 第一版问世了。他们首先在字节跳动的火山翻译业务上运用,果然取得了不错的效果,翻译速度大大提升。

2019 年底,LightSeq 研发团队将它回馈给了开源社区,并持续保持版本迭代,帮助其他开发者一起提效。

开源成果受到欢迎,LightSeq 论文也同时获得了学术界的认可。

LightSeq 的推理引擎论文中选了 NLP 领域顶会 NAACL 2021。

第二年 LightSeq 的训练系统论文也被超算领域国际顶会 SC22 接收。

王辉最近还在北京大学软件和微电子学院开设了一个学期的研究生课程,专门给北大的学生们介绍 AI 领域的进展,教他们 LightSeq 的使用方法。

获得外部认可的同时,LightSeq 研发团队也在积极将它落地在字节跳动的 NLP 业务场景。除了机器翻译,例如广告文案生成、电商内容理解也能借助 LightSeq 大规模提升模型训练和推理的速度。

团队甚至还将 LightSeq 部署在了移动端,即使你的手机没连网,也能仅使用手机 CPU 的算力实现 AI 自动翻译。

他们还为此写了一篇论文《MobileNMT: Enabling Translation in 15MB and 30ms》,这篇论文也已经中选了自然语言处理顶会 ACL 2023 的 Industry Track。

LightSeq 团队希望不断追逐最前沿的技术,让技术回馈业界,用创新服务用户。来听听他们是如何探索新技术的吧。

GitHub 2800颗星,字节跳动这个开源项目是怎么做出来的?

最后,照例给大家送上 LightSeq 项目相关地址,欢迎各位开发者一起探索~

GitHub:

https://github.com/bytedance/lightseq

LightSeq 论文:

https://arxiv.org/abs/2010.13887

LightSeq2 论文:

https://arxiv.org/abs/2110.05722

MobileNMT 论文:

https://arxiv.org/abs/2306.04235

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/2519.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

word文档批量生成工具(附免费软件)(按Excel表格内容自动替换内容生成文档)

批量生成word文档是让人无比厌恶但有时又不得不做的事情。比如学校要给拟录取的学生发通知书,就可能需要批量生成一批只有“姓名”、“学院”和“专业”不同,其他内容都相同的word文档以供打印(事实上直接生成pdf是更好的选择,这个…

超详细Redis入门教程——Redis分布式系统

前言 本文小新为大家带来 Redis分布式系统 相关知识,具体内容包括数据分区算法(包括:顺序分区,哈希分区),系统搭建与运行(包括:系统搭建,系统启动与关闭)&…

初学mybatis(七)缓存

学习回顾:初学mybatis(六) 一、简介 1、什么是缓存 [ Cache ]? 存在内存中的临时数据。将用户经常查询的数据放在缓存(内存)中,用户去查询数据就不用从磁盘上(关系型数据库数据文件)查询&#x…

赛效:如何将PDF文件分割成单页的PDF文档

1:打开wdashi点击PDF处理菜单里的“PDF分割”。 2:将本地PDF文件添加上去,在下方选择转换页码,在这里我们选择转换每一页。 3:点击右下角“开始转换”。 4:转换好后,点击绿色下载按钮将分割好的…

Generative Adversarial Network(生成对抗网络)

目录 Generative Adversarial Network(生成对抗网络) Basic Idea of GAN GAN as structured learning Can Generator learn by itself Can Discriminator generate Theory behind GAN Conditional GAN Generative Adversarial Network(…

【SpringMVC】| 报文信息转换器HttpMessageConverter

目录 框架搭建 报文信息转换器HttpMessageConverter 1. RequestBody注解 2. RequestEntity类型 3. RequestBody注解(常用) 重点:SpringMVC处理json 重点:SpringMVC处理ajax 重点:RestController注解 4. Respo…

Redis入门(4)-list

redis中list数据会按照插入顺序进行排序,其底层是一个无头结点的双向链表,因此表头和表尾的操作性能较高,但中间元素操作性能较差。 1.lpush key element [element ] 从表头插入元素 lpush nosql redis hbase lpush nosql mongdb2.lrange…

项目计划、进度与控制

思维导图 项目计划、进度与控制-思维导图 第一部分 项目管理概述 什么是项目 约瑟夫朱兰博士也说过,项目就是在已经确定好的时间内必须解决的问题 什么是项目管理 图1-1 项目管理就是工具、人和系统 image.png 组织是人的集合,过程是人在处理。如果人…

基于PaddleDetection fairmot目标跟踪 C++ 部署

1 源码下载 PaddleDetection 2 工程编译 参考:paddle 目标检测C部署流程 3 导出模型 python tools/export_model.py -c configs/mot/fairmot/fairmot_dla34_30e_576x320.yml --output_dir ./inference -o weightshttps://paddledet.bj.bcebos.com/models/mot/…

浅谈 Android Tombstone(墓碑日志)分析步骤 - 02

tomestone 日志: *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** Build fingerprint: qti/trinket/trinket:11/RKQ1.211119.001/37:user/test-keys Revision: 0 ABI: arm Timestamp: 2023-06-19 23:47:310800 pid: 742, tid: 32482, name: CAM_M…

联想小新Pro16怎么重装Win10系统?联想小新Pro16重装系统Win10教程

如果您是联想小新Pro16的用户,并且想要重装Win10系统,那么您来对地方了,无论是出于系统崩溃、性能下降还是个人需求改变的原因,重新安装操作系统可以帮助您恢复电脑的正常运行和提升使用体验。以下小编将为您分享联想小新Pro16重装…

10 月发布,Ubuntu 23.10 已升级到 Linux Kernel 6.3 内核

导读Canonical 于近日宣布,代号为 Mantic Minotaur 的 Ubuntu 23.10 发行版本已升级基于 Linux Kernel 6.3 内核。 Canonical宣布,代号为 Mantic Minotaur 的 Ubuntu 23.10 发行版本已升级基于 Linux Kernel 6.3 内核。 Ubuntu 23.10 于今年 4 月下旬进入…