现在世界上最受关注的技术团队是哪一支?
Sora 团队,已经来到聚光灯中心。
不仅项目负责人评论区被挤爆,成了𝕏最火“景点” 。
当 OpenAI 出手发布 Sora 之后,给人一种降维打击的感觉 —— 效果和之前的技术相比高出了几个档次。这就难免会让人好奇,到底是什么样的人才能做出这样炸裂的工具的呢?今天我们就来盘点一下Sora背后的团队成员。
这些参与者中,已知的核心成员包括研发负责人: Tim Brooks、Bill Peebles、系统负责人: Connor Holmes 等。这些成员的信息也成为了众人关注的焦点。
重点来介绍一下Sora的几位主要负责人,包括 Tim 和 Bill 在内,Sora 的主要负责人一共有三名(以下排名不分先后)
Sora的总负责人Tim Brooks,博士毕业于 UC Berkeley 的「伯克利人工智能研究所」BAIR,导师为 Alyosha Efros。
Tim 本科就读于卡内基梅隆大学,主修逻辑与计算,辅修计算机科学,其间在 Facebook 软件工程部门实习了四个月。
2017 年,本科毕业的 Tim 先到 Google 工作了近两年,在 Pixel 手机部门中研究 AI 相机,之后到了伯克利 AI 实验室攻读博士。
在伯克利读博期间,Tim 的主要研究方向就是图片与视频生成,他还在英伟达实习并主导了一项关于视频生成的研究。
回到校园后,Tim 与导师 Alexei Efros 教授和同组博士后 Aleksander Holynski(现在谷歌)一起研制了 AI 图片编辑工具 InstructPix2Pix,并入选 CVPR 2023 Highlight。
Tim在X上的社交帐号上发布了Sora的视频,评论区也是热潮不断,彻底的引爆了24年初的话题
23年1月,Tim 顺利毕业并取得了博士学位,加入了 OpenAI,并且参与了 DALL-E 3 的工作
除了业务能力在线之外,Tim 还是个多才多艺的人。
据 Tim 自己介绍,他还喜欢摄影和音乐,高中时他拍摄的照片获得过 National Geographic 颁发的奖项,本人到过百老汇演出,还获得过 B-box 国际奖项
而与 Tim 师出同门、的 William Peebles,也是 Sora 的另一名负责人。他在 2023 年刚刚获得博士学位,同样也是 Alyosha Efros 的学生。在本科时,Peebles 就读于麻省理工,师从 Antonio Torralba。
Bill 主修计算机科学,参加了 GAN 和 text2video 的研究,还在英伟达深度学习与自动驾驶团队实习,研究计算机视觉。 其发表的论文《Scalable diffusion models with transformers》,入选了计算机视觉顶会 ICCV 2023。这篇论文提出了一种基于 transformer 架构的新型扩散模型即 DiT。在该研究中,研究者训练了潜在扩散模型,用对潜在 patch 进行操作的 Transformer 替换常用的 U-Net 主干网络。他们通过以 Gflops 衡量的前向传递复杂度来分析扩散 Transformer (DiT) 的可扩展性。
论文链接:https://arxiv.org/abs/2212.09748
Bill在X上的社交帐号同样也是赞声一片,大家对Sora这款大模型都抱有着巨大的期待,目前Sora还没有正式的发布,预计可能在四月中旬左右发布,目前据说只有1000个内测名额,且获取资格的要求非常严格,并且用Sora制作的视频不能够外传,现在我们只需要静静地等待它正式发布
Connor Holmes,他是Sora的系统负责人,毕业于科罗拉多矿业大学,电气电子工程学士、高性能计算博士,他在微软工作时以外援形式参与了 DALL・E 3 的推理优化工作,后来直接加入 了OpenAI 。
目前Sora 团队的不少成员都是 DALL-E 3 的作者,包括两位华人 Li Jing 和 Yufei Guo。
Li Jing 是 DALL-E 3 的共同一作,2014 年本科毕业于北京大学物理系,2019 年获得 MIT 物理学博士学位。在 Meta 做了 2 年多博士后之后,Li Jing 于 2022 年加入 OpenAI。
华人作者中还有 Ricky Wang,今年一月刚刚从 Meta / Instagram 跳槽到 OpenAI,另外两位 Yufei Guo、Clarence Ng 没有太多公开资料。
从团队的组建情况和研究基础来看,Sora 应该是 OpenAI短期内的研究成果,毕竟是在Dell-3的基础上展开的研究,并非网传Sora历经了至少一年的的研究。
从ChatGPT到文生图,再到文生视频,那下一个又会是什么呢?
后续
Sora目前还未正式对外上线,后续估计先在GPT Plus覆盖,后续sora 肯定和 文生图一样先给 PLUS 用户使用,所以可以预计未来开放后,很多人需要开Plus 才能去体验 sora。
相关文章传送门:
ChatGPT学习指南 http://fangze666.com/