OpenAI 创始成员创办「AI+教育」公司;谷歌发布 Magic Insert:让人物完美融入新背景丨 RTE 开发者日报

news/2024/11/15 9:32:20/文章来源:https://www.cnblogs.com/Agora/p/18307625

 

 

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@JLT,@鲍勃

01有话题的新闻

1、Andrej Karpathy 官宣创业:是自己热爱的 AI+教育

 

Andrej Karpathy,前特斯拉 AI 高级总监和 OpenAI 创始成员,宣布创立 Eureka Labs,一家专注于人工智能与教育结合的公司。Karpathy 表示,他将致力于创建 AI 原生的新型学校,利用生成式 AI 技术提供理想化的学习体验。Eureka Labs 的首个产品是 LLM101n,一门旨在教授学生如何训练自己的 AI 模型的本科课程。这门课程将从基础的语言建模和机器学习知识开始,逐步深入到多模态、RLHF、模型部署等领域,最终目标是构建一个能够使用 AI 创作、完善和解释小故事的 Storyteller AI 大模型。

 

Karpathy 对教育的热情由来已久,从斯坦福大学的 CS231n 课程到 YouTube 教育视频,再到开源项目,他一直致力于分享知识。Eureka Labs 的成立标志着 Karpathy 将全职投身于他热爱的教育事业,为 AI 领域带来新的教育模式和资源。

 

Karpathy 的这一决定得到了业界的广泛关注和支持。谷歌首席科学家 Jeff Dean 对他的新公司表示祝福。Eureka Labs 的课程和项目已在 GitHub 上获得高度关注,LLM101n 项目自上传以来已收获 17k Star。Karpathy 希望通过 Eureka Labs 激发更多人对学习的热情,实现教育的广泛覆盖和深度。同时,他也在探索公司的商业化途径,包括付费使用和与大型 AI 模型的合作。Eureka Labs 的成立不仅是 Karpathy 个人职业生涯的一个新起点,也为 AI 教育领域带来了新的可能性和期待。(@机器之心)

 

2、苹果、英伟达陷入和博主们的 AI 数据版权之争

 

据 Wired 报道,包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意,就使用了他们视频的字幕文件来训练人工智能模型。据悉,超过 17.3 万个来自 4.8 万个频道的 YouTube 视频字幕文件被用来训练人工智能模型,其中就包括苹果、英伟达、Salesforce 等硅谷巨头。

 

据报道,下载这些字幕文件的是一个名为 EleutherAI 的非盈利组织,他们声称其目的是帮助开发者训练 AI 模型,但该数据集也被苹果等科技巨头使用。

 

苹果、英伟达和 Salesforce 等巨头曾经在他们的研究论文和帖子中提到了他们如何使用 EleutherAI 的数据集来训练 AI 模型。(@IT 之家)

 

3、谷歌发布 Magic Insert:一键拖放让人物完美融入新背景

 

Magic Insert 首使用 LoRA 和学习到的文本标记对预训练的文本到图像扩散模型进行微调,并将其与目标风格的 CLIP 表示融合。使用 Bootstrapped Domain Adaptation 技术,将特定领域的照片级真实对象插入模型适应到多样化的艺术风格领域。该方法允许在风格化程度和原始主题细节的忠实度之间进行选择,甚至可以在生成中引入更多新颖性。(@AI 科技评论)

 

4、消息称字节跳动将于本周公布 AI 模型技术进展

 

钛媒体 AGI 独家报道,字节跳动团队将在 7 月 19 日本周五首次大范围公布文生图、类 Sora 新视频等全新人工智能模型技术进展,特别会在长视频、高动态方向上提出创新技术,或将直接对标 Sora 文生视频模型。

 

有消息人士透露,字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向,还有消息称抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计也将于近期公布。

 

作为对比,另一家短视频巨头快手在 AI 视频大模型领域进展迅速,旗下有可灵视频大模型应用、可图文生图大模型等产品。快手透露,视频生成大模型可灵平台申请用户数超过 50 万,开通用户数超过 30 万,生成视频数达 700 万以上。(@爱范儿)

 

5、SmartCrawl:利用 AI 技术将任何网站数据转为 API

 

Mendable.ai 与 Firecrawl 社区联手推出 mendableai/firecrawl 的开源工具,为 AI 开发者提供了强大的网站内容处理能力。该工具能够将整个网站转换为适合大型语言模型使用的 Markdown 格式或结构化数据,通过单一 API 实现网页抓取、爬虫和数据提取功能。尽管仍处于早期开发阶段,但已经提供了多种 SDK 和与主流 AI 工具的集成支持。开发者可以使用 Python 或 Node SDK 轻松实现网站爬取、数据提取和内容搜索等功能。(@AI 科技评论)

 

6、AI 办公也疯狂,微软为 Excel 研发新 AI 模型

 

根据微软最新公布的研究论文,计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新 AI 大语言模型--SpreadsheetLLM。

 

SpreadsheetLLM 模型主要由 3 个模块组成:基于结构锚的压缩、反向索引转换和数据格式感知聚合,大大提高了电子表格表检测任务的性能,在 GPT4 情境学习设置中,比普通方法高出 25.6%;使用词元(token)成本降低了 96%,并能提供更好的处理结果。(@元力社)

02有态度的观点

1、何小鹏系统谈大模型改造智驾:造车像血海游泳,但我更有信心了

 

小鹏汽车的董事长兼 CEO 何小鹏,在访谈中分享了他对大模型技术改造汽车行业的看法,以及小鹏汽车在自动驾驶领域的进展和挑战。

 

何小鹏认为大模型技术将深刻影响汽车行业,尤其是在自动驾驶的落地应用上。他坦言,尽管目前全球还没有企业在大模型上真正盈利,但自动驾驶提供了让大模型在另一维度盈利的可能。何小鹏分享了自己的创业经历,从小鹏汽车创办到今天 10 年的感悟,包括对造车难度的描述和对未来的乐观预期。他强调了智能化在汽车销量中的重要性,并预计未来 18 个月内自动驾驶性能将有显著提升。此外,何小鹏还讨论了小鹏汽车的全球化战略、公司管理以及未来的发展规划,展现了他对小鹏汽车未来发展的信心和对汽车行业变革的深刻洞察。(@腾讯科技)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/745281.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

云屏设备整机软件升级方案

最近时间稍微空闲,整理下云屏整机设备的OTA流程及方案。之前开发时有过定义/设计,这里稍微整理总结下 整机软件有很多模块,系统及外设固件、Windows服务、Windows应用,比如系统点屏9969、摄像头固件、触摸框固件、显卡驱动、Windows一些自研服务(用于通信以及系统修复等)…

土地利用规划与城市发展:绘就未来城市的蓝图

在快速城镇化进程中,土地利用规划作为城市建设与管理的基石,其科学性与前瞻性直接影响着城市的可持续发展。本文旨在深入探讨土地利用规划如何在引导城市空间布局、优化资源配置、促进经济发展、保障社会公平及环境保护等方面发挥关键作用,进而推动城市的全面进步。 一、土地…

js 将table转成Excel

1.情景展示 如何使用js将网页中的表格转成Excel文件?2.具体分析 通过SheetJS的xlsx.js文件实现。 3.解决方案 下载地址:https://github.com/SheetJS/sheetjs/archive/refs/tags/v0.18.5.zip 打开压缩包,找到dis目录下的xlsx.full.min.js将该文件解压出来,放到项目当中。在需…

ASP.NET Core -NLog

1.安装NuGet包2.准备Nlog的配置文件 nlog.config<?xml version="1.0" encoding="utf-8" ?> <nlog xmlns="http://www.nlog-project.org/schemas/NLog.xsd"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"autoReloa…

idea中项目树中展示在java类的成员方法,变量

如图所示,点击齿轮,勾选show Members即可

购买一台云服务器,安装nvm,能够将配置全局命令链接js文件执行

全局安装@vue/cli为什么会添加命令vue linux或者MAC系统中通过which vue查看vue地址,通过进入该地址查看文件发现软链接指向真实文件,真实文件同级别下的package.json中的bin字段中的名决定了输入命令vue 2.全区安装@vue/cli时将包放在了node安装位置的node_modules下并且在包…

欢喜就好 人生短短

欢喜就好 人生短短

解决方案 | listary 双击ctrl不生效,不启动搜索工具条 (困扰了我2天,终于解决)

一、问题描述 快捷键设置是正常的,但是双击ctrl不生效,不启动搜索工具条。(其实是大屏幕不显示,我一直盯着大屏幕,没看笔记本;本方法适用于同时使用笔记本和显示器) 解决思路来源 二、解决方法只需要把接着笔记本的hdmi线路拔掉 重插,然后再重新启动listary即可正常在…

宁盾杯-哇海贼王

哇海贼王 解压,2个压缩包1张图片图片打开发现尾端异常,疑似解压密码MV9DUkNfSVNfMl9GVU5OWV82NjYjCg== 解码得 1_CRC_IS_2_FUNNY_666#使用该密码解压flag1.zip,成功得到flag.zip 根据提示使用crc暴破获取key,解密flag2.zip拼图得flagREFTQ1RGezkxY2VkZjl2N2Q5ODI4MTA5YzkwZ…

哇海贼王

哇海贼王 解压,2个压缩包1张图片图片打开发现尾端异常,疑似解压密码MV9DUkNfSVNfMl9GVU5OWV82NjYjCg== 解码得 1_CRC_IS_2_FUNNY_666#使用该密码解压flag1.zip,成功得到flag.zip 根据提示使用crc暴破获取key,解密flag2.zip拼图得flagREFTQ1RGezkxY2VkZjl2N2Q5ODI4MTA5YzkwZ…

2024-07-17:用go语言,给定一个整数数组nums, 我们可以重复执行以下操作: 选择数组中的前两个元素并删除它们, 每次操作得到的分数是被删除元素的和。 在保持所有操作的分数相同的前提下,

2024-07-17:用go语言,给定一个整数数组nums, 我们可以重复执行以下操作: 选择数组中的前两个元素并删除它们, 每次操作得到的分数是被删除元素的和。 在保持所有操作的分数相同的前提下, 请计算最多能执行多少次操作。 返回可以进行的最大操作次数。 输入:nums = [3,2,1…

自动填充验证码,懒人福音,对视觉障碍的朋友太友善了

自动填充验证码,懒人福音,对视觉障碍的朋友太友善了 一、安装插件Tampermonkey油猴(篡改侯)脚本插件 https://www.tampermonkey.net/ 这个怎么安装就不详细介绍了 二、安装验证码解析脚本 https://greasyfork.org/zh-CN/scripts/418942-万能验证码自动输入-升级版点击进去直接…