【AI】行业消息精选和分析(23-11-19)

行业动态

1、对标GPTs,微软连夜发布100多项更新!微软CEO:Copilot时代来了
2、英伟达联手微软推出AI代工服务
3、全新雅虎搜索将于 2024 年上线,未来还会推出更多 AI 和高级功能
4、Instagram 推出定制 AI 贴纸和滤镜功能,强化创作者体验
5、OPPO正式推出自主训练大模型AndesGPT
6、原阿里首席 AI 科学家贾扬清再发声:开源领域“魔改”要不得
7、滴滴组建大模型团队,将落地部分个人出行和企业差旅场景
8、小米 Vela 开源系统正式发布:8KB 内存就能跑,支持端侧 AI 大模型
9、金山办公昨日宣布,WPS AI 开启公测,面向全体用户陆续开放体验。
10、人人都有专属数字家庭医生 浙江数字健康人“安诊儿”来了

技术发展

🤖 DeepMind的Mirasol3B模型:
- 更有效地理解和分析视频中发生的事情,即使视频很长。
- 独特的多媒体处理:同步和非同步文本分析。
- 视听与文本关系理解:提高长视频分析效率。


🎥 Meta AI的Emu Video和Emu Edit:
- Emu Video:文本到视频的生成,高质量视频制作。
- Emu Edit:图像编辑的指令驱动模型,精确像素修改。
- 技术创新:两个扩散模型生成高分辨率视频。

当地时间11月16日,Meta于官网发布文生视频模型Emu Video和图像编辑模型Emu Edit。
据介绍,Emu Video可以通过自然语言生成高质量视频,它将视频生成分为两个步骤,首先生成以文本为条件的图像,然后生成以文本和生成的图像为条件的视频。Emu Edit是一个多任务图像编辑模型,可以通过自然语言对图像进行编辑。在训练中,团队将区域编辑、自由格式编辑和计算机视觉任务等均制定为生成任务,并为其提供了学习任务嵌入。


🌐 screenshot-to-code项目:
- GPT-4V驱动:将屏幕截图转化为HTML网页。


👤 微软的Deepfakes Creator:
- 仅需文本输入就可生成逼真的会说话的真人视频
- 支持多种语言,还可进行实时问答互动


🎶 Deepmind与YouTube的Lyria音乐生成模型:
- 只要哼唱或者吹口哨就能帮你自动生成交响乐
- 歌词创作和风格控制:艺术家风格模仿。
- 特色:生成音频带AI水印。

谷歌DeepMind宣布与YouTube合作推出AI音乐生成大模型Lyria,并基于该模型推出两个功能:Dream Track、Music AI。Dream Track可以自动生成模仿某音乐人声音、风格音乐,用户只需输入文字提示,选择需要模仿的音乐人,便可以自动生成包含歌词的30秒音乐。
Music AI可以将用户哼唱的旋律变成完整的曲目,创建乐器和声乐伴奏等。此外,基于Lyria模型发布的任何内容都将带有Synth ID水印。

🏪 GPTs Store界面曝光:GTPs导航站可能会被取代?
- 精选GPT:展示本周精选GPTs。
- 热门GPT:社区中受欢迎的GPTs。
- 特色和趋势:当前列表为空


🎨 Meshy-1:3D模型生成AI工具:
- 多样输入:文本和图像到3D模型转换。
- 风格多样:现实、动漫、卡通等风格选择。
- 格式支持:多种文件格式,包括Unity插件。
- 高清纹理:提供4K分辨率PBR纹理。
 

今日感受

1.魔改开源大模型,以零一修改张量名字为典型案例,开始被开源社区、大厂抵制。这将导致社会资源的大量浪费和损失。

2.多模态AI时代就要来了。

单模态AI的能力是有限的,比如只能通过文本或者图像来理解或者输出内容。如今,单模态数据在实际应用中存在局限性,需要采用多模态 AI。

举个例子,一辆只有摄像头系统的自动驾驶汽车很难在弱光下识别行人。如果加上激光雷达、雷达和 GPS 就可以完美解决这些问题,可以为车辆提供更全面的周围环境图像,从而使驾驶更安全、更可靠。

和自动驾驶一样典型的案例,就是医疗。我们都知道,中医有“望闻问切”,西医讲究“视触叩听”,异曲同工,并且是典型的多模态应用。

多模态才更符合人类的真实世界。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/193335.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

excel中设置图表图例的位置

例如,在excel中已经做好了一个折线图: 可以看到,默认图例是在图表的右侧,减小了图的横向展示区域。我们可以把图例放到图的上边、或者下边。 双击图表: 鼠标放在图例上方,出现了浮动文字“图例”&#…

反弹Shell

概述 反弹shell(reverse shell)就是控制端监听在某TCP/UDP端口,被控端发起请求到该端口,并将其命令行的输入输出转到控制端。reverse shell与telnet,ssh等标准shell对应,本质上是网络概念的客户端与服务端…

Python操作Excel常用方法汇总

目录 引言 一、使用pandas库操作Excel 1、读取Excel文件 2、写入Excel文件 3、处理Excel数据 二、使用openpyxl库操作Excel 1、读取Excel文件 2、写入Excel文件 3、处理Excel数据 三、高级功能 总结 引言 Python是一种功能强大的编程语言,它可以用来处理…

记一次解决Pyqt6/Pyside6添加QTreeView或QTreeWidget导致窗口卡死(未响应)的新路历程,打死我都想不到是这个原因

文章目录 💢 问题 💢🏡 环境 🏡📄 代码💯 解决方案 💯⚓️ 相关链接 ⚓️💢 问题 💢 我在窗口中添加了一个 QTreeWidget控件 ,但是程序在运行期间,只要鼠标进入到 QTreeWidget控件 内进行操作,时间超过几秒中就会出现窗口 未响应卡死的 状态 🏡 环境 �…

代码随想录算法训练营第二十七天|39 组合总和 40 组合总和II 131分割回文串

目录 39 组合总和 40 组合总和II 131分割回文串 39 组合总和 class Solution {List<List<Integer>>res new ArrayList<>();List<Integer>newList new LinkedList<>();public List<List<Integer>> combinationSum(int[] candid…

【教3妹学编程-算法题】三个无重叠子数组的最大和

2哥 : 3妹&#xff0c;咋啦&#xff1f;一副苦大仇深的样子&#xff1f; 3妹&#xff1a;不开心呀不开心&#xff0c;羽生结弦宣布离婚。 2哥 : 羽生什么&#xff1f; 3妹&#xff1a;羽生结弦&#xff01; 2哥 : 什么结弦&#xff1f; 3妹&#xff1a;羽生结弦&#xff01;&am…

小美的树上染色

美团2024届秋招笔试第一场编程真题 先提一个小知识&#xff1a;题目中凡是提到树结构都要使用图的存储方式&#xff0c;只有二叉树例外。 分析&#xff1a;在树结构中&#xff0c;孩子和父节点是相邻节点&#xff0c;而父节点可能有多个孩子节点。在染色的过程中&#xff0c;…

AIGC实战 - 使用变分自编码器生成面部图像

AIGC实战 - 使用变分自编码器生成面部图像 0. 前言1. 数据集分析2. 训练变分自编码器2.1 变分自编码器架构2.2 变分自编码器分析 3. 生成新的面部图像4. 潜空间算术5. 人脸变换小结系列链接 0. 前言 在自编码器和变分自编码器上&#xff0c;我们都仅使用具有两个维度的潜空间。…

037、目标检测-算法速览

之——常用算法速览 目录 之——常用算法速览 杂谈 正文 1.区域卷积神经网络 - R-CNN 2.单发多框检测SSD&#xff0c;single shot detection 3.yolo 杂谈 快速过一下目标检测的各类算法。 正文 1.区域卷积神经网络 - R-CNN region_based CNN&#xff0c;奠基性的工作。…

vscode pandas无法使用

一、代码内容 import csv csv_reader csv.reader(open("data.csv")) for row in csv_reader:print(row) print(row[2]) 二、错误提示 ModuleNotFoundError: No module named pandas 三、安装pandas 然后我安装pandas&#xff0c;因为我的python的版本是python …

【算法挨揍日记】day31——673. 最长递增子序列的个数、646. 最长数对链

673. 最长递增子序列的个数 673. 最长递增子序列的个数 题目解析&#xff1a; 给定一个未排序的整数数组 nums &#xff0c; 返回最长递增子序列的个数 。 注意 这个数列必须是 严格 递增的。 解题思路&#xff1a; 算法思路&#xff1a; 1. 状态表⽰&#xff1a; 先尝试…

理论与实践相结合之Cisco Packet Tracer网络模拟器安装教程

简介 Packet Tracer是由思科设计的跨平台可视化仿真工具&#xff0c;它允许用户创建网络拓扑以模仿计算机网络和使用命令行界面来模拟配置思科路由器和交换机。Packet Tracer的用户界面为拖放式&#xff0c;允许用户根据自己的需要添加和删除模拟的网络设备。 Packet Tracer很…