谷歌 I/O 2024大会全面硬钢OpenAI;腾讯宣布旗下的混元文生图大模型;阿里巴巴技术下的AI自动视频剪辑工具

✨ 1: 谷歌 I/O 2024

谷歌 I/O 2024 发布了众多新技术,包括 Gemini AI、大语言模型和通用 AI 智能体等,全面颠覆搜索体验。

在这里插入图片描述

谷歌 I/O 2024发布会带来许多令人兴奋的新功能和技术创新:

  1. Gemini 1.5 Pro:一个极其强大的语言模型,具备多模态支持和超长上下文(长达200万token)。它可以处理视频、音频和大量文本,让用户能方便地进行各种复杂任务,如总结会议要点、处理电子邮件等。

  2. Project Astra:一个多功能的通用AI智能体,具备视觉识别和语音交互功能,不仅能识别并分析环境,还能执行各种任务,比如帮助用户填写退货单、找城市服务等。

  3. 搜索重塑:在Gemini加持下,谷歌搜索发生了重大变化,可以提供个性化的AI总结和多步骤推理功能,让用户查询信息更加高效。

  4. Veo:一个新的视频生成模型,可以生成高质量、长达1分多钟的1080p视频,为创作者提供更多的创作空间。

  5. AI媒体工具:包括生成图像的Imagen 3、音乐创作的Music AI Sandbox等,帮助用户更好地进行跨媒体创作。

  6. Astra项目和AR眼镜:结合AR和AI技术,为用户提供更为自然和高效的交互体验。

  7. Gemini App和Gemini Advanced:提供个性化的AI助理和专家服务,让用户能够高效处理日常事务和专项需求。

  8. Ask Photos:一个新的功能,可以帮助用户更快地找到和处理大量照片中的特定信息。

  9. TPU第六代Trillium:提供强大的硬件支持,大幅提升性能和效率,为AI的训练和运行提供保障。

和昨天的OpenAI的发布会进行对比,你觉得如何?各有各的优势,谷歌的优势在于技术能力还很强,而且基本盘很稳,比如把AI加到搜索,手机等,这是OpenAI没办法做到的,
而OpenAI的技术和创新力可以算行内第一,可以很快的做出许多新颖的产品。这波你怎么看?

地址:https://io.google/2024/intl/zh/

✨ 2: Hunyuan-DiT

具备中英双语理解和多轮对话能力的多分辨率扩散式文本生成图像模型

在这里插入图片描述

腾讯宣布旗下的混元文生图大模型升级并对外开源Hunyuan-DiT,Hunyuan-DiT是一款多分辨率扩散Transformer 模型,专门用于中文和英文文本到图像的生成。它可以从输入的文本描述生成高质量的图像,并能够处理多轮对话的文生图任务(即根据用户的多个连续输入生成图像)。

国内互联网BAT巨头,就只有B没有开源了,哦,B在国内可能是2家公司。

地址:https://github.com/Tencent/HunyuanDiT

✨ 3: FunClip

基于阿里语音库的开源、精准、适用于本地部署的视频剪辑工具。

在这里插入图片描述

FunClip

FunClip 是一款开源、精准、方便的视频剪辑工具。它主要通过语音识别技术来帮助用户剪辑视频,并且用户可以轻松选择视频中的某些片段或说话人进行裁剪。FunClip集成了阿里巴巴通义实验室的 FunASR Paraformer 系列模型,能够准确地识别视频中的语音内容,生成时间戳,使得视频剪辑更加方便。

通过FunClip,用户无需了解复杂的视频编辑技术,即可实现精准、快捷的视频剪辑,非常适合需要频繁处理视频内容的工作场景。

地址:https://github.com/alibaba-damo-academy/FunClip

✨ 4: LLaVA-NeXT

一个强大的多模态大语言模型,支持图像和视频任务的零样本推理

在这里插入图片描述

LLaVA-NeXT 是一种开源的大型多模态模型,旨在提供强大的图像和视频理解能力。对于希望在实际应用中利用大型多模态模型的开发者和研究人员来说,LLaVA-NeXT 是一个非常有吸引力的选择。

地址:https://github.com/LLaVA-VL/LLaVA-NeXT

✨ 5: Devon

更高效地编程和管理代码库

在这里插入图片描述

Devon是一个开源的编程助手,旨在帮助开发者更高效地编程和管理代码库。使用Devon可以在很多情况下帮助你,比如当你需要编写代码、探索代码库、编写配置文件、编写测试、修复BUG或者探索软件架构的时候。Devon能够编辑多个文件,从而在整个代码库中提供帮助。然而,它主要针对Python语言,对于非Python语言的支持则有限。

无论你是在寻找帮助编写代码、优化你的工作流程还是想要加入一个开源项目并为之贡献力量,Devon都可能是一个值得尝试的工具。

在这里插入图片描述

地址:https://github.com/entropy-research/Devon



更多AI工具,参考国内AiBard123,Github-AiBard123

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/703074.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python循环结构练习

目录 前言 1、使用while实现模拟用户登录 1.1 题目要求 1.2 解题 2、输入数字,生成对应等腰三角形 2.1 题目要求 2.2 解题 3、输入数字,生成对应的菱形 3.1 题目要求 3.2 解题 总结 前言 本系列主要是讲解python中的题目,目的是为…

短视频赛道有哪些:成都鼎茂宏升文化传媒公司

短视频赛道有哪些:探索多元化的内容领域 随着科技的飞速发展和人们生活节奏的加快,短视频已成为现代人生活中不可或缺的一部分。它以其简短、直观、易于分享的特点,迅速占领了各个年龄层和社会群体的心智。然而,短视频的赛道并非…

项目管理表格-项目总体计划(项目管理-项目经理干货资料Excel)

项目管理总体计划模板 1、项目基本信息 2、项目里程碑 3、项目干系人 4、项目团队组织架构管理 5、项目预算管理 6、项目项目任务计划管理 7、问题及风险管理 8、项目周报 9、项目相关要求 软件项目相关全套精华资料包获取方式①:点我获取 获取方式②:本…

打造数字基座:一场重塑未来教育的浩瀚远征

近两年,随着大模型的崛起,ChatGPT、Sora等应用的爆火,以人工智能为代表的新技术正快速地改变着全球经济和社会发展的节奏。教育作为人才培养的重要途径,在推动新质生产力发展的同时也必须实现自身的创新蜕变。 国家教育数字化战略行动已经来到了第三个年头。在科技革命和教育变…

爱吃香蕉的珂珂

题目链接 爱吃香蕉的珂珂 题目描述 注意点 piles.length < h < 10^9如果某堆香蕉少于k根&#xff0c;将吃掉这堆的所有香蕉&#xff0c;然后这一小时内不会再吃更多的香蕉返回可以在 h 小时内吃掉所有香蕉的最小速度 k&#xff08;k 为整数&#xff09; 解答思路 二…

如何改照片大小到20k?怎么把照片调节成20k?

在提交证件照信息的时候&#xff0c;最常遇到的就是需要压缩图片大小&#xff0c;平时我们拍摄的图片体积都比较大&#xff0c;但是大多平台要求的证件照片大小一般在20k左右&#xff0c;为了能顺利上传&#xff0c;我们需要先通过专业的图片压缩指定大小功能去将照片大小压缩&…

tomcat--目录结构和文件组成

目录结构 目录说明bin服务启动&#xff0c;停止等相关程序和文件conf配置文件lib库目录logs日志记录webapps应用程序&#xff0c;应用部署目录workjsp编译后的结果文件&#xff0c;建议提前预热访问 /usr/local/apache-tomcat-8.5.100/work/Catalina/localhost/ROOT/org/apac…

3.4 浮点型

本节必须掌握的知识点&#xff1a; 示例九 代码分析 汇编解析 浮点数的输出精度 【补充内容】 3.4.1 示例九 浮点型分为&#xff1a;单精度float、双精度double、长双精度long double。 类型 存储大小 值范围 精度 单精度 float 4字节 【1.2E-38~ 3.4E38】 6位小数 …

Git使用(2):远程仓库

一、创建远程仓库 登录码云Gitee - 基于 Git 的代码托管和研发协作平台。 点击右上角&#xff0c;新建仓库。 创建完成&#xff0c;复制仓库地址接下来要使用。 二、将idea项目推送到码云 首先创建本地仓库VCS -> Create Git Repository。然后选择Manage Remotes&#xff0…

若依微服务docker-compose 启动

docker-compose 文件 version : 3 services: ruoyi-nacos: container_name: ruoyi-nacos image: nacos/nacos-server build: context: ./nacos environment: - MODEstandalone volumes: - ./nacos/logs/:/home/nacos/logs - ./n…

探索全球静态住宅IP:网络新时代的稳定基石

在数字化浪潮席卷全球的今天&#xff0c;互联网已成为人们生活中不可或缺的一部分。随着网络技术的飞速发展&#xff0c;IP地址作为网络连接的标识符&#xff0c;其重要性日益凸显。特别是在对稳定性和安全性要求极高的应用场景中&#xff0c;全球静态住宅IP凭借其独特的优势&a…

网络地址转换(nat,easy ip,nat server)资源上传

实验概述 由内到外 nat&#xff0c;easy ip&#xff0c;转换的是源ip nat server 由外到内&#xff0c;转换的是目的IP 实验拓扑 结果验证 nat实验得到结果 1.ar1到ar3没有路由也可以访问 2.ar3配置telent后ar1也可以通过telnet远程配置 esay ip 如果ar2 g0/0/1接口ip非固…