CV论文--2024.2.19

1、Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation

中文标题:自我对弈微调扩散模型,用于文本到图像生成

简介:在生成人工智能(GenAI)领域,微调扩散模型仍然是一个未被充分探索的领域,特别是与大型语言模型(LLMs)微调所取得的显著进展相比。虽然最先进的扩散模型如稳定扩散(SD)和SDXL依赖于监督微调,但它们的性能在看到一定量的数据后不可避免地停滞不前。最近,强化学习(RL)已被用于通过人类偏好数据微调扩散模型,但每个文本提示需要至少两个图像(“获胜者”和“输家”图像)。在本文中,我们介绍了一种名为自我对弈微调扩散模型(SPIN-Diffusion)的创新技术,其中扩散模型与其早期版本进行竞争,促进迭代的自我改进过程。我们的方法提供了一种替代传统的监督微调和RL策略,显著提高了模型的性能和对齐度。我们在Pick-a-Pic数据集上的实验表明,SPIN-Diffusion在人类偏好对齐和视觉吸引力方面优于现有的监督微调方法,甚至在第一次迭代时就表现出色。到第二次迭代时,它在所有指标上都超过了基于RLHF的方法的表现,并且使用更少的数据就能取得这些结果。

2、GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering

中文标题:GES: 通用指数分层技术用于高效的辐射场渲染

简介:3D高斯喷洒技术的进步显著提高了3D重建和生成的速度。然而,这种方法可能需要大量的高斯函数,从而导致内存占用过多。本文介绍了一种名为GES(广义指数喷洒)的新型表示方法,它利用广义指数函数(GEF)来模拟3D场景。相比于高斯喷洒方法,GES需要更少的粒子来表示场景,因此在效率上表现更优。此外,GES还具有即插即用替换功能,可作为高斯基础实用程序的替代方案。研究对GES在理论上、实际的1D设置和现实的3D场景中进行了验证。结果表明,GES能够更准确地表示具有尖锐边缘的信号,而这对于高斯函数来说是具有挑战性的,因为高斯函数具有固有的低通特性。经验分析显示,GEF在拟合自然发生的信号(如正方形、三角形和抛物线信号)方面优于高斯函数,从而减少了高斯喷洒所需的内存。通过频率调制损失的辅助,GES在新视角合成基准测试中表现出了竞争性能,同时内存占用仅为高斯喷洒的一半,并且渲染速度提高了高达39%。您可以在项目网站https://abdullahamdi.com/ges获取相关代码。

3、Any-Shift Prompting for Generalization over Distributions

中文标题:对分布的泛化进行任意移位提示

简介:图像-语言模型通过提示学习在许多下游视觉任务中取得了显著的进展。然而,传统的提示学习方法在训练分布上过度拟合,失去了对测试分布的泛化能力。为了改善在各种分布转移情况下的泛化能力,我们提出了任意转移提示:一种考虑提示学习期间训练和测试分布之间关系的通用概率推断框架。我们通过构建层次结构的训练和测试提示,明确地将训练和测试分布在潜空间中连接起来。在这个框架内,测试提示利用分布关系来指导CLIP图像-语言模型从训练到任何测试分布的泛化。为了有效地编码分布信息及其关系,我们进一步引入了一个具有伪转移训练机制的Transformer推理网络。该网络在前向传递中生成量身定制的测试提示,避免了测试时间的额外训练成本。对23个数据集的广泛实验表明,任意转移提示对于在各种分布转移情况下的泛化能力具有有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/480154.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为---RSTP(二)---RSTP基本配置示例

目录 1. 示例要求 2. 网络拓扑图 3. 配置命令 4. 测试终端连通性 5. RSTP基本配置 5.1 启用STP 5.2 修改生成树协议模式为RSTP 5.3 配置根交换机和次根交换机 5.4 设置边缘端口 6. 指定端口切换为备份端口 7. 测试验证网络 1. 示例要求 为防止网络出现环路&#xf…

相机图像质量研究(40)常见问题总结:显示器对成像的影响--画面泛白

系列文章目录 相机图像质量研究(1)Camera成像流程介绍 相机图像质量研究(2)ISP专用平台调优介绍 相机图像质量研究(3)图像质量测试介绍 相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距 相机图像质量研究(5)常见问题总结:光学结构对成…

可视化视频监控平台EasyCVR如何配置服务参数以免getbaseconfig接口信息泄露?

可视化云监控平台/安防视频监控系统EasyCVR视频综合管理平台,采用了开放式的网络结构,平台支持高清视频的接入和传输、分发,可以提供实时远程视频监控、视频录像、录像回放与存储、告警、语音对讲、云台控制、平台级联、磁盘阵列存储、视频集…

mysql同类型的多行变成一行value1和value2不同的列

关键字 row_number() over (partition by) 例如,下面的数据, 这是按照name分组后,展示property值。 我们想得到这样的值; 第一步:将每一组的property标上序号 select name,property,row_number() over (partition by name order…

Easyx的学习1

使用easys的相关函数需要包含头文件#include<easyx.h>或#include<graphics.h>&#xff08;#include<graphics.h>包含了<easyx.h>和一些不推荐使用的函数&#xff09; 目录 窗口创建背景颜色 基本图形绘制 1.点 2.线 3.矩形 圆角矩形 4. 圆形 椭圆…

计网day4

五 网络层 5.1 网络层功能概述 5.2 路由算法 5.3 IP数据报格式 无分类编址CIDR&#xff1a; ARP协议&#xff1a; DHCP协议&#xff1a; ICMP协议&#xff1a; 5.4 IPv6 5.5 RIP协议及距离向量算法 OSPF协议及链路状态算法&#xff1a; BGP协议&#xf…

C语言二级易忘易错易混知识点(自用)

1.数组名不能自加。 因为数组名实际上是一个指针&#xff0c;指向数组的第一个元素的地址。数组名在编译器中被视为常量&#xff0c;它的值是固定的&#xff0c;不能改变。 要访问数组的不同元素&#xff0c;应该使用数组名加上偏移量的方式来访问。 2.共用体只有最后一次赋值…

剪辑视频调色软件有哪些 剪辑视频软件哪个最好 剪辑视频怎么学 剪辑视频的方法和步骤 会声会影2024 会声会影视频制作教程

看了很多调色教程&#xff0c;背了一堆调色参数&#xff0c;可最终还是调不出理想的效果。别再怀疑自己了&#xff0c;不是你的剪辑技术不行&#xff0c;而是剪辑软件没选对。只要掌握了最基本的调色原理&#xff0c;一款适合自己的视频剪辑软件是很容易出片的。 有关剪辑视频…

微博数据可视化分析:利用Python构建信息图表展示话题热度

1. 引言 随着社交媒体的迅速发展&#xff0c;微博已成为人们交流观点、表达情感的重要平台之一。微博评论数据蕴含着丰富的信息&#xff0c;通过对这些数据进行分析和可视化&#xff0c;我们可以深入了解用户对特定话题的关注程度和情感倾向。本文将介绍如何利用Python进行微博…

STM32F103C8T6驱动旋转编码器模块

下图是这次使用的旋转编码器模块 STM32F103C8T6驱动旋转编码器模块 产品说明使用测试硬件连接代码如下main.crotary_encoder.h.crotary_encoder.h.h 脉冲数和正反转演示图工程文件 产品说明 旋转编码器可通过旋转&#xff0c;可以计数正方向和反方向 转动过程中输出脉冲的次…

6-Rhodamine 6G NH2,氨基罗丹明6G,具有高荧光性质的罗丹明家族染料之一

6-Rhodamine 6G amine&#xff0c;6-Rhodamine 6G NH2&#xff0c;氨基罗丹明6G&#xff0c;具有高荧光性质的罗丹明家族染料之一 文章关键词&#xff1a;6-Rhodamine 6G amine&#xff0c;6-Rhodamine 6G NH2&#xff0c;氨基罗丹明6G 一、基本信息 产品简介&#xff1a;6-…

代码随想录算法训练营DAY20 | 二叉树(7) (续)

一、LeetCode 236 二叉树的最近公共祖先 题目链接&#xff1a;236.二叉树的最近公共祖先https://leetcode.cn/problems/lowest-common-ancestor-of-a-binary-tree/description/ 思路&#xff1a;利用后序遍历是天然回溯过程、方便实现自底向上查找的原理&#xff0c;递归寻找公…