语言能打败数值回归吗?基于语言的多模态轨迹预测

语言能打败数值回归吗?基于语言的多模态轨迹预测
    语言模型在语境理解和生成表现方面表现出了令人印象深刻的能力。受语言基础模型最近成功的启发,提出了LMTraj(基于语言的多模态轨迹预测器),它将轨迹预测任务转化为一种问答问题。与将轨迹坐标序列视为连续信号的传统数值回归模型不同,将其视为文本提示等离散信号。特别地,首先将轨迹坐标的输入空间转换为自然语言空间。这里,行人的整个时间序列轨迹被转换为文本提示,场景图像通过图像字幕被描述为文本信息。然后将转换后的数值和图像数据打包到问答模板中,以用于语言模型。接下来,为了指导语言模型理解和推理高级知识,如场景背景和行人之间的社会关系,引入了一个辅助的多任务问答。然后,用提示数据训练了一个数字标记器。鼓励标记器很好地分离整数和小数部分,并利用它来捕获语言模型中连续数字之间的相关性。最后,使用数字标记器和所有问答提示来训练语言模型。在这里,提出了一种基于波束搜索的最有可能预测和一种基于温度的多模态预测,以实现确定性和随机性推断。应用改进的LMTraj,表明基于语言的模型可以成为一个强大的行人轨迹预测器,并且优于现有的基于数值的预测方法。广泛的实验表明,改进的LMTraj可以成功地理解社会关系,并在公共行人轨迹预测基准上准确地推断出多模式未来。
QA模板,用于将原始轨迹数据转换为提示,见表4-1。
表4-1  QA模板,用于将原始轨迹数据转换为提示
 
    文本预训练标记器和数字数据优化标记器的比较如图4-12所示。
 
图4-12 文本预训练标记器和数字数据优化标记器的比较
在图4-12中,在带有黄色或白色突出显示颜色的括号下,表示相应的字母已被标记。绿色突出显示令牌包含一个6的整数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/843905.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通过变化先验和条件扩散模型实现基于参考的超分辨率

通过变化先验和条件扩散模型实现基于参考的超分辨率 基于参考的超分辨率(RefSR)有可能在遥感图像的空间和时间分辨率之间架起桥梁。然而,现有的RefSR方法受到内容重建的忠实性和大尺度因子下纹理转移有效性的限制。条件扩散模型为生成逼真的高分辨率图像开辟了新的机会,但在…

小米10ultra 同样亮度 ISO不同导致的分辨率不同

头灯补光 IMG_20241130_023716.jpg 4800w iso320 IMG_20241130_023724.jpg 4800w iso50

黑苹果macOS系统/恢复版基础安装教程

因分为两种安装方式,本文主要介绍两种安装方式:U盘安装,以及在 Windows 下使用镜像恢复软件安装的方式。本文的操作方法支持 Windows 和 macOS 分别使用不同硬盘的安装方法。如果要安装成单个硬盘多系统的方式,注意你的分区结构。两种方法列举如下(OpenCore同样适用): …

linux装机(装系统)

1. 开机(重启)-- 解释: <F11>:进入装机选择 <DEL>:biso设置2.按F11 进入装机选择(U盘装机或PXE网络装机)例如:U盘启动 选择 ( UEFI USB XXXXXXX ) 2.直接下一步 3.难点(设置磁盘)选择设置磁盘 选择手动分区 通过加减去控制分区(如果有原先分配的…

C++ 学习笔记(2):String、递归、排序

背景 记个笔记,这几天跟着这个教程到第五章了,顺带把递归和排序也看了(沙比学校天天整些屁事都没什么空折腾)。 String 字符串就直接用 GPT 生成了,这里就当文档记。(感觉没啥好说的)字符串的输入和输出输入字符串:使用 cin 输入字符串,注意会自动去除末尾的换行符。 …

小米10ultra ISO12233 超广角IMX350 不同亮度下比较 分辨率

自动模式 只有屋顶的灯 IMG_20241130_005539.HEIC ISO1045 自动模式 头灯补光 IMG_20241130_005547.HEIC ISO55 专业模式 固定ISO100 IMG_20241130_005603.jpg 只有屋顶的灯 专业模式 固定ISO100 头灯补光

centos7的root密码重置

1. 重启操作系统,出现以下界面时,按键盘e键继续。 2.出现如下界面时,往下翻,找到 linux XXX (其实是设置系统启动内核参数)添加“rw single init=/bin/bash”,添加后按“Ctrl + x”继续。 3.出现如下界面时,输入“passwd”,按照密码复杂程度进行重置root密码。 4.密…

Solidity学习笔记-2

16.函数重载 16_01.重载函数重载(overloading):即函数名字相同,但输入的参数类型不同的函数可以同时存在;(被视为是不同的函数) Solidity不允许修饰器modifier重载; 重载的函数经过编译之后,由于不同的参数类型,都变成了不同的函数选择器(selector,29节有介绍);示…

gitlab分支保护

作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 目录1.开发者无法推送代码到master分支案例1.1 查看jasonyin2020角色1.2 查看jasonyin2020有权限的相关项目1.3 使用jasonyin2020用户拉取meta-data项目所有分支到本地1.4 使用jasonyin2020用户推送数据到dev…

Python绘制南北极地图

import matplotlib.pyplot as plt import numpy as np import cartopy.crs as ccrs import cartopy.feature as cfeature import matplotlib.path as mpathdef plot_polar_map(dmeridian: float = 30.0, # 经度网格线间隔dparallel: float = 15.0): # 纬度网格线间隔"&q…

开源 - Ideal库 - Excel帮助类,TableHelper实现(二)

本文实现对象集合与DataTable的转换,包括按列名数组、列名-类型键值对、类创建表格的方法,并对类进行类型校验和反射获取属性信息,单元测试代码已上传至代码库。书接上回,我们今天开始实现对象集合与DataTable的相互转换。01、接口设计 上文中已经详细讲解了整体设计思路以…

大语言模型中的MoE

1.概述 MoE代表“混合专家模型”(Mixture of Experts),这是一种架构设计,通过将不同的子模型(即专家)结合起来进行任务处理。与传统的模型相比,MoE结构能够动态地选择并激活其中一部分专家,从而显著提升模型的效率和性能。尤其在计算和参数规模上,MoE架构能够在保持较…