【具身智能评估1】具身视觉语言规划(EVLP)仿真环境汇总

参考论文:Core Challenges in Embodied Vision-Language Planning
论文作者:Jonathan Francis, Nariaki Kitamura, Felix Labelle, Xiaopeng Lu, Ingrid Navarro, Jean Oh
论文原文:https://arxiv.org/abs/2106.13948
论文出处:Journal of Artificial Intelligence Research 74 (2022) 459-515
论文被引:27(11/18/2023)

论文中的工作截止到2021年,在此基础上补充了近几年具身智能领域相关的仿真环境。
在这里插入图片描述

术语对齐

Embodied Vision Language Planning (EVLP):具身视觉语言规划
在这里插入图片描述

具身智能仿真环境

解决 EVLP 任务通常需要使用仿真环境和数据集。仿真平台和数据集有助于复现和评估具身智能系统。模拟器旨在复制现实世界的方方面面,并模拟能够解决复杂任务的智能体(agent),同时抽象出设计和监督现实世界智能体的所面临的挑战。相比之下,数据集在阐明每项任务的框架方面起着至关重要的作用。数据集提供了智能体在应对特定多模态刺激时的行为示例。

早期的具身研究模拟平台通常利用视频游戏环境来创建和训练神经控制器。由于简化的环境通常缺乏真实世界环境的多样性和复杂性,人类的表现很快就在其中一些平台上实现了。最近的研究通过使用逼真的照片和使用交互式情境(智能体能够修改环境中物体的状态)来解决这种缺乏真实感的问题。为此,人们也在开发从模拟到现实的迁移和评估为重点的框架,以便研究真实环境与模拟环境之间的差异。
在这里插入图片描述
在这里插入图片描述

VLN Simulators

Matterport3DSim

Matterport3D Dataset:

论文标题:Matterport3D: Learning from RGB-D Data in Indoor Environments
论文作者:Angel Chang, Angela Dai, Thomas Funkhouser, Maciej Halber, Matthias Nießner, Manolis Savva, Shuran Song, Andy Zeng, Yinda Zhang
论文原文:https://arxiv.org/abs/1709.06158
论文出处:3DV 2017
论文被引:1449(11/18/2023)
论文代码:https://github.com/niessner/Matterport,834 star
项目主页:https://niessner.github.io/Matterport/

Matterport3D Simulator:

论文标题:Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments
论文作者:Peter Anderson, Qi Wu, Damien Teney, Jake Bruce, Mark Johnson, Niko Sünderhauf, Ian Reid, Stephen Gould, Anton van den Hengel
论文原文:https://arxiv.org/abs/1711.07280
论文出处:CVPR 2018
论文被引:1089(11/18/2023)
论文代码:https://github.com/peteanderson80/Matterport3DSimulator
项目主页:–

Habitat

Habitat 1.0

论文标题:Habitat: A Platform for Embodied AI Research
论文作者:Manolis Savva, Abhishek Kadian, Oleksandr Maksymets, Yili Zhao, Erik Wijmans, Bhavana Jain, Julian Straub, Jia Liu, Vladlen Koltun, Jitendra Malik, Devi Parikh, Dhruv Batra
论文原文:https://arxiv.org/abs/1904.01201
论文出处:ICCV 2019
论文被引:1043(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-sim,2k star
项目主页:https://aihabitat.org/

Habitat 2.0

论文标题:Habitat 2.0: Training Home Assistants to Rearrange their Habitat
论文作者:Andrew Szot, Alex Clegg, Eric Undersander, Erik Wijmans, Yili Zhao, John Turner, Noah Maestre, Mustafa Mukadam, Devendra Chaplot, Oleksandr Maksymets, Aaron Gokaslan, Vladimir Vondrus, Sameer Dharur, Franziska Meier, Wojciech Galuba, Angel Chang, Zsolt Kira, Vladlen Koltun, Jitendra Malik, Manolis Savva, Dhruv Batra
论文原文:https://arxiv.org/abs/2106.14405
论文出处:NeurIPS 2021 Spotlight
论文被引:279(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-lab,1.5k star
项目主页:https://aihabitat.org/

Habitat 3.0

论文标题:Habitat 3.0: A Co-Habitat for Humans, Avatars and Robots
论文作者:Xavier Puig, Eric Undersander, Andrew Szot, Mikael Dallaire Cote, Tsung-Yen Yang, Ruslan Partsey, Ruta Desai, Alexander William Clegg, Michal Hlavac, So Yeon Min, Vladimír Vondruš, Theophile Gervet, Vincent-Pierre Berges, John M. Turner, Oleksandr Maksymets, Zsolt Kira, Mrinal Kalakrishnan, Jitendra Malik, Devendra Singh Chaplot, Unnat Jain, Dhruv Batra, Akshara Rai, Roozbeh Mottaghi
论文原文:https://arxiv.org/abs/2310.13724
论文出处:arXiv
论文被引:2(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-lab/tree/v0.3.0,1.5 k
项目主页:https://aihabitat.org/habitat3/

StreetLearn

论文标题:Learning to Navigate in Cities Without a Map
论文作者:Piotr Mirowski, Matthew Koichi Grimes, Mateusz Malinowski, Karl Moritz Hermann, Keith Anderson, Denis Teplyashin, Karen Simonyan, Koray Kavukcuoglu, Andrew Zisserman, Raia Hadsell
论文原文:https://arxiv.org/abs/1804.00168
论文出处:NeurIPS 2018
论文被引:293(11/18/2023)
论文代码:https://github.com/google-deepmind/streetlearn,271 star
项目主页:https://sites.google.com/view/streetlearn/

VDN Simulator

Matterport3DSim

EQA Simulators

House3D

论文标题:Building Generalizable Agents with a Realistic and Rich 3D Environment
论文作者:Yi Wu, Yuxin Wu, Georgia Gkioxari, Yuandong Tian
论文原文:https://arxiv.org/abs/1801.02209
论文出处:ICLR 2018
论文被引:232(11/18/2023)
论文代码:https://github.com/facebookresearch/House3D
项目主页:–

AI2-THOR

论文标题:AI2-THOR: An Interactive 3D Environment for Visual AI
论文作者:Eric Kolve, Roozbeh Mottaghi, Winson Han, Eli VanderBilt, Luca Weihs, Alvaro Herrasti, Matt Deitke, Kiana Ehsani, Daniel Gordon, Yuke Zhu, Aniruddha Kembhavi, Abhinav Gupta, Ali Farhadi
论文原文:https://arxiv.org/abs/1712.05474
论文出处:arXiv 1712
论文被引:662(11/18/2023)
论文代码:https://github.com/allenai/ai2thor,914 star
项目主页:https://ai2thor.allenai.org/

MINOS

论文标题:MINOS: Multimodal Indoor Simulator for Navigation in Complex Environments
论文作者:Manolis Savva, Angel X. Chang, Alexey Dosovitskiy, Thomas Funkhouser, Vladlen Koltun
论文原文:https://arxiv.org/abs/1712.03931
论文出处:arXiv 1712
论文被引:128(11/18/2023)
论文代码:https://github.com/minosworld/minos,199 star
项目主页:https://minosworld.github.io/

EOR Simulators

REVERIE

论文标题:REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments
论文作者:Yuankai Qi, Qi Wu, Peter Anderson, Xin Wang, William Yang Wang, Chunhua Shen, Anton van den Hengel
论文原文:https://arxiv.org/abs/1904.10151
论文出处:CVPR 2020
论文被引:204(11/18/2023)
论文代码:https://github.com/YuankaiQi/REVERIE,94 star
项目主页:–

EGM Simulators

ALFRED

论文标题:ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks
论文作者:Mohit Shridhar, Jesse Thomason, Daniel Gordon, Yonatan Bisk, Winson Han, Roozbeh Mottaghi, Luke Zettlemoyer, Dieter Fox
论文原文:https://arxiv.org/abs/1912.01734
论文出处:CVPR 2020
论文被引:489(11/18/2023)
论文代码:https://github.com/askforalfred/alfred,288 star
项目主页:https://askforalfred.com/

ArraMon

论文标题:ArraMon: A Joint Navigation-Assembly Instruction Interpretation Task in Dynamic Environments
论文作者:Hyounghun Kim, Abhay Zala, Graham Burri, Hao Tan, Mohit Bansal
论文原文:https://arxiv.org/abs/2011.07660
论文出处:EMNLP Findings 2020
论文被引:13(11/18/2023)
论文代码:https://github.com/hyounghk/ArraMon,4 star
项目主页:https://arramonunc.github.io/

CerealBar

论文标题:Executing Instructions in Situated Collaborative Interactions
论文作者:Alane Suhr, Claudia Yan, Charlotte Schluger, Stanley Yu, Hadi Khader, Marwa Mouallem, Iris Zhang, Yoav Artzi
论文原文:https://arxiv.org/abs/1910.03655
论文出处:EMNLP 2019 long paper
论文被引:68(11/18/2023)
论文代码:https://github.com/lil-lab/cerealbar,26 star
项目主页:https://lil.nlp.cornell.edu/cerealbar/

Other Simulator

iGibson

论文标题:Interactive Gibson Benchmark (iGibson 0.5): A Benchmark for Interactive Navigation in Cluttered Environments
论文作者:Fei Xia, William B. Shen, Chengshu Li, Priya Kasimbeg, Micael Tchapmi, Alexander Toshev, Li Fei-Fei, Roberto Martín-Martín, Silvio Savarese
论文原文:https://arxiv.org/abs/1910.14442
论文出处:RAL 2020
论文被引:181(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://sites.google.com/view/interactivegibsonenv

iGibson 1.0

论文标题:iGibson 1.0: a Simulation Environment for Interactive Tasks in Large Realistic Scenes
论文作者:Bokui Shen, Fei Xia, Chengshu Li, Roberto Martín-Martín, Linxi Fan, Guanzhi Wang, Claudia Pérez-D’Arpino, Shyamal Buch, Sanjana Srivastava, Lyne P. Tchapmi, Micael E. Tchapmi, Kent Vainio, Josiah Wong, Li Fei-Fei, Silvio Savarese
论文原文:https://arxiv.org/abs/2012.02924
论文出处:IROS 2021
论文被引:100(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://svl.stanford.edu/igibson/

iGibson 2.0

论文标题:iGibson 2.0: Object-Centric Simulation for Robot Learning of Everyday Household Tasks
论文作者:Chengshu Li, Fei Xia, Roberto Martín-Martín, Michael Lingelbach, Sanjana Srivastava, Bokui Shen, Kent Vainio, Cem Gokmen, Gokul Dharan, Tanish Jain, Andrey Kurenkov, C. Karen Liu, Hyowon Gweon, Jiajun Wu, Li Fei-Fei, Silvio Savarese
论文原文:https://arxiv.org/abs/2108.03272
论文出处:CoRL 2021
论文被引:105(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://svl.stanford.edu/igibson/

SoundSpaces

论文标题:SoundSpaces: Audio-Visual Navigation in 3D Environments
论文作者:Changan Chen, Unnat Jain, Carl Schissler, Sebastia Vicenc Amengual Gari, Ziad Al-Halah, Vamsi Krishna Ithapu, Philip Robinson, Kristen Grauman
论文原文:https://arxiv.org/abs/1912.11474
论文出处: ECCV 2020
论文被引:203(11/18/2023)
论文代码:https://github.com/facebookresearch/sound-spaces,281 star
项目主页:https://vision.cs.utexas.edu/projects/audio_visual_navigation/

VirtualHome

论文标题:VirtualHome: Simulating Household Activities via Programs
论文作者:Xavier Puig, Kevin Ra, Marko Boben, Jiaman Li, Tingwu Wang, Sanja Fidler, Antonio Torralba
论文原文:https://arxiv.org/abs/1806.07011
论文出处:CVPR 2018 Oral
论文被引:314(11/18/2023)
论文代码:https://github.com/xavierpuigf/virtualhome,323 star
项目主页:http://virtual-home.org/

SAPIEN

论文标题:SAPIEN: A SimulAted Part-based Interactive ENvironment
论文作者:Fanbo Xiang, Yuzhe Qin, Kaichun Mo, Yikuan Xia, Hao Zhu, Fangchen Liu, Minghua Liu, Hanxiao Jiang, Yifu Yuan, He Wang, Li Yi, Angel X. Chang, Leonidas J. Guibas, Hao Su
论文原文:https://arxiv.org/abs/2003.08515
论文出处:CVPR 2020
论文被引:286(11/18/2023)
论文代码:https://github.com/haosulab/SAPIEN,266 star
项目主页:–

ThreeDWorld ※

论文标题:ThreeDWorld: A Platform for Interactive Multi-Modal Physical Simulation
论文作者:Chuang Gan, Jeremy Schwartz, Seth Alter, Damian Mrowca, Martin Schrimpf, James Traer, Julian De Freitas, Jonas Kubilius, Abhishek Bhandwaldar, Nick Haber, Megumi Sano, Kuno Kim, Elias Wang, Michael Lingelbach, Aidan Curtis, Kevin Feigelis, Daniel M. Bear, Dan Gutfreund, David Cox, Antonio Torralba, James J. DiCarlo, Joshua B. Tenenbaum, Josh H. McDermott, Daniel L.K. Yamins
论文原文:https://arxiv.org/abs/2007.04954
论文出处:NeurIPS 2021
论文被引:186(11/18/2023)
论文代码:https://github.com/threedworld-mit/tdw,426 star
项目主页:https://www.threedworld.org/

PyBullet

项目主页:https://pybullet.org/wordpress/

Github:https://github.com/bulletphysics/bullet3,11.3k star

MuJoCo

论文标题:MuJoCo: A physics engine for model-based control
论文作者:Emanuel Todorov; Tom Erez; Yuval Tassa
论文原文:https://ieeexplore.ieee.org/document/6386109
论文出处:2012 IEEE/RSJ International Conference on Intelligent Robots and Systems
论文被引:4752(11/18/2023)
论文代码:https://github.com/google-deepmind/mujoco,6.5k star
项目主页:https://mujoco.org/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/190398.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux shell编程学习笔记26:stty(set tty)

之前我们探讨了Linux中的tty,tty命令的主要功能是显示当前使用的终端名称。 如果我们想进一步对tty进行设置,就要用到stty。 stty的功能:显示和修改终端特性(Print or change terminal characteristics)。 1 stty -…

【快速解决】实验三 简单注册的实现《Android程序设计》实验报告

目录 前言 实验要求 实验三 简单注册的实现 实验目的: 实验内容: 实验提示: 无 三、遇到的问题总结(如果有问题,请总结。如果没问题请写“无”) 正文开始 第一步建立项目 第二步选择empty views a…

基于静电放电算法优化概率神经网络PNN的分类预测 - 附代码

基于静电放电算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于静电放电算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于静电放电优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神…

振南技术干货集:比萨斜塔要倒了,倾斜传感器快来!(5)

注解目录 1、倾斜传感器的那些基础干货 1.1 典型应用场景 (危楼、边坡、古建筑都是对倾斜敏感的。) 1.2 倾斜传感器的原理 1.2.1 滚珠式倾斜开关 1.2.2 加速度式倾斜传感器 1)直接输出倾角 2)加速度计算倾角 3)倾角精度的提高 (如果…

训练模型报错RuntimeError: Input, output and indices must be on the current device

问题出现: 当我训练图网络模型时,源码默认使用cpu,查看后台性能运行,发现正在使用cpu训练,这大大降低了训练速率,并且增加了电脑负载。所以我决定将模型改造并训练放在GPU上运行。 我在train方法中&#xf…

UE5 C++报错:is not currently enabled for Live Coding

解决办法: 再次打开项目,以此法打开:

再也不用担心忘记密码了!如何在Windows 10或11中重置被遗忘的密码

​如果你忘记了Windows电脑的密码,不要惊慌。Windows 10和Windows 11都允许你重置忘记的密码,无论你使用的是Microsoft帐户还是本地帐户。你所要做的就是回答你的安全问题以重置密码。另一种选择是创建一个密码重置盘,你可以在任何U盘上进行。 除了使用密码之外,你还应该启…

springBoot中starter

springBoot项目中引入starter 项目引入xxljob&#xff0c;仅需要导入对应的starter包&#xff0c;即可进行快速开发 <dependency><groupId>com.ydl</groupId><artifactId>xxl-job-spring-boot-starter</artifactId><version>0.0.1-SNAPS…

CentOS 7搭建Gitlab流程

目录 1、查询docker镜像gitlab-ce 2、拉取镜像 3、查询已下载的镜像 4、新建gitlab文件夹 5、在gitlab文件夹下新建相关文件夹 6、创建运行gitlab的容器 7、查看docker容器 8、根据Linux地址访问gitlab 9、进入docker容器&#xff0c;设置用户名的和密码 10、登录git…

红队攻防之特殊场景上线cs和msf

倘见玉皇先跪奏&#xff1a;他生永不落红尘 本文首发于先知社区&#xff0c;原创作者即是本人 网络拓扑图 一、msf正向木马拿不出网域控shell msf生成木马 msfvenom -p windows/x64/meterpreter/bind_tcp lport4444 -f raw -o msf1.bin用msfvenom生成一个正向马传进去&…

ai的潜力和中短期的未来预测

内容来源&#xff1a;rickawsb ​对于描述ai的潜力和中短期的未来预测&#xff0c;我认为到目前为止可能没有比这篇推文总结得更好的了。 我读了三次。 文章起源于一个用户感叹openai升级chatgpt后&#xff0c;支持pdf上传功能&#xff0c;直接让不少的靠这个功能吃饭的创业公…

YOLOv8独家改进: Inner-IoU基于辅助边框的IoU损失,高效结合 GIoU, DIoU, CIoU,SIoU 等 | 2023.11

💡💡💡本文独家改进:Inner-IoU引入尺度因子 ratio 控制辅助边框的尺度大小用于计算损失,并与现有的基于 IoU ( GIoU, DIoU, CIoU,SIoU )损失进行有效结合 推荐指数:5颗星 新颖指数:5颗星 💡💡💡Yolov8魔术师,独家首发创新(原创),适用于Yolov5…