Multi-modal Situated Reasoning in 3D Scenes.

AllImages Videos News Maps Shopping Books

[2409.02389] Multi-modal Situated Reasoning in 3D Scenes - arXiv

Sep 4, 2024 · A large-scale multi-modal situated reasoning dataset, scalably collected leveraging 3D scene graphs and vision-language models (VLMs) across a diverse range of ...

Multi-modal Situated Reasoning in 3D Scenes

msr3d.github.io

We introduce a novel interleaved multi-modal input setting in our benchmark to provide both texts, images, and point clouds for situation and question ...

Multi-modal Situated Reasoning in 3D Scenes - arXiv

arxiv.org › html

Sep 4, 2024 · The questions with accurate and unique answers such as existence and counting can be scored according to the 3D scene, situation and question.

Multi-modal Situated Reasoning in 3D Scenes - OpenReview

openreview.net › forum

Nov 13, 2024 · This paper introduces MSQA, a large-scale multi-modal situated reasoning dataset, scalably collected leveraging 3D scene graphs and vision- ...

SQA3D: Situated Question Answering in 3D Scenes - OpenReview

3D-GRAND: A Million-Scale Dataset for 3D-LLMs with Better Grounding...

Situated Spatial Understanding of 3D World in Large Language Model

An Embodied Generalist Agent in 3D World - OpenReview

More results from openreview.net

Multi-modal Situated Reasoning in 3D Scenes - NeurIPS 2024

neurips.cc › virtual › poster

Poster. Multi-modal Situated Reasoning in 3D Scenes. Xiongkun Linghu · Xuesong Niu · Jiangyong Huang · Xiaojian (Shawn) Ma · Baoxiong Jia · Siyuan Huang.

SQA3D

sqa3d.github.io

SQA3D imposes a significant challenge to current multi-modal especially 3D reasoning models. We evaluate various state-of-the-art approaches and find that the ...

Multi-modal Situated Reasoning in 3D Scenes | AI Research Paper Details

www.aimodels.fyi › papers › arxiv › mul...

Sep 4, 2024 · This paper explores multi-modal situated reasoning in 3D scenes, which involves understanding and reasoning about the spatial and semantic ...

AI Papers on X: "Multi-modal Situated Reasoning in 3D Scenes. https://t ...

twitter.com › SciFi › status

Sep 5, 2024 · Situation awareness is essential for understanding and reasoning about 3D scenes in embodied AI agents. However, existing datasets and ...

Multi-modal Situated Reasoning in 3D Scenes - Bytez

bytez.com › docs › neurips › paper

The research introduces a new large dataset called Multi-modal Situated Question Answering (MSQA) for teaching AI how to understand and navigate 3D scenes, ...

[ICLR 2023] SQA3D for embodied scene understanding and reasoning

github.com › SilongYong

SQA3D imposes a significant challenge to current multi-modal especially 3D reasoning models. We evaluate various state-of-the-art approaches and find that the ...