Multi-Modal fusion with multi-level attention for Visual Dialog.

scholar.google.com › citations

… -modal fusion with multi-level attention for visual dialog
Zhang · Cited by 16

Multi-Modal fusion with multi-level attention for Visual Dialog

We propose a novel visual dialog method, which focuses on both high-level and low-level information of the dialog history, the question, and the image.

Multi-Modal fusion with multi-level attention for Visual Dialog

www.sciencedirect.com › article › abs › pii

We propose a novel visual dialog method, which focuses on both high-level and low-level information of the dialog history, the question, and the image.

Multi-Modal fusion with multi-level attention for Visual Dialog ...

www.researchgate.net › ... › Dialogical

In our approach, we introduce three low-level attention modules, the goal of which is to enhance the representation of words in the sentence of the dialog ...

Multi-Modal fusion with multi-level attention for Visual Dialog ...

www.connectedpapers.com › main › graph

Connected Papers is a visual tool to help researchers and applied scientists find academic papers relevant to their field of work.

Multi-Modal fusion with multi-level attention for Visual Dialog - IR ...

ir.webis.de › anthology

Multi-Modal fusion with multi-level attention for Visual Dialog. Jingping Zhang, Qiang Wang, Yahong Han. Anthology ID: DBLP:journals/ipm/ZhangWH20; Volume: ...

Multimodal Fusion of Visual Dialog: A Survey - Semantic Scholar

www.semanticscholar.org › paper › Mult...

A comprehensive survey of the recent achievements in the Visual Dialog task and many aspects of multimodal fusion research: Visual Co-reference Resolution, ...

Multimodal Fusion of Visual Dialog: A Survey - ACM Digital Library

dl.acm.org › doi

This survey covers many aspects of multimodal fusion research: Visual Co-reference Resolution, Attention Mechanism, Graph Neural Networks, evaluation issues, ...

Multi-Modal fusion with multi-level attention for Visual Dialog | CoLab

colab.ws › articles › j.ipm.2019.102152

We propose a novel visual dialog method with multi-level attention. • Three high-level attention modules are devised to select important words.

(PDF) Multimodal Fusion of Visual Dialog: A Survey - ResearchGate

www.researchgate.net › ... › Multimodality

Nov 1, 2021 · Visual dialog is a challenging vision-language task in which a series of questions visually grounded by a given image are answered. To resolve ...

The multi-modal fusion in visual question answering - NCBI

www.ncbi.nlm.nih.gov › PMC10280591

May 30, 2023 · We discuss the classification and application of existing attention mechanisms in VQA tasks, analysis their shortcomings, and summarize current improvement ...

Scholarly articles for Multi-Modal fusion with multi-level attention for Visual Dialog.

Multi-Modal fusion with multi-level attention for Visual Dialog

Multi-Modal fusion with multi-level attention for Visual Dialog

Multi-Modal fusion with multi-level attention for Visual Dialog ...

Multi-Modal fusion with multi-level attention for Visual Dialog ...

Multi-Modal fusion with multi-level attention for Visual Dialog - IR ...

Multimodal Fusion of Visual Dialog: A Survey - Semantic Scholar

Multimodal Fusion of Visual Dialog: A Survey - ACM Digital Library

Multi-Modal fusion with multi-level attention for Visual Dialog | CoLab

(PDF) Multimodal Fusion of Visual Dialog: A Survey - ResearchGate

The multi-modal fusion in visual question answering - NCBI