Multimodal Graph Transformer for Multimodal Question Answering

被引：0

作者：

He, Xuehai ^{[1
]}

Wang, Xin Eric ^{[1
]}

机构：

[1] UC Santa Cruz, United States

来源：

EACL 2023 - 17th Conference of the European Chapter of the Association for Computational Linguistics, Proceedings of the Conference | 2023年

关键词：

D O I：

17th Conference of the European Chapter of the Association for Computational Linguistics, EACL 2023

中图分类号：

学科分类号：

摘要：

Computational linguistics - Natural language processing systems - Semantics

引用

页码：189 / 200

共 50 条

[21] Adversarial Multimodal Network for Movie Story Question Answering
Yuan, Zhaoquan
Sun, Siyuan
Duan, Lixin
Li, Changsheng
Wu, Xiao
Xu, Changsheng
IEEE TRANSACTIONS ON MULTIMEDIA, 2021, 23 : 1744 - 1756
[22] MUTAN: Multimodal Tucker Fusion for Visual Question Answering
Ben-younes, Hedi
Cadene, Remi
Cord, Matthieu
Thome, Nicolas
2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV), 2017, : 2631 - 2639
[23] Multimodal Knowledge Reasoning for Enhanced Visual Question Answering
Hussain, Afzaal
Maqsood, Ifrah
Shahzad, Muhammad
Fraz, Muhammad Moazam
2022 16TH INTERNATIONAL CONFERENCE ON SIGNAL-IMAGE TECHNOLOGY & INTERNET-BASED SYSTEMS, SITIS, 2022, : 224 - 230
[24] MUREL: Multimodal Relational Reasoning for Visual Question Answering
Cadene, Remi
Ben-younes, Hedi
Cord, Matthieu
Thome, Nicolas
2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR 2019), 2019, : 1989 - 1998
[25] Health-Oriented Multimodal Food Question Answering
Wang, Jianghai
Hu, Menghao
Song, Yaguang
Yang, Xiaoshan
MULTIMEDIA MODELING, MMM 2023, PT I, 2023, 13833 : 191 - 203
[26] Unifying Text, Tables, and Images for Multimodal Question Answering
Luo, Haohao
Shen, Ying
Deng, Yang
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (EMNLP 2023), 2023, : 9355 - 9367
[27] Multimodal Prompt Retrieval for Generative Visual Question Answering
Ossowski, Timothy
Hu, Junjie
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, ACL 2023, 2023, : 2518 - 2535
[28] Dealing with spoken requests in a multimodal Question Answering system
Gretter, Roberto
Kouylekov, Milen
Negri, Matteo
ARTIFICIAL INTELLIGENCE: METHODOLOGY, SYSTEMS, AND APPLICATIONS, 2008, 5253 : 93 - 102
[29] QAlayout: Question Answering Layout Based on Multimodal Attention for Visual Question Answering on Corporate Document
Mahamoud, Ibrahim Souleiman
Coustaty, Mickael
Joseph, Aurelie
d'Andecy, Vincent Poulain
Ogier, Jean-Marc
DOCUMENT ANALYSIS SYSTEMS, DAS 2022, 2022, 13237 : 659 - 673
[30] VQA-GNN: Reasoning with Multimodal Knowledge via Graph Neural Networks for Visual Question Answering
Wang, Yanan
Yasunaga, Michihiro
Ren, Hongyu
Wada, Shinya
Leskovec, Jure
2023 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV 2023), 2023, : 21525 - 21535

← 1 2 3 4 5 →