Face Inpainting with Pre-trained Image Transformers

被引：0

作者：

Gonc, Kaan ^{[1
]}

Saglam, Baturay ^{[2
]}

Kozat, Suleyman S. ^{[2
]}

Dibeklioglu, Hamdi ^{[1
]}

机构：

[1] Bilkent Univ, Bilgisayar Muhendisligi Bolumu, Ankara, Turkey

[2] Bilkent Univ, Elekt & Elekt Muhendisligi Bolumu, Ankara, Turkey

来源：

2022 30TH SIGNAL PROCESSING AND COMMUNICATIONS APPLICATIONS CONFERENCE, SIU | 2022年

关键词：

image inpainting; transformers; deep generative models;

D O I：

10.1109/SIU55565.2022.9864676

中图分类号：

TP39 [计算机的应用];

学科分类号：

081203 ; 0835 ;

摘要：

Image inpainting is an underdetermined inverse problem that allows various contents to fill in the missing or damaged regions realistically. Convolutional neural networks (CNNs) are commonly used to create aesthetically pleasing content, yet CNNs have restricted perception fields for collecting global characteristics. Transformers enable long-range relationships to be modeled and different content generated with autoregressive modeling of pixel-sequence distributions using image-level attention mechanism. However, the current approaches to inpainting with transformers are limited to task-specific datasets and require larger-scale data. We introduce an approach to image inpainting by leveraging pre-trained vision transformers to remedy this issue. Experiments show that our approach can outperform CNN-based approaches and have a remarkable performance closer to the task-specific transformer methods.

引用

页数：4

共 50 条

[31] What do pre-trained code models know about code?
Karmakar, Anjan
Robbes, Romain
2021 36TH IEEE/ACM INTERNATIONAL CONFERENCE ON AUTOMATED SOFTWARE ENGINEERING ASE 2021, 2021, : 1332 - 1336
[32] Emotion Classification using Generative Pre-trained Embedding and Machine Learning
Pattun, Geeta
Kumar, Pradeep
2023 IEEE INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND APPLIED NETWORK TECHNOLOGIES, ICMLANT, 2023, : 121 - 126
[33] Simple and Effective Multimodal Learning Based on Pre-Trained Transformer Models
Miyazawa, Kazuki
Kyuragi, Yuta
Nagai, Takayuki
IEEE ACCESS, 2022, 10 : 29821 - 29833
[34] Leveraging Pre-Trained Language Model for Summary Generation on Short Text
Zhao, Shuai
You, Fucheng
Liu, Zeng Yuan
IEEE ACCESS, 2020, 8 : 228798 - 228803
[35] Enhancing radiology report generation through pre-trained language models
Leonardi, Giorgio
Portinale, Luigi
Santomauro, Andrea
PROGRESS IN ARTIFICIAL INTELLIGENCE, 2024,
[36] ON THE CHOICE OF THE OPTIMAL TEMPORAL SUPPORT FOR AUDIO CLASSIFICATION WITH PRE-TRAINED EMBEDDINGS
Quelennec, Aurian
Olvera, Michel
Peeters, Geoffroy
Essid, Slim
2024 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, ICASSP 2024, 2024, : 976 - 980
[37] Face Image Inpainting Algorithm Based on Generative Adversarial Network
Miao, Yalin
Jia, Huanhuan
Liu, Xuemin
Zhang, Yang
Zhao, Liyi
2019 6TH INTERNATIONAL CONFERENCE ON INFORMATION SCIENCE AND CONTROL ENGINEERING (ICISCE 2019), 2019, : 282 - 286
[38] Semantic face image inpainting based on Generative Adversarial Network
Zhang, Heshu
Li, Tao
2020 35TH YOUTH ACADEMIC ANNUAL CONFERENCE OF CHINESE ASSOCIATION OF AUTOMATION (YAC), 2020, : 530 - 535
[39] Multi-Scale Patch Partitioning for Image Inpainting Based on Visual Transformers
Campana, Jose Luis Flores
Decker, Luis Gustavo Lorgus
Roberto e Souza, Marcos
Maia, Helena de Almeida
Pedrini, Helio
2022 35TH SIBGRAPI CONFERENCE ON GRAPHICS, PATTERNS AND IMAGES (SIBGRAPI 2022), 2022, : 180 - 185
[40] ARoBERT: An ASR Robust Pre-Trained Language Model for Spoken Language Understanding
Wang, Chengyu
Dai, Suyang
Wang, Yipeng
Yang, Fei
Qiu, Minghui
Chen, Kehan
Zhou, Wei
Huang, Jun
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 30 : 1207 - 1218

← 1 2 3 4 5 →