Weakly-supervised Temporal Action Localization with Adaptive Clustering and Refining Network

被引：0

作者：

Ren, Hao ^{[1
]}

Ran, Wu ^{[1
]}

Liu, Xingson ^{[1
]}

Ren, Haoran ^{[1
]}

Lu, Hong ^{[1
]}

Zhang, Rui ^{[1
]}

Jin, Cheng ^{[1
,2
]}

机构：

[1] Fudan Univ, Sch Comp Sci, Shanghai Key Lab Intelligent Informat Proc, Shanghai, Peoples R China

[2] Peng Cheng Lab, Shenzhen, Peoples R China

来源：

2023 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO, ICME | 2023年

关键词：

Temporal Action Localization; Weakly-supervised Learning; Adaptive Clustering;

D O I：

10.1109/ICME55011.2023.00177

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

Weakly-supervised temporal action localization task aims to localize temporal boundaries of action instances by using only video-level labels. Existing methods primarily adopt Multi-Instance-Learning (MIL) scheme to handle this task. The effectiveness of MIL scheme depends heavily on the selection of top-k action snippets, which is unstable and requires manual tuning. To address these deficiencies, we propose an Adaptive Clustering and Refining Network (ACRNet). Specifically, we present an action-aware clustering strategy that is adaptable and requires no manual tuning to separate action and background snippets of diverse videos based on intra-class activation distribution. And a cluster refining step is included to eliminate false action snippets by considering inter-class activation distribution, which greatly improves robustness and localization accuracy. Extensive experiments on THUMOS14, ActivityNet 1.2&1.3 benchmarks show that our method achieves state-of-the-art performance.

引用

页码：1008 / 1013

页数：6

共 50 条

[21] Deep Motion Prior for Weakly-Supervised Temporal Action Localization
Cao, Meng
Zhang, Can
Chen, Long
Shou, Mike Zheng
Zou, Yuexian
IEEE Transactions on Image Processing, 2022, 31 : 5203 - 5213
[22] Dynamic Graph Modeling for Weakly-Supervised Temporal Action Localization
Shi, Haichao
Zhang, Xiao-Yu
Li, Changsheng
Gong, Lixing
Li, Yong
Bao, Yongjun
PROCEEDINGS OF THE 30TH ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA, MM 2022, 2022, : 3820 - 3828
[23] Vectorized Evidential Learning for Weakly-Supervised Temporal Action Localization
Gao, Junyu
Chen, Mengyuan
Xu, Changsheng
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2023, 45 (12) : 15949 - 15963
[24] Dynamic Graph Modeling for Weakly-Supervised Temporal Action Localization
Shi, Haichao
Zhang, Xiao-Yu
Li, Changsheng
Gong, Lixing
Li, Yong
Bao, Yongjun
MM 2022 - Proceedings of the 30th ACM International Conference on Multimedia, 2022, : 3820 - 3828
[25] Boosting Weakly-Supervised Temporal Action Localization with Text Information
Li, Guozhang
Cheng, De
Ding, Xinpeng
Wang, Nannan
Wang, Xiaoyu
Gao, Xinbo
2023 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 2023, : 10648 - 10657
[26] Weakly-Supervised Temporal Action Localization by Progressive Complementary Learning
Du, Jia-Run
Feng, Jia-Chang
Lin, Kun-Yu
Hong, Fa-Ting
Qi, Zhongang
Shan, Ying
Hu, Jian-Fang
Zheng, Wei-Shi
IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 2025, 35 (01) : 938 - 952
[27] Complementary adversarial mechanisms for weakly-supervised temporal action localization
Wang, Chuanxu
Wang, Jing
Liu, Peng
PATTERN RECOGNITION, 2023, 139
[28] A Hybrid Attention Mechanism for Weakly-Supervised Temporal Action Localization
Islam, Ashraful
Long, Chengjiang
Radke, Richard
THIRTY-FIFTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, THIRTY-THIRD CONFERENCE ON INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE AND THE ELEVENTH SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2021, 35 : 1637 - 1645
[29] Deep Motion Prior for Weakly-Supervised Temporal Action Localization
Cao, Meng
Zhang, Can
Chen, Long
Shou, Mike Zheng
Zou, Yuexian
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2022, 31 : 5203 - 5213
[30] Weakly-Supervised Temporal Action Localization with Regional Similarity Consistency
Ren, Haoran
Ren, Hao
Lu, Hong
Jin, Cheng
MULTIMEDIA MODELING, MMM 2023, PT I, 2023, 13833 : 69 - 81

← 1 2 3 4 5 →