中国科学技术大学先进技术研究院

中科大先研院研究生校内导师简历

刘武特任教授

姓名	刘武
学位
职称	特任教授
所属单位	中国科学技术大学
办公室电话
Email	liuwu@ustc.edu.cn
教育背景	2009.09～2015.07 中科院计算所硕博连读 2014.12～2015.05 美国罗切斯特大学访问研究 2005.09～2009.07 山东大学本科
研究领域	详情请见 https://faculty.ustc.edu.cn/liuwu 多模态内容分析与生成，视频生成模型，社交网络模拟器，通用目标重识别
任职经历	2024.03~至今中国科学技术大学特任教授，博士生导师，IET/BCS Fellow 2018.07～2024.03 京东探索研究院资深研究员 (副总监，正高级职称) 2015.07～2018.07 北京邮电大学计算机学院硕士生导师 2017.11～2018.02 微软亚洲研究院访问学者
获得荣誉、奖项	2025年，《多模态交互式数字人关键技术及产业应用》获得2024年吴文俊人工智能科技进步特等奖（第二完成人） 2024年，入选IET Fellow，以及IET Fellow评审委员会 2024年，连续两年入选斯坦福大学-全球前2%顶尖科学家 2022年，入选国家高层次青年人才计划 2022年，入选《MIT科技评论》亚太区35岁以下科技创新35人 2022年，入选北京市科技新星计划 2021年，天津市科技进步特等奖（排名第四） 2021年，ACM 中国新星奖 2019年， IEEE Multimedia Magazine 2018 Best Paper Award 2019年， IEEE Trans. on Multimedia 2019 Best Paper Award 2018年，CVPR 2018 LIP 人体姿态估计挑战赛单人和多人姿态估计任务两项冠军 2016年，中国科学院优秀博士学位论文奖（省部级） 2015年，中国科学院院长特别奖（省部级）
主持、参与项目	国家自然科学基金区域联合重点项目，项目负责人，2025.1-2028.12 国家重点研发计划项目，项目负责人，2025.1-2027.12 国家自然科学基金青年基金，项目负责人，2017.1-2019.12 中国计算机学会-腾讯“犀牛鸟”科研基金，移动视频检索关键技术研究，项目负责人，2016.10–2018.10
论文、著作、成果	[1] Caoyuan Ma, Yu-Lun Liu, Zhixiang Wang, Wu Liu, Xinchen Liu, Zheng Wang: HumanNeRF-SE: A Simple yet Effective Approach to Animate HumanNeRF with Diverse Poses，CVPR 2024 [2] Yu Sun, Lubing Xu, Qian Bao, Wu Liu, Wenpeng Gao, Yili Fu: Learning Monocular Regression of 3D People in Crowds via Scene-Aware Blending and De-Occlusion. IEEE Trans. Multim. 26: 2289-2302 (2024) [3] Jia Qi, Tengfei Liang, Wu Liu, Yidong Li, Yi Jin: A Generative-Based Image Fusion Strategy for Visible-Infrared Person Re-Identification. IEEE Trans. Circuits Syst. Video Technol. 34(1): 518-533 (2024) [4] Wu Liu, Qian Bao, Yu Sun, Tao Mei: Recent Advances of Monocular 2D and 3D Human Pose Estimation: A Deep Learning Perspective. ACM Comput. Surv. 55(4): 80:1-80:41 (2023) [5] Yu Sun, Qian Bao, Wu Liu, Tao Mei, Michael J. Black，TRACE: Temporal Regression of 5D Avatars with Dynamic Cameras in 3D Environments, CVPR 2023: 8856-8866 [6] Mengxue Qu, Yu Wu, Yunchao Wei, Wu Liu, Xiaodan Liang, Yao Zhao: Learning to Segment Every Referring Object Point by Point, CVPR 2023: 3021-3030 [7] Mengxue Qu, Yu Wu, Wu Liu, Xiaodan Liang, Jingkuan Song, Yao Zhao, Yunchao Wei: RIO: A Benchmark for Reasoning Intention-Oriented Objects in Open Environments. NeurIPS 2023 [8] Jinkai Zheng, Xinchen Liu, Shuai Wang, Lihao Wang, Chenggang Yan, Wu Liu: Parsing is All You Need for Accurate Gait Recognition in the Wild. ACM Multimedia 2023: 116-124 [9] Yu Bai, Bo Zhang, Zheng Zhang, Wu Liu, Jinwen Li, Xiangyang Gong, Wendong Wang: CoCa: A Connectivity-Aware Cascade Framework for Histology Gland Segmentation. ACM Multimedia 2023: 1598-1606 [10] Bo Zhang, Yunpeng Tan, Zheng Zhang, Wu Liu, Hui Gao, Zhijun Xi, Wendong Wang: Factorized Omnidirectional Representation based Vision GNN for Anisotropic 3D Multimodal MR Image Segmentation. ACM Multimedia 2023: 1607-1615 [11] Lingxiao He, Xingyu Liao, Wu Liu, Xinchen Liu, Peng Cheng, Tao Mei: FastReID: A Pytorch Toolbox for General Instance Re-identification. ACM Multimedia 2023: 9664-9667 [12] Tengfei Liang, Yi Jin, Wu Liu, Yidong Li: Cross-Modality Transformer With Modality Mining for Visible-Infrared Person Re-Identification. IEEE Trans. Multim. 25: 8432-8444 (2023) [13] Shanshan Dong, Tian-Zi Niu, Xin Luo, Wu Liu, Xinshun Xu: Semantic Embedding Guided Attention with Explicit Visual Feature Fusion for Video Captioning. ACM Trans. Multim. Comput. Commun. Appl. 19(2): 68:1-68:18 (2023) [14] Wu Liu, Hailin Shi, Yunchao Wei, Dan Zeng, Nicu Sebe, Jiebo Luo: Introduction to the Special Issue on Trustworthy Multimedia Computing and Applications in Urban Scenes. ACM Trans. Multim. Comput. Commun. Appl. 19(6): 211:1-211:4 (2023) [15] Yu Sun, Wu Liu, Qian Bao, Yili Fu, Tao Mei, Michael J. Black: Putting People in their Place: Monocular Regression of 3D People in Depth. CVPR 2022: 13233-13242 [16] Jinkai Zheng, Xinchen Liu, Wu Liu, Lingxiao He, Chenggang Yan, Tao Mei: Gait Recognition in the Wild with Dense 3D Representations and A Benchmark. CVPR 2022: 20196-20205 [17] Mengxue Qu, Yu Wu, Wu Liu, Qiqi Gong, Xiaodan Liang, Olga Russakovsky, Yao Zhao, Yunchao Wei: SiRi: A Simple Selective Retraining Mechanism for Transformer-Based Visual Grounding. ECCV (35) 2022: 546-562 [18] Jinlin Wu, Lingxiao He, Wu Liu, Yang Yang, Zhen Lei, Tao Mei, Stan Z. Li: CAViT: Contextual Alignment Vision Transformer for Video Object Re-identification. ECCV (14) 2022: 549-566 [19] Xiaodong Chen, Wu Liu, Xinchen Liu, Yongdong Zhang, Jungong Han, Tao Mei: MAPLE: Masked Pseudo-Labeling autoEncoder for Semi-supervised Point Cloud Action Recognition. ACM Multimedia 2022: 708-718 [20] Guang Yang, Wu Liu, Xinchen Liu, Xiaoyan Gu, Juan Cao, Jintao Li: Delving into the Frequency: Temporally Consistent Human Motion Transfer in the Fourier Space. ACM Multimedia 2022: 1156-1166 [21] Quanwei Yang, Xinchen Liu, Wu Liu, Hongtao Xie, Xiaoyan Gu, Lingyun Yu, Yongdong Zhang: REMOT: A Region-to-Whole Framework for Realistic Human Motion Transfer. ACM Multimedia 2022: 1128-1137 [22] Jinkai Zheng, Xinchen Liu, Xiaoyan Gu, Yaoqi Sun, Chuang Gan, Jiyong Zhang, Wu Liu, Chenggang Yan: Gait Recognition in the Wild with Multi-hop Temporal Switch. ACM Multimedia 2022: 6136-6145 [23] Kecheng Zheng, Wu Liu, Lingxiao He, Tao Mei, Jiebo Luo, Zheng-Jun Zha: Group-aware Label Transfer for Domain Adaptive Person Re-identification. CVPR 2021: 5310-5319 [24] Yu Sun, Qian Bao, Wu Liu, Yili Fu, Michael Black, and Tao Mei: Monocular, One-stage, Regression of Multiple 3D People. ICCV 2021: 11159-11168 [25] Dan Zeng, Yuhang Huang, Qian Bao, Junjie Zhang, Chi Su, Wu Liu: Neural Architecture Search for Joint Human Parsing and Pose Estimation. ICCV 2021: 11365-11374 [26] Xiaodong Chen, Xinchen Liu, Wu Liu, Yongdong Zhang, Xiao-Ping Zhang, Tao Mei: Explainable Person Re-Identification with Attribute-guided Metric Distillation. ICCV 2021: 11793-11802 [27] Min Ren, Lingxiao He, Xingyu Liao, Wu Liu, Yunlong Wang, Tieniu Tan: Learning Instance-level Spatial-Temporal Patterns for Person Re-identification. ICCV 2021: 14910-14919 [28] Yajun Gao, Tengfei Liang, Yi Jin, Xiaoyan Gu, Wu Liu, Yidong Li, Congyan Lang: MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared Person Re-Identification. ACM MM 2021: 5257-5265 [29] Xiao Wang, Zheng Wang, Wu Liu, Xin Xu, Jing Chen, Chia-Wen Lin, Consistency-Constancy Bi-Knowledge Learning for Pedestrian Detection in Night Surveillance. ACM MM 2021: 4463-4471 [30] Wei Zhang, Lingxiao He, Peng Chen, Xingyu Liao, Wu Liu, Qi Li, Zhenan Sun: Boosting End-to-end Multi-Object Tracking and Person Search via Knowledge Distillation. ACM MM 2021: 1192-1201 [31] Qian Bao, Wu Liu, Yuhao Cheng, Boyan Zhou, Tao Mei: Pose-Guided Tracking-by-Detection: Robust Multi-Person Pose Tracking. IEEE Trans. Multim. 23: 161-175 (2021) [32] Jianyu Yang, Wu Liu, Junsong Yuan, Tao Mei: Hierarchical Soft Quantization for Skeleton-Based Human Action Recognition. IEEE Trans. Multim. 23: 883-898 (2021) [33] Qian Bao, Wu Liu, Jun Hong, Lingyu Duan, Tao Mei, Pose-native Network Architecture Search for Multi-person Human Pose Estimation, ACM MM 2020: 592-600 [34] Kecheng Zheng, Wu Liu, Jiawei Liu, Zheng-Jun Zha, Tao Mei, Hierarchical Gumbel Attention Network for Text-based Person Search, ACM MM 2020: 3441-3449 [35] Xinchen Liu, Wu Liu, Jinkai Zheng, Chenggang Yan, Tao Mei,Beyond the Parts: Learning Multi-view Cross-part Correlation for Vehicle Re-identification, ACM MM 2020: 907-915 [36] Boqiang Xu, Lingxiao He, Xingyu Liao, Wu Liu, Zhenan Sun, Tao Mei, Black Re-ID: A Head-shoulder Descriptor for the Challenging Problem of Person Re-Identification, ACM MM 2020: 673-681 [37] Xiaodong Chen, Wu Liu, Xinchen Liu, Yongdong Zhang, Tao Mei, An Instant and Progressive Cross-modality Person Search System, ACM MM 2020, Demo Paper. [38] Qi Wang, Xinchen Liu, Wu Liu, Wenyin Liu, Tao Mei: MetaSearch: Incremental Product Search via Deep Meta-learning, IEEE Trans. Image Processing 2020, DOI: 10.1109/TIP.2020.3004249 [39] Lingxiao He, Wu Liu: Guided Saliency Feature Learning for Person Re-identification in Crowded Scenes, ECCV 2020: 357-373 [40] Guangrui Li, Guoliang Kang, Wu Liu, Yunchao Wei, Yi Yang: Content-Consistent Matching for Domain Adaptive Semantic Segmentation, ECCV 2020: 440-456 [41] Xiao Wang, Wu Liu, Jun Chen, Xiaobo Wang, Chenggang Yan, Tao Mei: Listen, Look, and Find the One: Robust Person Search with Multimodality Index, ACM Trans. Multimedia Computing, Communications, and Applications 2020, DOI: 10.1145/3380549 [42] Xiao Wang, Jun Chen, Zheng Wang, Wu Liu, Shin’ichi Satoh, Chao Liang, Chia-Wen Lin: When Pedestrian Detection Meets Nighttime Surveillance: A New Benchmark, IJCAI 2020: 509-515 [43] Kun Liu, Wu Liu, Huadong Ma, Mingkui Tan, Chuang Gan: A Real-time Action Representation with Temporal Encoding and Deep Compression. IEEE Trans. CSVT 2020, DOI: 10.1109/TCSVT.2020.2984569 [44] Yu Sun, Yun Ye, Wu Liu, Wenpeng Gao, Yili Fu, Tao Mei, “Skeleton-disentangling based Self-attention Temporal Network for Human 3D Mesh Recovery from Monocular Video”, ICCV 2019: 5349-5358 [45] Lingxiao He, Yinggang Wang, Wu Liu, He Zhao, Zhennan Sun, Jiashi Feng, “Foreground-aware Pyramid Reconstruction for Alignment-free Occluded Person Re-identification”, ICCV 2019: 8449-8458 [46] Xinchen Liu, Wu Liu, Meng Zhang, Jingwen Chen, Lianli Gao, Chenggang Yan, Tao Mei, “Social Relation Recognition from Videos via Multi-scale Spatial-Temporal Reasoning”, CVPR 2019: 3566-3574 [47] Weijian Ruan, Wu Liu, Qian Bao, Jun Chen, Yuhao Cheng and Tao Mei, “POINet: Pose-Guided Ovonic Insight Network for Multi-Person Pose Tracking”, ACM MM 2019: 284-292, Oral paper. [48] Xinchen Liu, Meng Zhang, Wu Liu, Jingkuan Song, Tao Mei: BraidNet: Braiding Semantics and Details for Accurate Human Parsing. ACM Multimedia 2019: 338-346 (CCF A) [49] Xiangpeng Li, Lianli Gao, Xuanhan Wang, Wu Liu, Xing Xu, Heng Tao Shen, Jingkuan Song: Learnable Aggregating Net with Diversity Learning for Video Question Answering. ACM Multimedia 2019: 1166-1174 [50] Meiyu Liang, Junping Du, Wu Liu, Zhe Xue, Yue Geng and Congxian Yang, “Fine-grained Cross-media Representation Learning with Deep Quantization Attention Network”, ACM Multimedia 2019: 1313-1321, Oral paper. [51] Jingkuan Song, Xiaosu Zhu, Lianli Gao, Xin-Shun Xu, Wu Liu, Heng Tao Shen: Deep Recurrent Quantization for Generating Sequential Binary Codes. IJCAI 2019: 912-918 [52] Lianli Gao, Pengpeng Zeng, Jingkuan Song, Yuan-Fang Li, Wu Liu, Tao Mei, Heng Tao Shen: Structured Two-Stream Attention Network for Video Question Answering. AAAI 2019: 6391-6398 [53] Wan-Jin Yu, Zhen-Duo Chen, Xin Luo, Wu Liu, Xin-Shun Xu: DELTA: A deep dual-stream network for multi-label image classification. Pattern Recognition 91: 322-331 (2019) [54] Meng Zhang, Xinchen Liu, Wu Liu, Anfu Zhou, Huadong Ma, Tao Mei, “Multi-Granularity Reasoning for Social Relation Recognition from Images”, ICME 2019: 1618-1623 [55] Kun Liu, Wu Liu, Huadong Ma, Wenbing Huang, Xiongxiong Dong: Generalized zero-shot learning for action recognition with web-scale video data. World Wide Web 22(2): 807-824 (2019) [56] Xinchen Liu, Wu Liu, Tao Mei, Huadong Ma: PROVID: Progressive and Multimodal Vehicle Reidentification for Large-Scale Urban Surveillance. IEEE Trans. Multimedia 20(3): 645-658 (2018) (Best Paper Awards) [57] Huadong Ma, Wu Liu: A Progressive Search Paradigm for the Internet of Things. IEEE MultiMedia 25(1): 76-86 (2018) [58] Wu Liu, Cheng Zhang, Huadong Ma, Shuangqun Li: Learning Efficient Spatial-Temporal Gait Features with Deep Learning for Human Identification. Neuroinformatics 16(3-4): 457-471 (2018) (SCI, IF:3.200) [59] Liang Liu, Wu Liu, Yu Zheng, Huadong Ma, and Cheng Zhang, “Third-Eye: A Mobilephone-Enabled Crowdsensing System for Air Quality Monitoring”, UbiComp 2018: 2(1): 20:1-20:26 [60] Kun Liu, Wu Liu, Chuang Gan, Mingkui Tan, Huadong Ma: T-C3D: Temporal Convolutional 3D Network for Real-Time Action Recognition. AAAI 2018: 7138-7145 [61] Minghui Zhang, Wu Liu, Huadong Ma: Joint License Plate Super-Resolution and Recognition in One Multi-Task Gan Framework. ICASSP 2018: 1443-1447 [62] Shuangqun Li, Wu Liu, Huadong Ma, Shaopeng Zhu: Beyond View Transformation: Cycle-Consistent Global and Partial Perception Gan for View-Invariant Gait Recognition. ICME 2018: 1-6 [63] Wu Liu, Xinchen Liu, Huadong Ma, Peng Cheng: Beyond Human-level License Plate Super-resolution with Progressive Vehicle Search and Domain Priori GAN. ACM Multimedia 2017: 1618-1626 [64] Jinna Lv, Wu Liu, Meng Zhang, He Gong, Bin Wu, Huadong Ma: Multi-feature Fusion for Predicting Social Media Popularity. ACM Multimedia 2017: 1883-1888 (CCF A) [65] Jingkuan Song, Lianli Gao, Zhao Guo, Wu Liu, Dongxiang Zhang, Heng Tao Shen: Hierarchical LSTM with Adjusted Temporal Attention for Video Captioning. IJCAI 2017: 2737-2743 [66] Wu Liu, Huadong Ma, Heng Qi, Dong Zhao, Zhineng Chen, “Deep learning hashing for mobile visual search”, EURASIP J. Image and Video Processing, 2017: 17 (SCI, IF: 1.74) [67] Xinchen Liu, Wu Liu, Tao Mei, and Huadong Ma, “A Progressive Deep Learning-based Approach to Vehicle Re-identification for Urban Surveillance”, ECCV, 2016, pp. 869-884 [68] Xinchen Liu, Wu Liu, Huadong Ma, Huiyuan Fu, “Large-Scale Vehicle Re-Identification in Urban Surveillance Videos”, IEEE ICME, 2016, pp.1-6 (ICME 2016 Best Student Paper) [69] Cheng Zhang, Wu Liu, Huadong Ma, Huiyuan Fu, “Siamese Neural Network Based Gait Recognition for Human Identification”, ICASSP, 2016, pp. 2832-2836 [70] Yihong Gao, Huadong Ma, Wu Liu, and Shui Yu, “Cost Optimal Resource Provisioning for Live Video Forwarding across Video Data Centers”, BIGCOM 2016, pp.27-38 (Best Paper Runner-up) [71] Wu Liu, Tao Mei, Yongdong Zhang, Cherry Che, Jiebo Luo, “Multi-Task Deep Visual-Semantic Embedding for VideoThumbnail Selection”, IEEE CVPR, 2015, pp. 3707-3715 [72] Wu Liu, Tao Mei, Yongdong Zhang. “Instant Mobile Video Search with Layered Audio-Video Indexing and Progressive Transmission,” IEEE Trans. on Multimedia, vol.16, no.8, pp.2242-2255, 2014 [73] Wu Liu, Tao Mei, Yongdong Zhang, Jintao Li and Shipeng Li, “Listen, Look, and Gotcha: Instant Video Search with Mobile Phones by Layered Audio-Video Indexing”，Proc. of ACM Multimedia, 2013, pp. 887-896. (Full paper) [74] Wu Liu, Yongdong Zhang, Sheng Tang, Jinhui Tang, Richang Hong and Jintao Li, “Accurate Estimation of Human Body Orientation From RGB-D Sensors,” IEEE Transactions on Cybernetics, vol.43, no.5, pp.1442-1452, 2013 (SCI, IF:3.236) [75] Wu Liu, Feibin Yang, Yongdong Zhang, Qinghua Huang and Tao Mei, “LAVES: An Instant Mobile Video Search System Based on Layered Audio-Video Indexing,” Proc. of ACM Multimedia, 2013, pp. 409-410. [76] Yicheng Song, Yong-Dong Zhang, Juan Cao, Tian Xia, Wu Liu, Jin-Tao Li, “Web Video Geolocation by Geotagged Social Resources”, IEEE Trans. on Multimedia, 14(2): pp. 456-470, 2012

编辑：徐若兰 2025-03-17 16:04:56