中国科学技术大学先进技术研究院

中科大先研院研究生校内导师简历

於俊副教授

姓名	於俊
学位	博士
职称	副教授
所属单位	信息科学技术学院 / 自动化系
办公室电话	13856070316
Email	harryjun@ustc.edu.cn
教育背景	(1) 2003-09 至 2010-06, 中国科学技术大学 , 控制科学与工程 , 博士。 (2) 1999-09 至 2003-07, 国防科技大学 , 电子信息工程 , 学士。
研究领域	人工智能、多媒体计算、智能机器人。
任职经历	(1) 2019-12 至现在 , 中国科学技术大学 , 信息科学技术学院 / 自动化系 , 副教授 / 博导。 (2) 2021-03 至现在 , 云知声智能科技股份有限公司(全球AI独角兽) , 首席科学家。 (3) 2016-12 至 2017-12, 美国纽约州立大学 ( 布法罗 ), 工程学院 / 计算机科学与工程系 , 国家公派访问学者。 (4) 2014-03 至 2019-12, 中国科学技术大学 , 信息科学技术学院 / 自动化系 , 副研究员。 (5) 2010-06 至 2014-02, 中国科学技术大学 , 信息科学技术学院 / 自动化系 , 博士后研究员。
获得荣誉、奖项	[1] 第1获奖人荣获国际顶级会议(CVPR_PBVS/ICCV_MFR/ICME/FG)最佳论文奖6项。 [2] 第1获奖人荣获2022年安徽省人工智能科技进步一等奖。 [3] 第2获奖人荣获2019年安徽省自然科学二等奖。 [4] 第1获奖人蝉联荣获2023、2024年中国人工智能学会-华为MindSpore学术奖励基金结题优秀奖励。 [5] 第1获奖人荣获2024年华为ICT优秀教材奖。 [6] 第1获奖人荣获2023年华为昇思卓越指导教师奖。 [7] 第1获奖人荣获2023年网易卓越指导教师奖。 [8] 第1获奖人荣获2023年教育部-华为“智能基座”栋梁之师奖。 [9] 第9获奖人荣获2023年安徽省教学成果一等奖。 [10] 第9获奖人荣获2022年安徽省教学成果一等奖。 [11] 第4获奖人荣获2023年安徽省教学成果一等奖。 [12] 第5获奖人荣获2022年中国高等教育学会“校企合作双百计划”提名奖。 [13] 第1获奖人荣获2016年安徽省自然科学优秀学术论文一等奖。 [14] 第1获奖人荣获2020年中国科学技术大学兴业证券教育奖。 [15] 第1获奖人荣获2024年中国科学技术大学王宽诚育才奖。 [16] 作为唯一指导教师荣获第十九届“挑战杯”全国大学生课外学术科技作品竞赛-揭榜挂帅专项赛-国赛一等奖。 [17] 作为唯一指导教师荣获2022年世界机器人大赛-共融机器人挑战赛-视觉模态无声语音识别冠军。 [18] 作为唯一指导教师荣获2022年世界机器人大赛-共融机器人挑战赛-面部肌电语音识别冠军。 [19] 作为唯一指导教师荣获2023、2024年华为昇思MindSpore杰出开发者2名。 [20] 作为唯一指导教师荣获2023年华为AI创新大赛金奖。 [21] 第1获奖人荣获国际著名AI挑战赛(NeurIPS/CVPR/ICCV/MM/AAAI/IJCAI/ECCV等)冠亚季军109项：98金/8银/3铜。 [22] 第1获奖人在中国科学技术大学历年考核中荣获6次“特别优秀”奖励。
主持、参与项目	项目负责人主持国家和省部级等科研项目共25项，主持项目总经费2500余万元，其中国家自然科学基金项目5项。子课题负责人参与国家和省部级等科研项目共6项，参与项目总经费9500余万元。
论文、著作、成果	近五年代表性论著：国际期刊 [1] Xiaobo Xia#, Pengqian Lu, Chen Gong, Bo Han, Jun Yu, et al., Regularly Truncated M-estimators for Learning with Noisy Labels, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 46, no. 5, pp. 3522-3536, 2024. [2] Songhua Wu#, Tianyi Zhou, Yuxuan Du, Jun Yu, et al., A Time-Consistency Curriculum for Learning from Instance-Dependent Noisy Labels, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 46, no. 7, pp. 4830-4842, 2024. [3] Yexiong Lin#, Yu Yao, Zhaoqing Wang, Xu Shen, Jun Yu, et al., Improving the Instance-Dependent Transition Matrix Estimation by Exploiting Self-Supervised Learning, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024, Accept. [4] Chaojian Yu#, Dawei Zhou, Li Shen, Jun Yu, et al., Strength-Adaptive Adversarial Training, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024, Accept. [5] Jingyi Wang#, Xiaobo Xia, Long Lan, Xinghao Wu, Jun Yu, et al., Tackling Noisy Labels with Network Parameter Additive Decomposition, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 46, no. 9, pp. 6341-6354, 2024. [6] Chaojian Yu#, Runqi Lin, Jun Yu, et al., Do Adversarially Robust Models Learn Better Feature Representations? IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024, Under Review. [7] Zhuo Huang#, Muyang Li, Li Shen, Jun Yu, et al., Winning Prize Comes from Losing Tickets: Improve Invariant Learning by Exploring Variant Parameters for Out-of-Distribution Generalization, International Journal of Computer Vision, vol. 133, pp. 456-474, 2025. [8] Songhua Wu#, Tongliang Liu, Bo Han, Jun Yu, Guodong Long, Gang Niu, Masashi Sugiyama, Learning from Noisy Pairwise Similarity and Unlabeled Data, Journal of Machine Learning Research, vol. 23, no. 307, pp. 1-34, 2022. [9] Yuhao Wu#, Xiaobo Xia, Jun Yu, Bo Han, Gang Niu, et al., Making Binary Classification from Multiple Unlabeled Datasets Almost Free of Supervision, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024, Under Review. [10] Lingyun Yu#, Jun Yu, Qiang Ling, BLTRCNN-Based 3-D Articulatory Movement Prediction: Learning Articulatory Synchronicity from Both Text and Audio Inputs, IEEE Transactions on Multimedia, vol. 21, no. 7, pp. 1621-1632, 2019. [11] Changwei Luo#, Juyong Zhang, Jun Yu, Chang Wen Chen, Shengjin Wang, Real-Time Head Pose Estimation and Face Modeling from a Depth Image, IEEE Transactions on Multimedia, vol. 21, no. 10, pp. 2473-2481, 2019. [12] Jun Yu#, Qiang Ling, Changwei Luo, Chang Wen Chen, Synthesizing 3D Trump: Predicting and Visualizing the Relationship between Text, Speech and Articulatory Movements, IEEE/ACM Transactions on Acoustic, Speech and Language Processing, vol. 27, no. 12, pp. 2223-2233, 2019. [13] Ye Yu#, Hua Li, Jun Wang, Hai Min, Wei Jia, Jun Yu, Chang Wen Chen, A Multilayer Pyramid Network Based on Learning for Vehicle Logo Recognition, IEEE Transactions on Intelligent Transportation Systems, vol. 22, no. 5, pp. 3123-3134, 2021. [14] Zhaoyu Zhang#, Mengyan Li, Haonian Xie, Jun Yu, Chang Wen Chen, TWGAN: Twin Discriminator Generative Adversarial Networks, IEEE Transactions on Multimedia, vol. 24, pp. 677-688, 2022. [15] Zhengning Wu#, Xiaobo Xia, Ruxin Wang, Jiatong Li, Jun Yu, et al., LR-SVM+: Learning Using Privileged Information with Noisy Labels, IEEE Transactions on Multimedia, vol. 24, pp. 1080-1092, 2022. [16] Mengyan Li#, Zhaoyu Zhang, Jun Yu, Chang Wen Chen, Learning Face Image Super-Resolution through Facial Semantic Attribute Transformation and Self-Attentive Structure Enhancement, IEEE Transactions on Multimedia, vol. 23, pp. 468-483, 2021. [17] Zhengning Wu#, Tianyu He, Xiaobo Xia, Jun Yu, et al., Conditional Consistency Regularization for Semi-Supervised Multi-label Image Classification, IEEE Transactions on Multimedia, vol. 26, pp. 4206-4216, 2024. [18] Jun Yu#, Zhongpeng Cai, Yihao Li, Lei Wang, Fang Gao, Ye Yu, Language-guided Dual-modal Local Correspondence for Single Object Tracking, IEEE Transactions on Multimedia, vol. 26, pp. 10637-10650, 2024. [19] Jun Yu#, Guochen Xie, Quansheng Liu, Lei Wang, Fang Gao, Wei Xu, Contrastive Learning with Multiple Prototypes for Unsupervised Domain Adaptive Semantic Segmentation, IEEE Transactions on Multimedia, 2025, DOI: 10.1109/TMM.2025.3534115. [20] Lingyun Yu#, Jun Yu, Mengyan Li, Qiang Ling, Multimodal Inputs Driven Talking Face Generation with Spatial-Temporal Dependency, IEEE Transactions on Circuits and Systems for Video Technology, vol. 31, no. 1, pp. 203-216, 2021. [21] Ye Yu#, Zifu Yuan, Wei Jia, Jun Yu, Embedding Pose Information for Multiview Vehicle Model Recognition, IEEE Transactions on Circuits and Systems for Video Technology, vol. 32, no. 8, pp. 5467-5460, 2022. [22] Yan Jin#, Fang Gao, Jun Yu, Jiabao Wang, Feng Shuang, Multi-object Tracking: Decoupling Features to Solve the Contradictory Dilemma of Feature Requirements, IEEE Transactions on Circuits and Systems for Video Technology, vol. 33, no. 9, pp. 5117-5132, 2023. [23] Yongrui Li#, Jun Yu, Zengfu Wang, Densely Enhanced Semantic Network for Conversation System in Social Media, ACM Transactions on Multimedia Computing, Communications, and Applications, vol. 18, no. 4, pp. 1-24, 2022. [24] Mengyan Li#, Zhaoyu Zhang, Guochen Xie, Jun Yu, A Deep Learning Approach for Face Hallucination Guided by Facial Boundary Responses, ACM Transactions on Multimedia Computing, Communications, and Applications, vol. 16, no. 1, pp. 1-23, 2020. [25] Xinjian Gao#, Yuyu Liu, Jun Yu, Multimodal Visual-Semantic Representations Learning for Scene Text Recognition, ACM Transactions on Multimedia Computing, Communications, and Applications, vol. 20, no. 7, pp. 1-18, 2024. [26] Peng He#, Jun Yu, Domain-Separated Bottleneck Attention Fusion Framework for Multimodal Emotion Recognition, ACM Transactions on Multimedia Computing, Communications, and Applications, 2024, DOI: 10.1145/3711865. [27] Jun Yu#, Zengfu Wang, A Video, Text and Speech-Driven Realistic 3-D Virtual Head for Human-Machine Interface, IEEE Transactions on Cybernetics, vol. 45, no. 5, pp. 977-988, 2015. [28] Jun Yu#, Chen Jiang, Rui Li, Changwei Luo, Zengfu Wang, Real-Time 3-D Facial Animation: From Appearance to Internal Articulators, IEEE Transactions on Circuits and Systems for Video Technology, vol. 28, no. 4, pp. 920-932, 2018. [29] Chunlin Chen#, Jun Yu, Qiang Ling, Sparse Attention Block: Aggregating Contextual Information for Object Detection, Pattern Recognition, vol. 124, pp. 1084-1102, 2022. [30] Haifeng Zhang#, Wen Su, Jun Yu, Identity-Expression Dual Branch Network for Facial Expression Recognition, IEEE Transactions on Cognitive and Developmental System, vol. 13, no. 4, pp. 898-911, 2021. [31] Cong Wang#, Yang Luo, Wenzhuo Du, Ke Wang, Jun Yu, Faster and Stronger: Unleashing Data Processing Potential through Hardware Heterogeneity, IEEE Internet of Things Journal, 2025, DOI: 10.1109/JIOT.2025.3526662. [32] Fang Gao#, Wenjie Wu, Jin Yan, Jingfeng Tang, Hanbo Zheng, Shengheng Ma, Jun Yu, Feng Shuang, TVTracker: Target-Adaptive Text-Guided Visual Fusion for Multi-Modal RGB-T Tracking, IEEE Internet of Things Journal, 2025, Accept. [33] Fang Gao#, Rongzhao Hu, Linfei Yin, Huibin Cao, Jun Yu, Feng Shuang, Quantum Grover Search-inspired Global Maximum Power Point Tracking for Photovoltaic Systems under Partial Shading Conditions, IEEE Transactions on Sustainable Energy, vol. 15, no. 3, pp. 1601-1613, 2024. [34] Fengxin Chen#, Ye Yu, Jun Yi, Ting Zhang, Ji Zhao, Wei Jia, Jun Yu, MCLL-Diff: Multi-conditional Low-Light Image Enhancement Based on Diffusion Probabilistic Models, IEEE Sensors Journal, DOI: 0.1109/JSEN.2025.3534566. [35] Fang Gao#, Jingfeng Tang, Jiabao Wang, Shaodong Li, Jun Yu, Enhancing Scene Understanding for Vision-and-Language Navigation by Knowledge Awareness, IEEE Robotics and Automation Letters, vol. 9, no. 12, pp. 10874-10881, 2024. [36] Fang Gao#, Rongwei Zhang, Jun Yu, et al., Pin-CasNet: Detecting Pin Status in Transmission Lines Based on Cascade Network, Engineering Applications of Artificial Intelligence, vol. 127, pp. 1-12, 2024. [37] Hao Chang#, Guochen Xie, Jun Yu, A Viable Framework for Semi-supervised Learning on Realistic Dataset, Machine Learning, vol. 112, pp. 1847-1869, 2023. [38] Jialiang Shen#, Yu Yao, Shaoli Huang, Zhiyong Wang, Ruxin Wang, Jun Yu, et al., ProtoSimi: Label Correction for Fine-Grained Visual Categorization, Machine Learning, vol. 112, pp. 2541-2565, 2023. [39] Wen Su#, Jun Yu, Monocular Depth Estimation with Spatially Coherent Sliced Network, Image and Vision Computing, vol. 124, pp. 1-10, 2022. [40] Cong Wang#, Ke Wang, Fan Yu, Jun Yu, Breaking Barriers in 3D Point Cloud Data Processing: A Unified System for Efficient Storage and High-Throughput Loading, Expert Systems with Applications, 2025, Accept. [41] Junjie Zhang#, Feng Zhao, Hanqiang Liu, Jun Yu, Data and Knowledge-driven Deep Multiview Fusion Network Based on Diffusion Model for Hyperspectral Image Classification, Expert Systems with Applications, vol. 249, pp. 1-18, 2024. [42] Fang Gao#, Yong Liu, Pengbo Shi, Yan Jin, Jun Yu, Shaodong Li, Dual-scale Point Cloud Completion Network Based on High-frequency Feature Fusion, Image and Vision Computing, vol. 139, pp. 1-14, 2023. [43] Yiwei Zhang#, Renbin Su, Jun Yu, Rui Li, 3D Facial Modeling, Animation, and Rendering for Digital Humans: A Survey, Neurocomputing, vol. 598, pp. 1-13, 2024. [44] Wen Su#, Jiawei Chen, Mengjiao Ge, Ye He, Jun Yu, To-Former: Semantic Segmentation of Transparent Object with Edge Enhanced Transformer, The Visual Computer, vol. 41, pp. 1811-1825, 2025. 国际会议 [1] Jun Yu#, Chang Wen Chen, Zengfu Wang, 3D Singing Head for Music VR: Learning External and Internal Articulatory Synchronicity from Lyric, Audio and Notes, ACM International Conference on Multimedia, 2019, pp. 945-952. [2] Jun Yu#, Peng He, Ziqi Peng, FSR-Net: Deep Fourier Network for Shadow Removal, ACM International Conference on Multimedia, 2023, pp. 2335-2343. [3] Jun Yu#, Keda Lu, Zhihong Wei, Ji Zhao, Iek-Heng Chu, Peng Chang, Dialogue Cross-Enhanced Central Engagement Attention Model for Real-Time Engagement Estimation, International Joint Conference on Artificial Intelligence, 2024, pp. 3187-3195. [4] Yanzhen Chen#, Jun Yu, Classic but Everlasting: Traditional Gradient-Based Algorithms Converges Fast Even in Time-Varying Multi-Player Games, International Conference on Learning Representation, 2025, pp. 1-37. [5] Ye Yu#, Fengxin Chen, Jun Yu, Zhen Kan, LMT-GP: Combined Latent Mean-Teacher and Gaussian Process for Semi-supervised Low-light Image Enhancement, European Conference on Computer Vision, 2024, pp. 261-279. [6] Zerui Zhang#, Jun Yu, et al., Part-level Reconstruction for Self-Supervised Category-level 6D Object Pose Estimation with Coarse-to-Fine Correspondence Optimization, ACM International Conference on Multimedia, 2024, pp. 9980-9988. [7] Zhuo Huang#, Miaoxi Zhu, Li Shen, Jun Yu, Robust Generalization against Photon-Limited Corruptions via Worst-Case Sharpness Minimization, IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023, pp. 16175-16185. [8] Xiaobo Xia#, Bo Han, Yibing Zhan, Jun Yu, et al., Combating Noisy Labels with Sample Selection by Mining High-Discrepancy Examples, IEEE/CVF International Conference on Computer Vision, 2023, pp. 1833-1843. [9] Jun Yu#, A Real-Time Music VR System for 3D External and Internal Articulators, IEEE Virtual Reality, 2019, pp. 1259-1260. [10] Jun Yu#, Guochen Xie, Mengyan Li, Haonian Xie, Xinlong Hao, Fang Gao, Feng Shuang, Attention Based Beauty Product Retrieval Using Global and Local Descriptors, ACM International Conference on Multimedia, 2020, pp. 4708-4712. [11] Jun Yu#, Guochen Xie, Mengyan Li, Haonian Xie, Lingyun Yu, Beauty Product Retrieval Based on Regional Maximum Activation of Convolutions with Generalized Attention, ACM International Conference on Multimedia, 2019, pp. 2553-2557. [12] Jun Yu#, Guochen Xie, Zhongpeng Cai, Peng He, Fang Gao, Qiang Ling, Micro-expression Generation with Thin-plate Spline Motion Model and Face Parsing, ACM International Conference on Multimedia, 2022, pp. 7210-7214. [13] Jun Yu#, Zhongpeng Cai, Zepeng Liu, Guochen Xie, Peng He, Facial Expression Spotting Based on Optical Flow Features, ACM International Conference on Multimedia, 2022, pp. 7205-7209. [14] Jun Yu#, Ji Zhao, Guochen Xie, Leveraging the Latent Diffusion Models for Offline Facial Multiple Appropriate Reaction Generation, ACM International Conference on Multimedia, 2023, pp. 9561-9565. [15] Jun Yu#, Mohan Jing, Bingyuan Zhang, Jiaen Liang, Answer-Based Entity Extraction and Alignment for Visual Text Question Answering, ACM International Conference on Multimedia, 2023, pp. 9487-9491. [16] Jun Yu#, et al., Efficient Micro-expression Spotting Based on Main Directional Mean Optical Flow Feature, ACM International Conference on Multimedia, 2023, pp. 9541-9545. [17] Jun Yu#, Keda Lu, et al., Sliding Window Seq2seq Modeling for Engagement Estimation, ACM International Conference on Multimedia, 2023, pp. 9496-9500. [18] Jun Yu#, Mohan Jing, et al., End-to-end Spatial-Temporal Information Aggregation for Micro-Action Detection, ACM International Conference on Multimedia, 2024, pp. 11306-11312. [19] Jun Yu#, Yunxiang Zhang, et al., RAG-Guided Large Language Models for Visual Spatial Description with Adaptive Hallucination Corrector, ACM International Conference on Multimedia, 2024, pp. 11407-11413. [20] Jun Yu#, Keda Lu, et al., Multi-Domain Engagement Estimation Using Aligned Interlocutor-BiLSTM, ACM International Conference on Multimedia, 2024, DOI: 10.1145/3674955.3681937. [21] Yifan Wang#, Jun Yu, et al., Building Robust Video-level Deepfake Detection via Audio-Visual Local-Global Interactions, ACM International Conference on Multimedia, 2024, pp. 11370-11376. [22] Jun Yu#, Gongpeng Zhao, et al., Temporal-Informative Adapters in VideoMAE V2 and Multi-Scale Feature Fusion for Micro-Expression Spotting-then-Recognize, ACM International Conference on Multimedia, 2024, pp. 11484-11489. [23] Jun Yu#, Yaohui Zhang, et al., Micro-Expression Spotting Based on Optical Flow Feature with Boundary Calibration, ACM International Conference on Multimedia, 2024, pp. 11490-11496. [24] Jiabo Wang#, Fang Gao, Jingfeng Tang, Shaodong Li, Hanbo Zheng, Shengheng Ma, Feng Shuang, Jun Yu, A Method for Visual Spatial Description Based on Large Language Model Fine-tuning, ACM International Conference on Multimedia, 2024, pp. 11414-11419. [25] Chaojian Yu#, Bo Han, Shen Li, Jun Yu, et al., Understanding Robust Overfitting of Adversarial Training and Beyond, International Conference on Machine Learning, 2022, pp. 17-23. [26] Zhaoyu Zhang#, Mengyan Li, Jun Yu, On the Convergence and Mode Collapse of GAN, SIGGRAPH ASIA, 2018, pp. 84-87. [27] Zhaoyu Zhang#, Jun Yu, STDGAN: ResBlock Based Generative Adversarial Nets Using Spectral Normalization and Two Different Discriminators, ACM International Conference on Multimedia, 2019, pp. 674-682. [28] Haifeng Zhang#, Wen Su, Jun Yu, Weakly Supervised Local-Global Relation Network for Facial Expression Recognition, International Joint Conference on Artificial Intelligence, 2020, pp. 1040-1046. [29] Yongrui Li#, Linghua Xiang, Jun Yu, Fine-Grained Language Identification in Scene Text Images, ACM International Conference on Multimedia, 2021, pp. 4573-4581. [30] Jun Yu#, Hao Chang, Keda Lu, Mining Limited Data for More Robust and Generalized ML Models, AAAI Conference on Artificial Intelligence, 2022, pp. 1-6. [31] Fengzhao Sun#, Jun Yu, Towards Robust Autonomous Driving: Conditional Multimodal Large Language Models for Fine-Grained Perception, IEEE International Conference on Robotics and Automation, 2025, Accept. [32] Haoteng Li#, Gongpeng Zhao, Jun Yu, DualDiff: Dual-branch Diffusion Model for Autonomous Driving with Semantic Fusion, IEEE International Conference on Robotics and Automation, 2025, Accept. [33] Yu Yao#, Mingming Gong, Yuxuan Du, Jun Yu, Bo Han, Kun Zhang, Tongliang Liu, Which is Better for Learning with Noisy Labels: The Semi-supervised Method or Modeling Label Noise? International Conference on Machine Learning, 2023, pp. 1-14. [34] Yuhao Wu#, Jiangchao Yao, Xiaobo Xia, Jun Yu, et al., Mitigating Label Noise on Graphs via Topological Sample Selection, International Conference on Machine Learning, 2024, pp. 1-29. [35] Muyang Li#, Xiaobo Xia, Runze Wu, Fengming Huang, Jun Yu, Bo Han, Tongliang Liu, Towards Realistic Model Selection for Semi-supervised Learning, International Conference on Machine Learning, 2024, pp. 1-13. [36] Dawei Zhou#, Nanan Wang, Chunlei Peng, Xinbo Gao, Xiaoyu Wang, Jun Yu, et al., Removing Adversarial Noise in Class Activation Feature Space, IEEE/CVF International Conference on Computer Vision, 2021, pp. 7878-7887. [37] Muyang Li#, Runze Wu, Haoyu Liu, Jun Yu, et al., InstanT: Semi-supervised Learning with Instance-dependent Thresholds, Thirty-seventh Conference on Neural Information Processing System, 2023, pp. 1-17. [38] Zhuo Huang#, Li Shen, Jun Yu, et al., FlatMatch: Bridging Labeled Data and Unlabeled Data with Cross-Sharpness for Semi-Supervised Learning, Thirty-seventh Conference on Neural Information Processing System, 2023, pp. 1-21. [39] Yingbin Bai#, Zhongyi Han, Erkun Yang, Jun Yu, et al., Subclass-Dominant Label Noise: A Counterexample for the Success of Early Stopping, Thirty-seventh Conference on Neural Information Processing System, 2023, pp. 1-24. [40] Xiaobo Xia#, Jun Yu, Gang Niu, Tongliang Liu, Sample Selection with Uncertainty of Losses for Learning with Noisy Labels, International Conference on Learning Representation, 2022, pp. 1-23. [41] Xiaobo Xia#, Jiale Liu, Jun Yu, Xu Shen, Bo Han, Tongliang Liu, Moderate Coreset: A Universal Method of Data Selection for Real-world Data-efficient Deep Learning, International Conference on Learning Representation, 2023, pp. 1-20. [42] Zhaoqing Wang#, Ziyu Chen, Yaqian Li, Yandong Guo, Jun Yu, Mingming Gong, Tongliang Liu, Mosaic Representation Learning for Self-supervised Visual Pre-training, International Conference on Learning Representation, 2023, pp. 1-16. [43] Cong Lei#, Yuxuan Du, Peng Mi, Jun Yu, Tongliang Liu, Neural Auto-designer for Enhanced Quantum Kernels, International Conference on Learning Representation, 2024, pp. 1-25. [44] Jun Yu#, Yongqi Wang, et al., Interactive Multimodal Framework with Temporal Modeling for Emotion Recognition, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2025, Accept. [45] Jun Yu#, Yang Zheng, et al., Cross-Modal Facial Expression Recognition with Global Channel-Spatial Attention: Modal Enhancement and Proportional Criterion Fusion, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2025, Accept. [46] Jun Yu#, Yunxiang Zhang, et al., Towards Robust Multimodal AU Detection: STN-Enhanced Visual Encoding and Audio-Visual Spatial-Temporal Alignment, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2025, Accept. [47] Jun Yu#, Lingsi Zhu, et al., Dual-Stage Cross-Modal Network with Dynamic Feature Fusion for Emotional Mimicry Intensity Estimation, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2025, Accept. [48] Jun Yu#, Xilong Lu, et al., Robust Stage-Wise LVLM Adaptation: Multi-Phase Prompt Lora Fine-tuning for Compound Expression Recognition, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2025, Accept. [49] Jun Yu#, Liwen Zhang, Shenshen Du, Hao Chang, Keda Lu, Zhong Zhang, Ye Yu, Lei Wang, Qiang Ling, Pseudo-label Generation and Various Data Augmentation for Semi-Supervised Hyperspectral Object Detection, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2022, pp. 304-311. [50] Aneesh Rangnekar#, Zachary Mulhollan, Jun Yu, Semi-Supervised Hyperspectral Object Detection Challenge Results, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2022, pp. 389-397. [51] Jun Yu#, Keda Lu, Shenshen Du, et al., MvAV-pix2pixHD: Multi-view Aerial View Image Translation, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2024, pp. 3066-3075. [52] Jun Yu#, Zerui Zhang, Zhihong Wei, et al., AUD-TGN: Advancing Action Unit Detection with Temporal Convolution and GPT-2 in Wild Audiovisual Contexts, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2024, pp. 4814-4821. [53] Jun Yu#, Gongpeng Zhao, Yongqi Wang, et al., Improving Valence-Arousal Estimation with Spatiotemporal Relationship Learning and Multimodal Fusion, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2024, pp. 7878-7885. [54] Jun Yu#, Wangyuan Zhu, Jichao Zhu, et al., Efficient Feature Extraction and Late Fusion Strategy for Audiovisual Emotional Mimicry Intensity Estimation, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2024, pp. 4866-4872. [55] Jun Yu#, Jichao Zhu, Wangyuan Zhu, et al., Multi Model Ensemble for Compound Expression Recognition, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2024, pp. 4873-4879. [56] Jun Yu#, Zhihong Wei, Zhongpeng Cai, et al., Exploring Facial Expression Recognition through Semi-Supervised Pre-training and Temporal Modeling, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2024, pp. 4880-4887. [57] Jun Yu#, Jichao Zhu, Wangyuan Zhu, Zhongpeng Cai, Guochen Xie, A Dual Branch Network for Emotional Reaction Intensity Estimation, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2023, pp. 5810-5817. [58] Jun Yu#, Zhongpeng Cai, Renda Li, Gongpeng Zhao, Guochen Xie, Exploring Large-scale Unlabeled Faces to Enhance Facial Expression Recognition, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2023, pp. 5802-5809. [59] Jun Yu#, Renda Li, Gongpeng Zhao, Zhongpeng Cai, Guochen Xie, Local Region Perception and Relationship Learning Combined with Feature Fusion for Facial Action Unit Detection, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2023, pp. 5784-5791. [60] Jun Yu#, Yihao Li, Cross-modal Target Retrieval for Tracking by Natural Language, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2022, pp. 4931-4940. [61] Jianrui Cai#, Jun Yu, et al., NTIRE 2019 Challenge on Real Image Super-Resolution: Methods and Results, IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop, 2019, pp. 796-808. [62] Jun Yu#, Xinlong Hao, Peng He, et al., Boosting Fairness for Masked Face Recognition, IEEE/CVF International Conference on Computer Vision Workshop, 2021, pp. 1531-1540. [63] Jun Yu#, Xinlong Hao, Peng He, Single-stage Face Detection under Extremely Low-light Conditions, IEEE/CVF International Conference on Computer Vision Workshop, 2021, pp. 3523-3532. [64] Jun Yu#, Shenshen Du, Haoxiang Shi, Responsive Listening Head Synthesis with 3DMM and Dual-Stream Prediction Network, ACM International Conference on Multimedia Workshop, 2023, pp. 137-143. [65] Jun Yu#, Wangyuan Zhu, et al., MMT-GD: Multi-Modal Transformer with Graph Distillation for Cross-Cultural Humor Detection, ACM International Conference on Multimedia Workshop, 2023, pp. 43-49. [66] Jun Yu#, Shenshen Du, et al., Image- and Instance-Level Data Augmentation for Occluded Instance Segmentation, ACM International Conference on Multimedia Workshop, 2023, pp. 137-142. [67] Jun Yu#, Leilei Wang, et al., Relative Boundary Modeling: A High-Resolution Cricket Bowl Release Detection Framework with I3D Features, ACM International Conference on Multimedia Workshop, 2023, pp. 151-159. [68] Jun Yu#, Renda Li, Renjie Lu, et al., Exploring Loss Function and Rank Fusion for Enhanced Person Re-identification, ACM International Conference on Multimedia Workshop, 2023, pp. 143-150. [69] Jun Yu#, Xinlong Hao, Haonian Xie, Ye Yu, Fair Face Recognition Using Data Balancing, Enhancement and Fusion, European Conference on Computer Vision Workshop, 2020, pp. 492-505. [70] Zhaoyu Zhang#, Changwei Luo, Jun Yu, Towards the Gradient Vanishing, Divergence Mismatching and Mode Collapse of Generative Adversarial Nets, ACM International Conference on Information and Knowledge Management, 2019, pp. 2377-2380. [71] Yongrui Li#, Jun Yu, Zengfu Wang, Dense Semantic Matching Network for Multi-Turn Conversation, IEEE International Conference on Data Mining, 2019, pp. 1186-1191. [72] Lingyun Yu#, Jun Yu, Qiang Ling, Mining Audio, Text and Visual Information for Talking Face Generation, IEEE International Conference on Data Mining, 2019, pp. 787-795. [73] Jun Yu#, Xinlong Hao, Xinjian Gao, Qiang Sun, Yuyu Liu, Peng Chang, Zhong Zhang, Fang Gao, Feng Shuang, Radar Object Detection Using Data Merging, Enhancement and Fusion, ACM International Conference on Multimedia Retrieval, 2021, pp. 566-572. [74] Xiaohua Qi#, Renda Li, Qiang Ling, Jun Yu, Data-free Knowledge Distillation with Diffusion Models, IEEE International Conference on Multimedia Expo, 2025, Accept. [75] Leilei Wang#, Renjie Lu, Fengzhao Sun, Yunxiang Zhang, Jun Yu, Optimization of Multimodal Inputs Based on Diffusion Models: Zero-Shot Semantic Image Generation, IEEE International Conference on Multimedia Expo, 2025, Accept. [76] Xinjian Gao#, Yuyu Liu, Jun Yu, DBCAN: Dual-Branch Cross-Attention Network for Scene Text Recognition, IEEE International Conference on Multimedia Expo, 2022, pp. 1-6. [77] Jun Yu#, Haonian Xie, Guochen Xie, Mengyan Li, Zengfu Wang, Multi-Scale Densely U-Nets Refine Network for Face Alignment, IEEE International Conference on Multimedia Expo, 2019, pp. 691-694. [78] Jun Yu#, Haonian Xie, Mobile Centernet for Embedded Deep Learning Object Detection, IEEE International Conference on Multimedia Expo, 2020, pp. 1-6. [79] Liuxue Liu#, Chengdao Pu, Jun Yu, Image Harmonization Based on Hierarchical Dynamics, IEEE International Conference on Acoustic, Speech and Signal Processing, 2023, pp. 3445-3449. [80] Bingyuan Zhang#, Xulong Zhang, Ning Cheng, Jun Yu, Jing Xiao, Jianzong Wang, Emotalker: Emotionally Editable Talking Face Generation via Diffusion Model, IEEE International Conference on Acoustic, Speech and Signal Processing, 2024, pp. 8276-8280. [81] Zhaoyu Zhang#, Mengyan Li, Jun Yu, D2PGGAN: Two Discriminators Used in Progressive Growing of GANs, IEEE International Conference on Acoustic, Speech and Signal Processing, 2019, pp. 3177-3181. [82] Mengyan Li#, Yuechuan Sun, Zhaoyu Zhang, Haonian Xie, Jun Yu, Deep Learning Face Hallucination via Attributes Transfer and Enhancement, IEEE International Conference on Multimedia Expo, 2019, pp. 604-609. [83] Jun Yu#, Zengfu Wang, A Real-time 3D Head Mesh Modeling and Expressive Articulatory Animation System, IEEE International Conference on Acoustic, Speech and Signal Processing, 2017, pp. 2946-2950. [84] Jun Yu#, Chang Wen Chen, From Talking Head to Singing Head: A Significant Enhancement for More Natural Human Computer Interaction, IEEE International Conference on Multimedia Expo, 2017, pp. 511-516. [85] Chengdao Pu#, Jun Yu, Wen Su, Tianyu Liu, Rotated R-CNN: A Two-Stage Object Detection Method Adapted to Oriented Bounding Boxes, IEEE International Conference on Image Processing, 2024, pp. 256-262. [86] Haoxiang Shi#, Ziqi Liang, Jun Yu, Emotional Cues Extraction and Fusion for Multi-modal Emotion Prediction and Recognition in Conversation, INTERSPEECH, 2024, pp. 4074-4078. [87] Haoxiang Shi#, Xulong Zhang, Ning Cheng, Yong Zhang, Jun Yu, Jing Xiao, Jianzong Wang, Enhancing Emotion Recognition in Conversation Through Emotional Cross-Modal Fusion and Inter-class Contrastive Learning, International Conference on Intelligent Computing, 2024, pp. 391-401. [88] Haoxiang Shi#, Jianzong Wang, Xulong Zhang, Ning Cheng, Jun Yu, Jing Xiao, RSET: Remapping-Based Sorting Method for Emotion Transfer Speech Synthesis, Asia-Pacific Web (APWeb) and Web-Age Information Management (WAIM) Joint International Conference on Web and Big Data, 2024, pp. 90-104. [89] Bingyuan Zhang#, Jun Yu, Logic Consistency Makes Large Language Models Personalized Reasoning Teachers, International Joint Conference on Neural Networks, 2025, Accept. [90] Zeyu Cui#, Jun Yu, Boosting Fairness for 3D Face Reconstruction, International Joint Conference on Neural Networks, 2024, pp. 1-9. [91] Quansheng Liu#, Chengdao Pu, Fang Gao, Jun Yu, Prototypical Contrastive Learning for Domain Adaptive Semantic Segmentation, International Joint Conference on Neural Networks, 2023, pp. 1-9. [92] Quansheng Liu#, Lei Wang, Fang Gao, Jun Yu, Cross-Domain Transformer with Adaptive Thresholding for Domain Adaptive Semantic Segmentation, International Conference on Artificial Neural Networks, 2023, pp. 147-159. [93] Jinsong Li#, Shaochen Wang, Ziyang Chen, Zhen Kan, Jun Yu, Lightweight Neural Path Planning, IEEE/RSJ International Conference on Intelligent Robots and Systems, 2023, pp. 6713-6718. [94] Liuxue Ju#, Jun Yu, Adaptive Fine-Grained Region Matching for Image Harmonization, International Conference on Image and Graphics, 2023, pp. 3-15. [95] Chengdao Pu#, Quansheng Liu, Jun Yu, Ratio R-CNN: An Efficient and Accurate Detection Method for Oriented Object Detection, International Conference on Image and Graphics, 2023, pp. 28-40. [96] Jun Yu#, Mengyan Li, Xinlong Hao, Guochen Xie, Deep Fusion Siamese Network for Automatic Kinship Verification, IEEE International Conference on Automatic Face and Gesture Recognition, 2020, pp. 801-808. [97] Jun Yu#, Guochen Xie, Mengyan Li, Xinlong Hao, Retrieval of Family Members Using Siamese Neural Network, IEEE International Conference on Automatic Face and Gesture Recognition, 2020, pp. 867-871. [98] Jun Yu#, Guochen Xie, Xinlong Hao, Zeyu Cui, Liwen Zhang, Zhongpeng Cai, Deep Kinship Verification and Retrieval Based on Fusion Siamese Neural Network, IEEE International Conference on Automatic Face and Gesture Recognition, 2021, pp. 1-8. [99] Jun Yu#, Hao Chang, Keda Lu, Guochen Xie, Liwen Zhang, Zhongpeng Cai, Shenshen Du, Zhihong Wei, Zepeng Liu, Fang Gao, Feng Shuang, Bag of Tricks and a Strong Baseline for FGVC, Conference and Labs of the Evaluation Forum, 2022, vol. 3180, pp. 2275-2290. [100] Jun Yu#, Hao Chang, Zhongpeng Cai, Guochen Xie, Liwen Zhang, Keda Lu, Shenshen Du, Zhihong Wei, Zepeng Liu, Fang Gao, Feng Shuang, Efficient Model Integration for Snake Classification, Conference and Labs of the Evaluation Forum, 2022, vol. 3180, pp. 2262-2274. [101] Jun Yu#, Chang Wen Chen, Joint Facial Landmark Detection and Action Estimation Based on Deep Probabilistic Random Forest, IEEE International Conference on Visual Communications and Image Processing, 2018, pp. 1-4. [102] Yinglu Liu#, Jun Yu, et al., Grand Challenge of 106-Point Facial Landmark Localization, IEEE International Conference on Multimedia Expo, 2019, pp. 613-616. [103] Yuechuan Sun#, Jun Yu, Deep Facial Attribute Detection in the Wild: from General to Specific, British Machine Vision Conference, 2018, pp. 1-11. [104] Zhaoyu Zhang#, Yuechuan Sun, Jun Yu, A Cross-Layer Based Network for Faster Image Generation, IEEE International Conference on Image Processing, 2018, pp. 3903-3907. [105] Mengyan Li#, Yuechuan Sun, Zhaoyu Zhang, Jun Yu, A Coarse-to-Fine Face Hallucination Method by Exploiting Facial Prior Knowledge, IEEE International Conference on Image Processing, 2018, pp. 61-65. [106] Lingyun Yu#, Jun Yu, Qiang Ling, Deep Neural Network Based 3D Articulatory Movement Prediction Using Both Text and Audio Inputs, International Conference on Multimedia Modeling, 2019, pp. 68-79. [107] Shenshen Du#, Jun Yu, et al., SAR2EO: A High-Resolution Image Translation Framework with Denoising Enhancement, Australia Joint Conference on Artificial Intelligence, 2023, pp. 91-102. [108] Jun Yu#, Yuechuan Sun, Simultaneous Facial Landmark and 3D Action Estimation Based on Probabilistic Random Forest, IEEE International Conference on Image Processing, 2018, pp. 3643-3647. [109] Jun Yu#*, Lingyun Yu, Synthesizing Photo-Realistic 3D Talking Head: Learning Lip Synchronicity and Emotion from Audio and Video, IEEE International Conference on Image Processing, 2018, pp. 1448-1452.

编辑：init 2025-04-20 16:59:14