
个人简介
姓 名:吴松
邮 箱:[email protected]
毕业院校:荷兰莱顿大学
研究方向:计算机视觉;人工智能;大数据分析;
单 位:麻豆国产
麻豆国产
副教授
教育经历:
1.2012/09-2016/09,荷兰莱顿大学,先进计算机科学麻豆国产,博士,导师:Prof. Joost Kok, and Prof. Michael S. Lew;
2.2009/09-2012/06,麻豆国产
,麻豆国产
,计算机科学与技术,硕士,导师:肖国强教授;
3.2005/09-2009/06,麻豆国产
,麻豆国产
,计算机科学与技术,本科;
科研与学术工作经历:
1.2017/04-至今,麻豆国产
,麻豆国产
,副教授,硕士生导师;
2.2018/01-2018/10,原重庆市经济和信息化委员会大数据局,干部挂职;
3.2016/09-2017/04,美国德克萨斯大学西南医学中心,医学影像研究中心,博士后;
主持或参加科研项目(课题):
1. 四川省自然科学基金面上项目,“基于知识蒸馏和持续学习的多模态数据分析及检索研究”,2025/01-2026/12,20万,主持,在研;
2. 重庆市高等教育教学改革研究项目,“产教赛融合新工科人才培养实践研究”,2024/07-2026/06,2万,主持,在研;
3. 重庆市科技局-技术创新与应用发展项目,“多模态生成大模型关键技术研发及应用”,2023/12-2026/11,100万,主持,在研;
4. 国家生猪创新中心-先导科技项目,“大数据技术产品开发”,2023/05-2024/12,100万,主持,结题;
5. 教育部中央高校基本科研业务费,“基于隐属性图网络及持续学习的跨媒体检索算法研究”,2022/04-2025/04,30万,主持,结题;
6. 重庆市博士后项目特别资助,“基于可解释语义属性学习的行人重识别研究”,二等资助,2022/05-2024/05,10万,主持,结题;
7. 重庆市教委第十一期雏鹰计划项目,“基于深度学习的智能问答系统设计” ,2023/06-2024/05,3万,主持,结题;
8. 国家自然科学基金青年项目,“基于深度语义哈希的大规模图像检索算法研究”,2018/08-2021/12,23万,主持,结题;
9. 教育部中央高校基本科研业务费,“基于深度学习的大规模图像检索算法研究”,2017/05-2020/05,20万,主持,结题;
10.重庆市留创计划创新类项目,“基于深度学习的课程智能答疑系统算法设计与分析”,2018/10-2019/10,5完,主持,结题;
人才计划项目情况:
1. 重庆市第四类人才(海外高层次人才计划),2018年,计算机科学与技术;
重要学术组织任职:
1. 2023/10-至今,重庆市电子学会理事;
2. 2022/11-至今,数字化学习技术集成与应用教育部工程研究中心专家委员会委员;
3. 2022/05-至今,中国计算机学会(CCF) YOCSEF重庆学术AC委员;
4. 2021/01-至今,重庆市计算机学会理事;
5. 2021/01-至今,重庆市电子学会青少年信息技术与人工智能专委会常务委员兼专家组成员;
学术研究基础:
本人的主要研究方向是计算机视觉,同时涉及机器学习,深度学习和自然语言处理等多个前沿领域。具体研究工作包括持续学习(递增学习,终身学习,半监督学习),小样本/零样本学习(目标检测/分割,行人重识别),多模态学习(图文匹配,视频检索,视觉问答系统)等。累计发表学术论文20余篇,学术专著 “Large Scale Visual Search” (ISBN: 9789463321174) 一部,并发布了基于深度学习的自然图像分类以及理解的 Demo(//destiny.liacs.nl/),其中2016年合作发表的深度学习综述论文:“Deep Learning for Visual Understanding: A Review”入选ESI高被引用论文(谷歌引用2000余次)。2018年入选重庆市第四类人才(海外高层次人才计划)。
代表性研究成果和学术奖励情况:
l 期刊论文
[1]. Zhu Xianyu, Xiao Guoqiang, Michael S. Lew, Wu Song*. Lifelong Visible-Infrared Person Re-identification via Replay Samples Domain-modality-mix Reconstruction and Cross-domain Cognitive Network[J]. Computer Vision and Image Understanding, 2025, 254:104328. (CCF-B).
[2]. Zhou Jinhao, Xiao Guoqiang, Michael S. Lew, Wu Song*. Mask Prior Generation with Language Queries Guided Networks for Referring Image Segmentation[J]. Computer Vision and Image Understanding, 2025, 253:104296. (CCF-B).
[3]. Wu Song, Shan Shihao, Xiao Guoqiang, Michael S. Lew, Gao Xinbo*. Modality Blur and Batch Alignment Learning for Twin Noisy Labels-based Visible-Infrared Person Re-Identification[J]. Engineering Applications of Artificial Intelligence, 2024, 133: 107990. (SCI-1).
[4]. Wu Song, Yuan Xiang, Xiao Guoqiang, Michael S. Lew, Gao Xinbo*. Deep Cross-Modal Hashing with Multi-Task Latent Space Learning[J]. Engineering Applications of Artificial Intelligence, 2024, 136: 108944. (SCI-1).
[5]. Wu Song, Shan Shihao, Xiao Guoqiang, Michael S. Lew, Gao Xinbo*. Implicit Modality Knowledge Alignment and Uncertainty Estimation for Visible-Infrared Person Re-identification[J]. Expert Systems With Applications, 2024: 125291. (SCI-1).
[6]. Liu Shan, Xiao Guoqiang, Michael S. Lew, Gao Xinbo, Wu Song*. Core-Attributes Enhanced Generative Adversarial Networks for Robust Image Enhancement[J]. Engineering Applications of Artificial Intelligence, 2024. (SCI-1).
[7]. Liu Shan, Shan Shihao, Xiao Guoqiang, Gao Xinbo, Wu Song*. Image Enhancement with Bi-directional Normalization and Color Attention-guided Generative Adversarial Networks[J]. International Journal of Multimedia Information Retrieval, 2024, 13(1): 1. (SCI-3)
.
[8]. Yuan Xiang, Shan Shihao, Huo Yuwen, Jiang Junkai, Wu Song*. Text-assisted Attention-based Cross-modal Hashing[J]. International Journal of Multimedia Information Retrieval, 2024, 13(1): 1. (SCI-3).
[9]. Xu Xiaohui, Liu Shan, Zhang Nian, Xiao Guoqiang, Wu Song*. Channel Exchange and Adversarial Learning Guided Cross-modal Person Re-identification[J]. Knowledge-Based Systems, 2022, 257: 109883. (SCI-1).
[10]. Yu Zhenyang, Wu Song*, Dou Zhihao, Bakker M. Erwin. Deep Hashing with Self-supervised Asymmetric Semantic Excavation and Margin-scalable Constraint, Neurocomputing, 2022, 483: 87-104. (SCI-2).
[11]. Zou Xitao, Wu Song*, Zhang Nian, Bakker M. Erwin. Multi-label Modality Enhanced Attention-based Self-supervised Deep Cross-modal Hashing[J]. Knowledge-Based Systems, 2022, 239: 107927. (SCI-1).
[12]. Zou Xitao, Wu Song*, Bakker M. Erwin, Wang Xinzhi. Multi-label Enhancement based Self-supervised Deep Cross-modal Hashing[J]. Neurocomputing, 2022, 467: 138-162. (SCI-2).
[13]. Chen Shubai, Wu Song*, Wang Li, Yu Zhengyang. Self-attention and Adversary Learning Deep Hashing Network for Cross-modal Retrieval[J]. Computers & Electrical Engineering, 2021, 93: 107262. (SCI-3).
[14]. Chen Shubai, Wu Song*, Wang Li. Hierarchical Semantic Interaction-based Deep Hashing Network for Cross-modal Retrieval[J]. PeerJ Computer Science, 2021, 7: e552. (SCI-4).
[15]. Zou Xitao, Wang Xinzhi, Bakker M. Erwin, Wu Song*. Multi-label Semantics Preserving based Deep Cross-modal Hashing[J]. Signal Processing: Image Communication, 2021, 93: 116131. (SCI-2).
[16]. Wang Xinzhi, Zou Xitao, Bakker M. Erwin, Wu Song*. Self-constraining and Attention-based Hashing Network for Bit-scalable Cross-modal Retrieval[J]. Neurocomputing, 2020, 400: 255-271. (SCI-2).
[17]. Wu Song, Ard Oerlemans, Erwin M. Bakker, Michael S. Lew*, Deep Binary Codes for Large Scale Image Retrieval, Neurocomputing, 2017, 257: 5-15. (SCI-2).
[18]. Wu Song, Ard Oerlemans, Erwin M. Bakker, Michael S. Lew*, A Comprehensive Evaluation of Local Detectors and Descriptors, Signal Processing: Image Communication, 2017, 59: 150-167. (SCI-2).
[19]. Yanming Guo, Yu Liu, Ard Oerlemans, Songyang Lao, Wu Song, and Michael S. Lew*. “Deep Learning for Visual Understanding: A review.”, Neurocomputing, vol. 187, 2016. (Google Citations: 2000).
l 会议论文
[1]. Du Xiaoyu, Xiaoguo Qiang, Michael S. Lew, Wu Song*. ViT-Enhanced Prompts: Integrating Pre-Trained Knowledge for Robust Continuous Learning. In Proceedings of the 2024 ACM International Conference on
Multimedia Retrieval (ICMR) 2025. (CCF-B).
[2]. Luo Zhenxi, Xiaoguo Qiang, Michael S. Lew, Wu Song*. Visible-Infrared Person Re-Identification with Prompt Pool and Instance-level Prompt Generator. In Proceedings of the 2024 ACM International Conference on
Multimedia Retrieval (ICMR) 2025. (CCF-B).
[3]. Zhou Weiwei, Xiaoguo Qiang, Michael S. Lew, Wu Song*. Causal Inference-based Few-shot Class-Incremental Learning. In Proceedings of the 2024 ACM International Conference on Multimedia Retrieval (ICMR) 2024. (CCF-B).
[4]. Xing Yitong, Xiaoguo Qiang, Michael S. Lew, Wu Song*. Lifelong Visible-Infrared Person Re-Identification via a Tri-Token Transformer with a Query-Key Mechanism. In Proceedings of the 2024 ACM International Conference on Multimedia Retrieval (ICMR) 2024. (CCF-B).
[5]. Deng Shiyi, Xiaoguo Qiang, Michael S. Lew, Wu Song*. Deformable Line Anchor Guided Lane Detection. In Proceedings of 2024 IEEE International Conference on Multimedia and Expo (ICME) 2024. (CCF-B).
[6]. Liu Yijin, Xiaoguo Qiang, Michael S. Lew, Wu Song*. Multi-Scale Fusion of Gated Neighborhood Attention Transformers for Single Image Deraining. In Proceedings of 2024 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2024. (CCF-B).
[7]. Kang Lu, Xiaoguo Qiang, Michael S. Lew, Wu Song*. Arbitrary Style Transfer based on Content Integrity and Style Consistency Enhancement. In Proceedings of 2024 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2024. (CCF-B).
[8]. Luo Pinjun, Xiaoguo Qiang, Gao Xinbo, Wu Song*. LKD-Net: Large Kernel Convolution Network for Single Image Dehazing. In Proceedings of 2023 IEEE International Conference on Multimedia and Expo (ICME) 2023. (CCF-B).
[9]. Shan Shihao, Xiong Enyuan, Xiang Yuan, Wu Song*. A Knowledge-Driven Enhanced Module for Visible-Infrared Person Re-Identification. In Proceedings of 2022 International Conference on Artificial Neural Networks (ICANN) 2022, pages:441-453. (CCF-C).
[10]. Liu shan, Xiao Guoqiang, Xu Xiaohui, Wu Song*. Bi-directional Normalization and Color Attention-guided Generative Adversarial Network for Image Enhancement. In Proceedings of 2022 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2022, pages:2205-2209. (CCF-B).
[11]. Chen Shubai, Wu Song*, Chen Yu, Yuan Yuan. Deep Similarity Preserving and Attention-based Hashing for Cross-modal Retrieval. In Proceedings of the 33rd International Conference on Software Engineering and Knowledge Engineering (SEKE) 2021, pages: 405-410. (CCF-C).
l 学术专著
Wu Song, Large Scale Visual Search, Leiden University Press, 2016. 12. 22. (ISBN: 9789463321174)
//openaccess.leidenuniv.nl/handle/1887/45135
发表论文代码下载链接://github.com/SWU-CS-MediaLab/
团队已毕业同学(深造/就业):
周锦豪(硕士),计算机科学与技术,2025年6月毕业,就业,就业单位:中国邮政储蓄银行(成都);
邓士奕(硕士),计算机科学与技术,2025年6月毕业,就业,就业单位:珠海格力电器股份有限公司(珠海);
康 露(硕士),计算机科学与技术,2025年6月毕业,就业,就业单位:德宏职业麻豆国产(昆明);
周维维(硕士),计算机科学与技术,2025年6月毕业,就业,就业单位:小米科技有限责任公司(南京);
刘宜锦(硕士),计算机科学与技术,2025年6月毕业,就业,就业单位:珠海格力电器股份有限公司(珠海);
单士豪(硕士),计算机科学与技术,2024年6月毕业,直博,深造学校:奥克兰大学(新西兰);
袁 祥(硕士),计算机科学与技术,2024年6月毕业,就业,就业单位:重庆浪潮股份有限公司(重庆);
罗品军(硕士),计算机科学与技术,2024年6月毕业,就业,就业单位:重庆长安汽车股份有限公司(重庆);
刘 珊(硕士),计算机科学与技术,2023年6月毕业,就业,就业单位:重庆长安汽车股份有限公司(重庆);
徐孝辉(硕士),计算机科学与技术,2023年6月毕业,直博,深造学校:国防科技大学(长沙);
----------------------------------------------------------------------------------------------------
行义通(本科),计算机科学与技术,2025年6月毕业,硕士推免,深造学校:上海交通大学(上海);
朱显宇(本科),网络工程,2025年6月毕业,硕士推免,深造学校:中国人民大学(北京);
霍誉文(本科),计算机科学与技术,2025年6月毕业,硕士留学,深造学校:香港城市大学(香港);
楚怡凡(本科),软件工程,2025年6月毕业,硕士留学,深造学校:香港城市大学(香港);
宋昕阳(本科),自动化,2025年6月毕业,硕士留学,深造学校:新加坡南洋理工大学(新加坡);
周文祥(本科),网络工程,2024年6月毕业,硕士推免,深造学校:电子科技大学(成都);
王雨生(本科),网络工程,2024年6月毕业,硕士推免,深造学校:重庆大学(重庆);
熊恩圆(本科),网络工程,2023年6月毕业,硕士留学,深造学校:佐治亚理工麻豆国产(美国);
陈述白(本科),电子商务,2022年6月毕业,硕士推免,深造学校:中国科麻豆国产计算技术研究所(北京);
唐子豪(本科),计算机科学与技术,2022年6月毕业,硕士推免,深造学校:东南大学(南京);
王鑫祉(本科),计算机科学与技术,2021年6月毕业,就业,就业单位:腾讯公司(深圳);
余政阳(本科),自动化,2020年6月毕业,博士留学,深造学校:澳大利亚国立大学(澳大利亚);
国际学术期刊及会议审稿人:
l 国际期刊:
IEEE Transactions on Image Processing.
IEEE Transactions on Neural Networks and Learning Systems
IEEE Transactions on Multimedia.
Knowledge-based Systems.
Engineering Applications of Artificial Intelligence
Pattern Recognition.
Neurocomputing.
Signal Processing: Image Communication.
l 国际会议:
Conference of British Machine Vision Conference (BMVC), 2014~.
AAAI conference on Artificial Intelligence (AAAI), 2015~.
International Conference of ACM Multimedia (MM),2016~.
International Joint Conference on Artificial Intelligence (IJCAI), 2018~.
我们多模态深度学习理论与应用团队针对多尺度复杂数据处理问题,研究多尺度表示的跨模态人工智能框架,适用于视频、语音、自然语言、三维点云、地理数据等不同模态的数据,实现小样本、可解释、跨模态和感知决策一体化方法,并应用到以视觉为中心的真实生活场景中。热烈欢迎有志于投身此前沿科学领域的硕士生报考咨询,同时常年招收本科生参与团队科研项目,一起探索未知!