更新日期:2025年2月28日
|
姓 名
|
黄双萍
|
性 别
|
女
|
出生年月
|
1972年10月
|
籍贯
|
|
民 族
|
汉族
|
政治面貌
|
群众
|
最后学历
|
博士研究生毕业
|
最后学位
|
工学博士
|
技术职称
|
教授
|
导师类别
|
博、硕导
|
行政职务
|
副院长
|
Email
|
eehsp@scut.edu.cn
|
工作单位
|
华南理工大学电子与信息学院
|
邮政编码
|
|
通讯地址
|
逸夫科学馆506
|
单位电话
|
|
|
个人简介
黄双萍,教授,博导,现任华南理工大学电子与信息学院副院长。主要从事多模态认知计算、计算机视觉、自然语言处理、联邦学习、具身智能、AIGC(数字人生成、风格化手写生成、表格摘要生成等)、图文智能,智慧医疗(影像分析和中医人工智能)等相关领域的理论及应用研究等。任中国图象图形学会文档分析与识别专委会委员,广东省图象图形学会理事,广东省图像图形学学会“计算机视觉”专业委员会委员。主持国家自然科学基金项目,科技部重大专项课题,广东省科技计划、广东省自然基金、广州科信局人工智能重点专项、广州市重大攻关项目以及企业横向项目,总计20余项。最近5年,积累的研究成果在CVPR, ECCV, ACM MM, Scientific Data, Information Sciences、Pattern Recognition,Neurocomputing等国际顶级会议和期刊上发表,授权发明专利30余件。获得“广东省科学技术奖励二等奖”1项,吴文俊人工智能科技进步奖1项。指导学生荣获互联网+国赛金奖,挑战杯广东省特等奖,MICCAI Liver Lesion Diagnosis on Multi-phase MRI比赛第1名,2023全国大数据与计算智能挑战赛获得二等奖(知识图谱QA)和三等奖(表格摘要)各1项,表格结构识别比赛二等奖2项,面向自动阅卷的OCR技术挑战赛文字识别任务一等奖,教育手写公式识别二等奖等。
教育经历
2007年09月~2011年06月 华南理工大学 博士研究生 通信与信息系统专业 智能信息处理
2002年09月~2005年06月 华南理工大学 硕士研究生 通信与信息系统专业 视频压缩
1991年09月~1995年06月 重庆邮电学院 学士 计算机通信专业
获奖、荣誉称号
1、MICCAI Liver Lesion Diagnosis on Multi-phase MRI比赛,获得第1名,2023年。
2、全国大数据与计算智能挑战赛“多粒度时序知识图谱问答”,获得第2名(二等奖),2023年,国家级项目。
3、全国大数据与计算智能挑战赛“Data-To-Text 硬约束下的受控文本生成”,获得第5名(三等奖),2023年,国家级项目。
4、粤港澳大湾区国际算法算例大赛“基于语言增强的图像新类别发现”三等奖,2023年。
5、粤港澳大湾区国际算法算例大赛“高效可靠的文生图方法”三等奖,2023年。
6、CSIG图像图形技术挑战赛“表格结构识别挑战赛”第二名,2023年。
7、2022年粤港澳大湾区(黄埔)国际算法算例大赛二等奖。
8、2021年第一届表格结构识别挑战赛,获得第2名,比赛奖金2万元。
9、天池“英特尔创新大师杯“-通用场景OCR文本识别-创新奖 2021年。
10、识古通今-OCR技术领航者,第六届互联网+国赛金奖(2020)。
11、智能辅助教育技术与应用,2020年吴文俊人工智能科技进步二等奖。
12、教育手写公式识别,中国创新挑战赛智慧教育专题三等奖,2020年。
13、第二届中国模式识别与计算机视觉大会面向自动阅卷的OCR技术挑战赛文字识别任务一等奖,2019年。
14、数字媒体云服务平台创新及应用,2017年度广东省科学技术奖励二等奖。
15、基于深度学习的自然场景文本检测,第十四届“ 挑战杯” 广东大学生课外学术科技作品竞赛,自然科学类学术论文组,特等奖,2017年。
社会、学会及学术兼职
1、中国图象图形学会文档分析与识别专委会委员
2、广东省图象图形学会理事
3、广东省通信学会人工智能专业委员会副主任委员
研究领域
多模态认知计算,联邦学习,具身智能,深度学习模型可靠性和可解释性,计算机视觉,自然语言处理,图文智能,医学影像理解和报告生成,中医人工智能
科研项目
(1)基于预训练模型的通信作业文件生成技术研究项目,南方电网,2024年3月-2026年9月
(2)深度学习模型可解释性研究, 株洲中车时代软件技术有限公司,2023年12月-2026年11月
(3)中医药典籍智能挖掘与古今融合知识体系构建共性关键技术研究及应用,科技部国家重点研发计划,2023年11月-2025年10月
(4)高精度全要素身份融合识别与解析关键技术研究,广州市人工智能重点专项,2022年4月-2025年3月
(5)基于图卷积和域自适应的跨场景复杂版面分析算法,国家自然科学基金,2022年1月-2025年12月
(6)表单及标志牌信息智能识别,时代软件公司,2021年6月-2023年6月
(7)面向教育场景的图文识别智能标注系统,省级基础研究项目,2021年5月-2023年5月
(8)文档图像版面结构分析算法研究,广东省基础与应用基础研究基金项目,2021年1月-2023年12月
(9)面向教育场景的拍照题目及手写答案识别研究,阿里巴巴达摩院(杭州)科技有限公司,2020年7月-2021年6月
(10)基于生成对抗网络(GAN)的甲骨拓片字符生成与识别技术甲骨文信息处理教育部重点实验室课题,2019年12月-2020年12月
(11)基于对抗生成和域自适应的甲骨文拓片字符识别技术,甲骨文信息处理教育部重点实验室课题,2021年5月-2023年5月
(12)移动通信高价值用户与场景的智能识别技术及应用系统研发,广州市科技计划产业技术重大攻关计划,2019年4月-2021年3月
(13)场景文本检测和识别算法研究及应用,广州市科技计划,2017年5月-2020年4月
(14)基于深度强化学习和路径积分特征图的自然场景文本检测与识别,国家自然科学基金,2017年1月-2020年12月
(15)参与:智能感知与视觉感知计算,广东省自然科学基金研究团队项目,2017年5月-2022年5月
(16)视觉感知的水稻株间机械除草与同步液肥环施机理研究,国家自然科学基金,2016年1月-2019年12月
(17)水稻穗瘟抗性高光谱鉴定技术研究及示范,广东省科技计划公益专项,2015年1月-2017年12月
发表论文
[1] Zhi-Yuan Zhang, Li Xiaofan, Zhihao Xu, Wenjie Peng, Zijian Zhou, Miaojing Shi, Shuangping Huang, MPDrive: Improving Spatial Understanding with Marker-Based Prompt Learning for Autonomous Driving, CVPR 2025, Accepted.
[2] Shengjie Gong, Haojie Li, jiapeng Tang, Dongming Hu,Shuangping Huang, Hao Chen, Tianshui chen, Zhuoman Liu, Monocular and Generalizable Gaussian Talking Head Animation, CVPR 2025, Accepted.
[3] Zhenghua Peng, Tianshui Chen, Shuangping Huang, Yunqing Hu, Heterogeneous Correlation Aware Regularization for Sequential Confidence Calibration, TPAMI 2025, Accepted
[4] Shuangping Huang, Zinan Hong, Bianzhe Wu, Jinglin Liang, Qinghua Huang,Spatio-Temporal Collaborative Multiple-stream Transformer Network for liverLesion Classfication on Multiple-sequence Magnetic Resonance Imaging, EAAI, Accept
[5] Wenjie Peng, Hongxiang Huang, Tianshui Chen, Quhui Ke, Gang Dai, and Shuangping Huang. Globally Correlation-Aware Hard Negative Generation, International Journal of Computer Vision 2024, IF=11.6, CCF A
[6] Jinglin Liang, Jin Zhong, Hanlin Gu, Zhongqi Lu, Xingxing Tang, Gang Dai, Shuangping Huang, Lixin Fan, Qiang Yang, Diffusion-Driven Data Replay: A Novel Approach to Combat Forgetting in Federated Class Continual Learning, ECCV 2024 (Oral)
[7] Zhihao Xu, Shengjie Gong,Jiapeng Tang, Lingyu Liang,Yining Huang, Haojie Li,Shuangping Huang, KMTalk:Speech-Driven 3D FacialAnimation with Key Motion Embedding, ECCV 2024
[8] Gang Dai, Yifan Zhang, Quhui Ke, Qiangya Guo, Shuangping Huang, One-Shot Diffusion Mimicker for Handwritten Text Generation, ECCV 2024
[9] Zhenghua Peng, Yu Luo, Tianshui Chen, Keke Xu, Shuangping Huang, Perception and Semantic Aware Regularization for Sequential Confidence Calibration, CVPR 2023,CCF A
[10] Gang Dai, Yifan Zhang, Qingfeng Wang, Qing Du, Zhuliang Yu, Zhuoman Liu, Shuangping Huang, Disentangling Writer and Character Styles for Handwriting Generation, CVPR 2023,CCF A
[11] Hongxiang Huang, Daihui Yang, Shuangping Huang, AGTGAN: Unpaired Image Translation for Photographic Ancient Character Generation, ACM MM 2022,CCF A
[12] Shuangping Huang, Yu Luo, Zhenzhou Zhuang, Context-Aware Selective Label Smoothing for Calibrating Sequence Recognition Models, ACM MM 2021, CCF A
[13] Zonghao Liu, Wenjie Peng, Gang Dai, Shuangping Huang*, Yongge Liu, Semantic-Enhanced Zero-shot Oracle Character Recognition, Acta Electronica Sinica, 2024
[14] Bianzhe Wu, ZeRong Huang, Jinglin Liang, Hong Yang, Wei Wang, Shuangping Huang*, LiDa Chen*, and Qinghua Huang, GLCV-NET: An Automatic Diagnosis System For Advanced Liver Fibrosis Using Global-Local Cross View In B-mode Ultrasound Images, Computer Methods and Programs in Biomedicine, 2024
[15] Qingfeng Wang, Lingyu Liang, Shuangping Huang, Document Image Dewarping Guided by 3D Geometry and Layout Priors, ICME 2024, Accepted.
[16] Junxiang Lin, Zhounan Chen , Lingyu Liang, Wenjie Peng, Shuangping Huang, Handwriting Trajectory Recovery via Trajectory Transformer with Global Radical [9] Context-Aware Module, ICPR 2024
[17] Lei Hu, Shuangping Huang, Enhancing Table Structure Recognition via Bounding Box Guidance, ICPR 2024
[18] Zihao Lin, Jinrong Li, Gang Dai, Tianshui Chen, Shuangping Huang, Jianmin Lin. Contrastive representation enhancement and learning for handwritten mathematical expression recognition, PRL 2024
[19] FanYang, LeiHu, Shuangping Huang*, A large-scale dataset for end-to-end table recognition in the wild, Scientific Data, 2023(IF=8.501,JCR Q1)
[20] Shuangping Huang, Zhuoyao Zhong, Lianwen Jin, Shuye Zhang, Haobin Wang, DropRegion Training of Inception Font Network for High-Performance Chinese Font Recognition, Pattern Recognition,77: 395-411, 2018(IF=7.196,JCR Q1)
[21] Shuangping Huang, Lianwen Jin, Kunnan Xue, Yuan Fang, Online Primal-dual Learning for a Data-dependent Multi-kernel Combination Model with Multi-class Visual Categorization Applications, Information Sciences,320: 75-100, 2015(IF=5.910, JCR Q1)
[22] Haojie Li, Daihui Yang, Shuangping Huang*, Kin-Man Lam, Lianwen Jin, Two-Dimensional Multi-Scale Perceptive Context for Scene Text Recognition, Neurocomputing, 41: 410-421, 2020 (IF=4.438, JCR Q1);
[23] Ziyong Feng, Zhaoyang Zhao, Lianwen Jin, Shuangping Huang*, Robust shared feature learning for script and handwritten/machine-printed identification, Pattern Recognition Letters,2017(IF=3.255, JCR Q2)
[24] Haojie Li, Daihui Yang, Shuangping Huang*, Kin-Man Lam, Deep Motion-Appearance Convolutions for Robust Visual Tracking, IEEE ACCESS, 2019(IF=3.7,JCR Q1)
[25] Huang Shuangping, Qi Long, Ma Xu, Xue Kunnan, Wang Wenjuan, Zhu Xiaoyuan, BoSW Model Based Hyperspectral Image Analysis for Rice Panicle Blast Grading, Computers and Electronics in Agriculture, 118: 167-178, 2015(IF=3.858,JCR Q1)
[26] Huang Shuangping, Qi Long, Ma Xu, Xue Kunnan, Wang Wenjuan, Zhu Xiaoyuan, Deep localization model for intra-row crop detection in paddy field, Computers and Electronics in Agriculture, 169: 1-12, 2019(IF=3.858,JCR Q1)
[27] Shingling Huang, Lianwen Jin, Yuan Fang, Xiaoxin Wei, Online Heterogeneous Feature Fusion Machines for Visual Recognition, Neurocomputing, 123(10): 100-109, 2014 (IF=4.438, JCR Q1);
[28] Shuangping Huang, Lianwen Jin, Yunyu Li, Kunnan Xue, Long Qi, Online Multi-kernel Learning Based on a Triple Norm Regularizer for Semantic Image Classification, Mathematical Problems in Engineering,2015(IF=1.145,JCR Q3).
[29] Zhenzhou Zhuang, Zonghao Liu, Shuangping Huang, A New Semi-Automatic Annotation Model for Text Detection via Semantic Boundary Estimation, ICDAR 2021
[30] Jinrong Li, Zijian Zhou, Zhizhong Su, Shuangping Huang, Lianwen Jin, A New Parallel Detection-Recognition Approach for End-to-End Scene Text Extraction, ICDAR 2019
[31] Shuangping Huang, Haobin Wang, Yongge Liu, Xiaosong Shi, Lianwen Jin, OBC306: A Large-Scale Oracle Bone Character Recognition Dataset, ICDAR 2019
[32] Haobing Wang, Shuangping Huang*, Lianwen Jin, Focus on Scene Text Using Deep Reinforcement Learning, ICPR 2018
科研创新
[1] 黄双萍,覃雨涛,何金学,吴宇栋,李植森,黄森. 基于深度学习与深度信息检测定位的云台结构及方法 [发明]. CN117991825B,2024-10-15.
[2] 黄双萍, 吴边喆, 林梓浩, 洪梓楠, 钟楚龙, 黄森. 一种基于视频动作的多模型集成多相位MRI肿瘤分类方法[B]. CN117351003B,2024-02-23.
[3] 黄双萍,胡磊,徐之昊,林骏翔,彭文杰,黄森. 一种基于深度学习的表格摘要生成方法. CN117216245B,2024-01-26.
[4] 黄双萍,刘宗昊,黄森,彭文杰. 一种基于关键点检测的全线表表格结构识别方法[P]. CN115620322B,2023-04-7.
[5] 黄双萍,胡磊,杨帆,黄森. 一种表格的标记语言标签与单元格锚框鲁棒对齐方法[P]. CN115618154B,2023-03-10.
[6] 黄双萍,黄森,张慧源,李晨,张伟坤,梁景麟. 基于深度学习的机车标志牌信息智能识别方法及系统[P] CN115620265B,2023-04-18.
[7] 黄双萍,彭政华,杨帆. 一种全线表表格结构识别方法. CN 114529925 B,2022-07-15.
[8] 黄双萍,陈洲楠,杨代辉,梁景麟,彭政华. 一种文字图像书写轨迹恢复效果判别方法[P]. CN114511853B,2022-07-12.
[9] 黄双萍,罗钰,徐可可. 基于CTC解码器的文本序列识别模型校准方法[P]. 广东省CN114495114B,2022-08-5.
[10] 黄双萍,王庆丰,代港. 基于对抗解耦的个性化手写文字生成方法[P]. 广东省:CN114495118B,2022-08-9.
[11] 黄双萍,陈洲楠,杨代辉,梁景麟,彭政华. 一种基于双流编码的文字图像书写轨迹恢复方法[P]. CN114463760B,2022-06-28.
[12] 黄双萍,陈洲楠,杨代辉,梁景麟,彭政华. 基于全局追踪解码的文字图像书写轨迹恢复方法 CN 114757969B,2023-04-07.
[13] 黄双萍,黄鸿翔,杨代辉. 一种联合形状变换和纹理转换的古文字生成方[P].CN114494003B,2019-03-01.
[14] 黄双萍,杨帆. 一种联合卷积与图神经网络的表格结构识别方法[P]. CN114387608B,2022-06-21.
[15] 黄双萍,黄鸿翔,杨代辉. 一种基于形状变换的字符图像增广方法[P]. 广东省:CN 114782961 B,2023-04-18.
[16] 黄双萍,刘宗昊,王庆丰. 图像文本检测半自动标注方法、系统、计算机设备及介质[P]. CN113807336A,2023-06-30.
[17] 黄双萍,罗钰,陈洲楠. 文本图像识别方法、装置、计算机设备和存储介质[P]. CN113313127A, 2023-02-14.
[18] 陈向乐,黄双萍. 基于深度学习的试卷卷头学生信息自动检测方法[P]. 广东省:CN113076900B, 2022-06-14.
[19] 黄双萍,杨代辉,黄鸿翔,郑锐佳,李智龙,李南鹏. 复杂场景文本识别方法、系统、计算机设备及存储介质[P]. CN112163596A,2024-01-05.
[20] 黄双萍,杨代辉,李豪杰,金连文. 拓片甲骨文字符图像增广方法、系统、计算机设备及介质[P]. CN111915540A,2020-11-10.
[21] 黄双萍,郑锐佳,李智龙,李南鹏,杨代辉,李晓辉,吴淦浩,刘伏根. 文本图像标注系统、方法、计算机设备和存储介质[P]. CN111898411B,2021-08-31.
[22] 黄双萍,庄镇州,李晓辉. 文本识别方法、装置、计算机设备和存储介质[P]. CN111797834B,2021-06-15.
[23] 黄双萍,伍思航. 基于深度学习的单株水稻检测定位方法、系统、设备及介质[P]. CN109886155B,2021-08-10.
[24] 朱静,杨晋昌,黄颖杰,黄文恺,陶为俊,邓文婷,黄双萍. 新闻评论自动生成方法及其装置 [发明], CN109670036B,2020-12-08.
[25] 陈新兵,谢斌盛,龙晓莉,胡维,邓文婷,伍冯洁,黄双萍. 一种工程教育智能车 [实用新型],CN208985487U,2019.06.14.
[26] 黄双萍,王浩彬,金连文. 基于深度强化学习的场景文本检测方法及系统[P]. CN108090443B,2020-09-22.
[27] 黄双萍,基于深度卷积神经网络的水稻穗瘟检测方法及系统[P]. CN107576618B,2020-04-28.
[28] 金连文,黄双萍,黎小凤. 一种基于样本模板的数字化妆方法[P]. CN105488472B,2019-04-09.
[29] 黄双萍,郑锐佳,李智龙,李南鹏,杨代辉,李晓辉,吴淦浩,刘伏根. 文本图像标注系统、方法、计算机设备和存储介质[P]. CN111898411A,2020-11-06.
[30] 黄双萍,庄镇州,李晓辉. 文本识别方法、装置、计算机设备和存储介质[P]. CN111797834A,2020-10-20.
[31] 黄双萍,伍思航,李豪杰. 基于双流卷积神经网络的目标跟踪方法、系统、设备及介质[P]. CN109410242B,2020-09-22.
[32] 黄双萍,伍思航,李豪杰. 基于三维卷积神经网络的边界框回归方法、系统、设备及介质[P]. CN109255351B,2020-08-18.
[33] 黄双萍,伍思航. 基于深度学习的单株水稻检测定位方法、系统、设备及介质[P]. CN109886155A,2019-06-14.
[34] 黄双萍,金连文,商俊蓓. 基于BLSTM的联机手写数学公式符号识别方法[P]. CN105512692B,2019-04-09.
[35] 黄双萍,伍思航,李豪杰. 基于双流卷积神经网络的目标跟踪方法、系统、设备及介质[P]. CN109410242A,2019-03-01.
教学活动
本科课程:数字信号处理
研究生课程:深度学习
指导学生情况
2020: 识古通今-OCR 技术领航者,第六届中国国际“互联网+”大学生创新创业大赛的国赛金奖
2017: 基于深度学习的自然场景文本检测,第十四届“ 挑战杯” 广东大学生课外学术科技作品竞赛,自然科学类学术论文组,特等奖
2019: 第二届中国模式识别与计算机视觉大会面向自动阅卷的OCR技术挑战赛文字识别任务一等奖
2020: 教育手写公式识别,中国创新挑战赛智慧教育专题赛三等奖
2018: 基于深度学习的图像文字识别,2018年大学生创新创业训练计划项目优秀结题
我的团队
华南理工大学电信学院“多模态认知计算团队”现有教授1人,副教授1人,副研究员1人,讲师1人。团队致力于人工智能、计算机视觉、模式识别领域的前沿理论技术的研究及创新应用,主要研究方向包括计算机视觉、大语言模型、多模态学习、AIGC和联邦学习等。团队近年来发表国际顶级会议、期刊论文35余篇(包含CCF-A类会议 CVPR、ACM MM ;1区SCI期刊);先后主持省级部以上科研项目 10 项(国家级4项),阿里达摩院等行业头部企业合作项目6项;授权/受理国家发明专利30余项。