苏统华 中国
大规模模式识别与深度学习
副教授
目前就职软件学院
所在学科 计算机科学与技术 软件工程
永久地址 http://homepage.hit.edu.cn/tonghuasu

基本信息


苏统华,男,汉族,博士,副教授。哈尔滨工业大学计算机科学与技术学院教师,硕士生导师。

荣誉称号

2017年 英伟达深度学习认证讲师(第一批)

2017年 全国最佳英伟达GPU教育中心

2016年 ICFHR Award Committee成员

2016年 全国最佳英伟达GPU教育中心

2015年 全国最佳英伟达GPU教育中心

2014年 英伟达GPU研究中心(GRC)负责人

2014年 英伟达GPU教育中心(GEC)负责人

2014年 通过英伟达CUDA培训师认证

2013年 获ICDAR'2013手写汉字识别竞赛脱机单字分类任务冠军

2013年 获ICDAR'2013手写汉字识别竞赛脱机连续识别任务冠军

2013年 获英伟达官方认证的首批CUDA工程师称号

简历

苏统华, 2008年毕业于哈尔滨工业大学计算机科学与技术学院,获工学博士学位;之后进入中国科学院自动化研究所模式识别国家重点实验室,从事博士后研究工作。主要研究方向:模式识别与深度学习、物联网大数据智能信息处理和智能媒体计算与交互技术等。主持或参与完成国家自然科学基金重点项目、国家杰出青年基金、国家自然科学基金青年基金、国家自然科学基金面上项目、中国博士后基金等课题。率先开展手写中文文本的研究工作,建立领域内首款手写中文库(HIT-MW库),该库为国内外100余家科研院所采用,支持20多名博士研究生的论文工作。申请者为为自然手写中文文本识别的开拓者,取得了一系列进展:2013年,出版手写汉字识别领域首本英文专著德国施普林格出版社);2013年,在文档分析和识别国际会议上,申请者所在研究组获得手写汉字识别竞赛的2项世界冠军;2016年ICFHR主讲“基于深度学习的文档识别”tutorial;四年内代表工作被同行大篇幅的他引约300次。在大规模GPU并行计算方面,也取得了一些重要成果:2013年,获英伟达官方认证的首批CUDA工程师称号;2013年,申请者主讲校级创新实验课《CUDA高性能并行程序设计》;2014年所在研究组相继被授予英伟达GPU研究中心和GPU教育中心;2015和2016年连续评为全国最佳GPU教育中心;出版6本GPU计算或大数据译作。目前为IEEE TPAMI, Pattern Recognition, Information Sciences, International Journal on Document Analysis and Recognition等多个国际期刊的审稿人。主要研究成果概述如下:

  1. 率先建立中文手写文本识别的基本框架。近30 年的汉字识别研究一直沿着孤立汉字的方向发展,我们提出了真实书写环境下的手写文本的识别问题,研究问题被提升了一个层次。
  2. 收集领域内首款手写中文库,哈尔滨工业大学多人手写库(HIT-MW Database)。该库已被全世界约 100 家科研院所采用(包括美国 MIT、U C Berkeley、Ohio University、University of Maryland, 日本Tokyo 大学,国内清华大学、吉林大学、中科院自动化所和华南理工大学等)。其设计理念,为后来的手写库收集者所借鉴。
  3. 提出基于无切分策略的新型识别模型。该工作被多篇引文称作独立的流派。 打破了原有方法在识别之前必须先切分字符的思路, 而是把字符切分和识别合二为一。该项工作受到文字识别界领军人物G Finke的称赞。
  4. 提出基于感知机准则和Margin正则化的大类别、大规模数据分类方法。其性能优于已有判别学习方法, 训练速度比现有方法快数倍。
  5. 得到了多项国家基金的支持。包括国家自然科学基金重点项目1项,国家自然科学基金面上项目1项,国家自然科学基金青年基金1项,中国博士后科研基金1项。 
  6. 出版手写汉字识别领域首本英文专著。专著出版社为德国的施普林格。本书对构成手写汉字识别基石的先进算法作了全面综述;提出从收集数据、特征提取到大类别扩展性学习的一整套新颖方法;深入探讨了提升手写汉字识别性能的多种框架和算法。
  7. 受到同行的广泛认可,得到一定的国际影响力。四年内代表工作被同行(主要为国外同行)他引约200次。这些引用分布在IEEE TPAMI, IEEE TIP, Pattern Recognition, PAA, IJDAR, Optical Engineering, Expert Systems, Expert Systems with Applications, Engineering Applications of Arti. Intell., IEICE Trans. on Information and Systems等重要期刊。
  8. 研究水平处于世界前列。2013年,在文档分析和识别国际会议上,申请者所在研究组获得手写汉字识别竞赛的2项世界冠军。
  9. 在结合大规模GPU计算方面,成效显著。2013年,申请者获英伟达官方认证的首批CUDA工程师称号。2013年,申请者主讲哈尔滨工业大学校级创新实验课《CUDA高性能并行程序设计》,并出版3本基于CUDA架构的GPU译作。2014年,所在研究组成为英伟达CUDA教学中心(CTC)和英伟达CUDA研究中心(CRC)。2015和2016年连续评为全国最佳GPU教育中心。

HIT-MW手写数据库下载事宜

微软onedrive盘下载链接
链接地址:https://onedrive.live.com/?cid=C843D00D50306B55&id=C843D00D50306B55%216861
简单介绍:该数据集支持手写中文汉字识别、手写笔迹鉴别等任务,是手写中文文字研究上第一款数据集。纯学术用途,经邮件授权后免费使用(邮件中应注明使用人,单位,具体用途)。请求授权的邮件请发送到hitmwdb@gmail.com 。商业用途,需另签署文本协议。
百度云盘下载链接
链接地址:https://pan.baidu.com/s/1Gv2gs2PTBVemlwjeYeokiA
简单介绍:该数据集支持手写中文汉字识别、手写笔迹鉴别等任务,是手写中文文字研究上第一款数据集。纯学术用途,经邮件授权后免费使用(邮件中应注明使用人,单位,具体用途)。请求授权的邮件请发送到hitmwdb@gmail.com 。商业用途,需另签署文本协议。
Copyright © 2016 哈尔滨工业大学网络与信息中心