计科校友先锋:自然语言处理技术的追求者—国家自然科学基金优秀青年科学基金获得者熊德意

发布人:石剑峰发表时间:2022-06-02点击:

(通讯员:李国昌)今年11月份,母校将迎来70周年华诞。接到学院征稿邀请,倍感荣幸的同时,我诚惶诚恐。2002年毕业至今已20年,自己也从面向黑板接受知识熏陶的学生成长为一名与年轻学子共同探讨知识奥妙的老师。流光易逝,当年母校多位令人尊敬的师者传道授业解惑之可爱印象仍然记忆犹新,并一直引导自己在工作和学习上践行母校“艰苦朴素,求真务实”的校训精神。

地大求学之路

1998-2002年,我在地大信息工程学院计算机科学与技术专业完成了大学本科学习。在经历了从小地方到大城市的短暂迷茫与不适应之后,逐渐融入军训生活、校园生活,性格也从入学时的内向腼腆到逐渐外向,敢于在开班会时上台演讲。四年的校园生活,大部分时候都是平静的,不平静的是自己的内在状态,沉浸在知识海洋里,尽情遨游、冲浪,让自己兴奋不已,计算机方面的专业知识也实现了0到1的蜕变。上大学之前从来没有碰过电脑,不知道鼠标长什么样,第一学期就在DOS命令上栽了跟头。后来与舍友合买了一台DIY组装电脑,在上面倒腾写程序,建立自己的个人主页。现在回想起来,自己非常庆幸经历了个人电脑的DIY时代、互联网的千禧年时代,见证了计算机技术的飞速发展。另一方面,与学习专业知识一样让自己高兴的是,可以在“地质工作者雕像”后面的图书馆里借阅各类书籍,古今中外经典名著等,这些书成了自己学习专业知识乏了之后的一片乐土。

本科期间,多位老师在学习上给了我帮助和指导,其中有两位老师对我影响很大。一位是吴信才老师,当时任信息工程学院院长。吴老师把计算机技术应用到地质遥感上,领导研制的地理信息系统MapGIS打破国外GIS软件的垄断。作为一名普通学生,很荣幸获得了“信才奖学金”,颁奖时吴老师亲自颁发奖状和奖学金,当时除了激动之外,还深刻感受到吴老师的儒学、朴素与平易近人。那时候就下决心,要以吴老师为榜样,努力学习和掌握专长,以技术报国,服务社会。另一位是蔡之华老师,蔡老师是我的毕设指导老师,在毕设上给予了我很大的指导,也是启蒙我学术研究的第一位老师,蔡老师推荐我使用Google(当时Google成立不久,不像现在这样家喻户晓)进行文献检索,让我首次领略到信息检索技术的魅力。毕业之后,我与蔡老师仍然保持联系,在工作和学术研究上,蔡老师一直给予我无私的指导与支持!

学术追求之路

四年地大本科学习之后,我踏上了北上列车继续求学,报考了被誉为中国计算机事业摇篮的中国科学院计算技术研究所,当时选择的研究生导师是李国杰院士,选择的方向是量子信息。复试时,李老师和刘群老师共同面试我,最后刘群老师挑选了我(具体细节可参考刘群老师为计算所建所50周年撰写的《计算所与北大往事回顾》)。自此,我开始了自然语言处理的学习与研究。研究生的第一年,大部分时候是在玉泉路学习。不上课的时候,我就拎着一瓶水在玉泉路校区的计算机机房里待一天,循着论文参考文献织成的网络,贪婪地阅读自然语言处理的相关论文,当天没有读完的论文就用1.44M的软盘拷到宿舍的电脑上继续读,文献上最新的自然语言处理技术让自己非常执迷,有时候读到眼睛上火长包也不知。这期间,我在蓝靛厂实验室待过一段时间,有幸参与了实验室参加的第一届ACL SIGHAN中文分词评测比赛,从张华平(刘群老师指导)师兄开发的ICTCLAS中学到很多自然语言处理的实战知识。

有了第一年的文献阅读积累及分词评测比赛经验,加入实验室之后,我很快就完成了自己的第一个自然语言处理研究工作:复杂命名实体识别。记得当时用三天的时间在纸上完成论文初稿的撰写,然后投到第一届自然语言处理国际联合会议IJCNLP上并被接受。这是我的第一篇学术研究论文,至今记忆犹新。后来,在刘老师指引下,我开始句法分析和统计机器翻译的研究,刘老师对自然语言处理领域的前瞻性方向非常敏锐,总是在合适的时机引导我进入新的研究领域。2005年,我有幸参加了在厦门大学举办的统计机器翻译研讨会(全国机器翻译大会CCMT的前身)。这次会议虽然参会人数不多,但是集中了国内最早从事统计机器翻译研究的单位。在为期不长的会议期间,大家共享资源、深入交流、开发调试机器翻译系统并现场评测不同技术路线。从某种程度上,这次研讨会可称为国内统计机器翻译的达特茅斯会议。会后,参会单位对统计机器翻译进行了持续的深入研究,有力推动了国内统计机器翻译的发展,使其与国际统计机器翻译的差距不断缩小,在某些技术路线和方法上,我们的研究甚至成为国际领跑者。

博士毕业之后,我先后在新加坡资讯通信研究院、苏州大学、天津大学工作,虽然工作单位发生了变化,但我的研究方向始终没有变,对自然语言处理技术的痴迷始终没有变。自然语言处理与认知智能、人工智能终极目标密切相关,2017年国务院印发的《新一代人工智能发展规划》,将自然语言处理技术列为人工智能的八大共性关键技术之一。虽然它具有重要的研究与应用价值,但其研究充满挑战和困难。从20世纪50年代开始,自然语言处理研究经历了70多年的发展,研究范式发生了多次重大变化,从基于规则的方法发展到统计方法,再发展到基于神经网络的方法,作为一名忠实粉丝(NLPer)和研究者,有幸见证和经历了最近一次研究范式的变革。借用张玉洁老师一句话,我们选择了一个一辈子不会失业的工作(原话记不太清,大致意思如此),路漫漫其修远兮,吾将上下而求索!

70年前,天津大学、北京大学、清华大学、唐山铁道学院的地质系(科)合并成中国地质大学的前身——北京地质学院,如今,我在天津大学工作,求学在地大,传道在天大。这既是一种巧合,也是一种责任。衷心祝福母校地大未来发展更快、更强,拥有天大的发展空间!

个人简介:

校友简介:熊德意,天津大学智能与计算学部教授、博士生导师、自然语言处理实验室负责人,天津大学“语言智能与技术”中外联合研究中心主任。主要研究方向为自然语言处理,特别专注于机器翻译、对话、问答、自然语言生成、常识推理、认知计算、智慧医疗等方面。在Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL等国际著名期刊和会议上发表论文100余篇,Springer出版英文专著一部。获得国家自然科学基金优秀青年科学基金、国家重点研发计划“政府间国际科技合作创新合作”重点专项、英国皇家学会牛顿高级学者基金等资助。获得新加坡资讯通信研究院2008年“年度研究贡献奖”、北京市“科学技术奖二等奖”、中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等奖项。曾是亚洲自然语言处理联合会AFNLP干事、新加坡中文与东方语文信息处理学会理事会成员,目前是中国中文信息学会理事。担任IALP 2012&2021程序委员会共同主席,CWMT 2017程序委员会共同主席,欧盟多国联合项目QTLeap咨询专家,ACL、EMNLP、NAACL、COLING、AACL等多个知名国际会议(高级)领域主席,以及TACL和ARR的Action Editor等。