荀恩东教授,信息科学学院院长、语言智能研究院院长、教育部新世纪优秀人才、中国计算机学会名词专委会副主任、中国标准化研究院特聘研究员。曾任微软亚洲研究院副研究员,主要从事自然语言处理、计算机辅助语言学习技术研究和开发工作。主持多项国家863计划、国家自然科学基金项目和国家社会科学基金项目,承担多项部委和公司合作的项目,主持或参与开发了机器翻译、句法分析、信息检索、语音合成和语音识别等多种实用系统。
突破创新 科研项目再创佳绩
近日,国家社会科学基金重点项目《大数据背景下汉语语块数据库建设与应用》顺利结项并被评为优秀项目。本项目由信息科学学院的荀恩东教授团队完成。据统计,国家社科基金重点项目录入率不超过10%,录入后评为优秀的概率不超过8%的情况下,该项目在盲审中被评为优秀,足证明其成果具有极高的含金量。这不仅体现了行业内专家对此项目的认可和高度评价,更体现了该研究的学术价值与前瞻性。
该项目主要服务于中文句法分析,在理论和方法上都有突破性创新。项目在研究广泛借鉴各类先进语言学理论和计算理论基础上,提炼出一个新的理论框架——更契合中文本体的特点的,以“意合图”为表征形式、“块依存”为核心语义表示方案。该理论采用了语块依存的做法,针对汉语特点和实际应用的要求,构造了超大规模“中文块依存树库(北语树库)”。在语块依存的结构分析基础上,围绕实体事件,通过符号运算生成意合图,针对汉语意合语言的特点对语言进行梳理和表征。再利用深度学习方法获取丰富的事件信息,经过前期或后期的人工校对,从而完成面向多种应用场景的句法语义分析过程。
为山九仞,岂一日之功,荀老师团队在科研上取得的成果,离不开他十多年来的积累沉淀。从2007年至今,荀恩东老师曾主持开发过国内外最大的在线中文语料库——BCC语料库(该成果被评为“改革40周年高校科技创新重大成就”)。立足大数据,荀恩东教授深耕中文语义计算理论与方法。同时,荀老师在多个领域开展的汉语语义理解落地应用工作也取得了卓越的成果。
在提供工具和数据资源的同时,荀老师团队还将推出基于网格的语言分析框架——GPF开源框架。该框架引入深度学习的方法,结合符号计算与数值计算,充分利用中文语言知识,瞄准落地场景开展语义计算,与已有的纯参数计算方法有着显著的区别。
实干笃行 北语信科深钻细研
冰冻三尺非一日之功,实干笃行,这是信科数十年来的真实写照。1987年,华体会体
成立了语言信息处理研究所,开始对中文信息处理进行深入钻研。当时,我国著名的数学家、计算机科学家、语言学家和教育家,也是人工智能的开路人之一——马希文教授担任语言信息处理研究所第一任所长。2000年,宋柔教授推动在研究所基础上,建立信息科学学院。宋柔教授在汉语分词、广义话题与方法、汉语句式研究等方面,在学界均取得了代表性成果。目前,学院副院长罗智勇老师仍在这些课题领域进行深入研究。2003年,荀恩东老师在句法语义分析方面取得了一定进展,他主张利用语言学充分理解自然语言的结构和含义,再通过语言结构的表示方式去实现计算。
二十多年来,信息科学学院在自然语言处理领域的人才培养和科学研究均发挥了不可或缺的作用。在每年的计算语言学大会(CCL)上连续几年信科师生都是投稿量和入选率的“双第一”,真正做到了产出成果有特色、有价值。后续,学院将梳理自然语言处理中的基础性理论及方法,推出原创书籍和教材,为学界、教育界贡献力量;同时也致力于将语言智能打造成“国字头”的特色学科。
荀恩东教授团队同时还承担着北语汉语国际教育教学平台的建设工作。日前发布上线的“华体会体
国际中文智慧教育工程”是由信息科学学院和北语高精尖中心主导的校级重大工程,旨在面向全世界的汉语学习者,为线上汉语教学提供资源和工具,满足个性化学习的需求,促进汉语国际教育的发展。信科院的老师们在语音智能、语音习得和留学生的汉字书写、汉语发音特征、分级阅读等方面长期积累的研究成果也将以此为出口进行集成。宽领域的研究方向不仅是教师本人学术、科研实力的重要体现,对于提升学校学科建设水平和社会影响力更是具有重要意义。
谨以治学,勤于实践,对科研踏实认真的态度是荀老师不变的坚持。荀老师倡议:在能保证专业学习的基础上,本科生、研究生和博士生都要积极主动参与到科研项目中,了解科研方向,培养科研兴趣,提高科研能力,为将来开展研究工作奠定基础。同时,学生也需要关注最新的科技发展动态,不断扩充专业知识储备,提高技能,从而有能力去各领域发现问题、分析问题、解决问题、践行一名新时代大学生的社会责任。在此基础上,老师们也会时刻指引同学们,帮助同学们将兴趣发展为能力甚至职业或事业,用量的积累去达到质的飞跃,让同学们早日成为国之栋梁,为科学发展和人类社会进步做贡献。
教学相长 科创助推学子成长
教学与科研是相互促进、相辅相成的。荀老师表示:“科研工作的价值体现首先是服务社会解决具体问题,为学界提供思想,最终将成果用于培养人才。”2022年起,信息科学学院在本科、研究生层面开设《语言结构与计算》课程,把教材、教学、思想体系和算法相结合,将“语言+计算”的创新思路实践于教学,将北语信科学子培养成具有不可替代性、具有社会责任感和创新能力的特色人才。
在荀恩东老师的带领下,信息科学学院的老师们不断凝练教学理论与方法,进一步探寻教育改革的有效途径,不断打磨教学能力和方法,不断探索“新工科”的发展路径,力争取得更多的研究成果,让学生有更多的获得感,为学校和社会贡献力量。
砥志研思,笃行致远。采访的最后,荀恩东老师强调:北语学子在国际化背景下,应当拥有更为宽阔的胸怀和视野,拥有远大的个人理想,心怀价值意识和全局意识,勇担科技强国的国家使命,行以致远,砥砺前行。