什么是语言智能?胡开宝教授带来第五期外语学科新生学术引领计划通识教育系列讲座

时间:2023-01-01浏览:230设置

为积极推进“多语种+”办学战略,突出“会语言、通国家、精领域”,帮助外语学科新生从一开始就了解本学科的知识体系和研究领域,提升外语能力,掌握基本的学术研究方法,学校特邀资深学者举办“外语学科新生学术引领计划”通识教育系列讲座。2022129日,第五期外语学科新生学术引领计划通识教育系列讲座在上外松江校区成功举办,胡开宝教授为大家分享:什么是语言智能。讲座由东方语学院院长程彤教授主持。

讲座主讲  胡开宝教授

讲座主持  程彤教授

讲座现场

讲座伊始,胡开宝教授和同学们分享了他尝试用DeepL机器翻译软件翻译莎士比亚著作的故事:他发现DeepL机器翻译可以翻译出来部分具有文学性特征的意境,其准确率在83%左右。这引起了在场同学的浓厚兴趣,胡老师进一步解释道:“只要有语言的存在,只要语言发挥了作用,就可以使用机器翻译。虽然机器翻译达不到人工翻译的高要求,但机器翻译的速度很快,并且在汉译英方面,机器翻译可能会优于人工翻译。”胡老师指出,机器翻译属于语言智能技术,其背后的强大支撑就是语料库,没有语料库的研究,语言智能的发展寸步难行。接下来,胡老师从“语言智能的界定与范畴”“语言智能的发展历程”“语言智能的主要研究领域”以及“面对语言智能,我们该做什么”几个方面讲述了关于“语言智能”的知识。

引言

什么是语言智能?,胡老师开门见山地指出,语言智能即运用计算机信息技术让机器具有处理、分析、应用人类语言的能力。同时,胡老师也指出,语言智能虽然能给外语教育带来了巨大的冲击,降低了对外语教育和外语人才的需求,但这并不代表着外语教育和外语人才的培养就此不重要了,反而是愈加重要,因为语言智能离不开语料库,需要大批外语人才潜心语料库研究。胡老师向同学们分析了语料库的三大特征:智能化、大数据、专门化。他强调,判断一个翻译机器好不好,就要看其后台运用了什么样的语料库。

语料库特征(整理自讲座内容)

语言智能的界定与范畴

说到语言智能,就不得不谈到人工智能。胡老师详细为同学们讲解了人工智能的起源和定义。人工智能起源于1956年在Dartmouth大学召开的一次学术会议,被誉为人工智能之父John McCarthy与一批数学家、信息学家、心理学家、神经生理学家、计算机科学家首次提出了这个概念。人工智能可定义为研究智能行为的科学,其最终目的是建立关于自然智能实体行为的理论和指导创造具有智能行为的人工制品,人工智能可分为科学人工智能和工程人工智能。前者的目的是发展智能模拟的理论,以帮助我们了解人和其他动物的智能行为,而后者主要研究建立智能机器的概念、理论和实践,如程序验证系统和智能机器人等。

紧接着,胡老师指出语言智能则是指语言信息的智能化,即运用计算机信息技术模仿人类语言的智能,分析和处理人类语言的科学。语言智能旨在运用计算机信息技术让机器能理解、分析和处理人类语言,实现人机语言交互。为帮助大家更好地理解语言智能,胡老师介绍了语言智能的主要范畴,例如自动作文、机器翻译等等,都是语言智能的体现,也都和语言学、语料库密切相关。

语言智能的主要范畴(整理自讲座内容)

语言智能的发展历程

了解了语言智能的概念和主要范畴后,胡老师进一步为同学们展示了语言智能的发展历史。他指出,语言智能的发展历程共有三个阶段。第一阶段为上世纪50年代至80年代,侧重于机器翻译、自然语言理解以及相关算法等领域的研究。第二阶段为1980-2000,随着机器学习理论、算法、语料库和知识库等在语言智能领域的应用,自然语言处理、机器翻译和人机对话研究发展迅速。机器翻译主体从理性主义主导转向为经验主义主导,即从基于规则转换转向基于统计和基于实例的转换。新世纪以来,语言智能进入了第三阶段,即机器学习阶段。大数据被用于语言智能。比如,2012年,微软向全球发布了采用深度学习技术的全自动同声传译系统;2016年,谷歌公布了基于深度学习的神经网络机器翻译系统,其核心就是语料库,而且是海量的平行语料库。苹果siri和百度度秘运用了语音识别、语音合成、知识库检索等技术,使机器具备了智能语音交互功能。

讲座现场

语言智能的主要研究领域

关于语言智能的主要研究领域,胡老师介绍了以下六个方面。

1语音识别,是指利用计算机自动识别语音的技术,有广义和狭义之分。前者指利用声音进行说话人识别的技术,比如公安局用此来识别诈骗电话;后者指利用计算机识别出语音信号所表达的内容,将语音转换为文字,比如微信聊天中的语音转文字功能。

2语音合成,是指用人工的方法生成语音的技术,可以看到的看不到的信息变成可听信息,让非即时获得的信息变成即时可听信息。比如通过喜马拉雅APP收听电台广播,听有声读物等。

3智能写作,是指机器创造性地生成自然语言的过程。智能写作可以完成一些初步的写作,比如用机器撰写一个地震的简讯的模版。智能写作的过程可以分为阅读信息、提取信息和撰写稿件三个步骤。比如撰写一个公司的业绩新闻稿,首先要会阅读业绩报告,抓取主要信息(年度收入利润等),再根据收集的信息撰写新闻稿。

4智能批改,是指利用计算机自动完成学生作文和作业的评分与反馈等一系列工作。不过,智能批改系统也存在一些明显不足,如重视语言分析,忽视内容的分析,对语言和篇章结构分析不足等。

5机器翻译,利用计算机把一种自然语言符号转换为另一种自然语言符号的过程。机器翻译是一种二度创作,如果没有人工翻译,就没有机器翻译。目前的机器翻译发展已经进入神经网络的瓶颈期——a不是所有的语言都有海量的语料库,语料库至少要达到一亿级的规模;b能耗巨大;c由于机器翻译是利用模型分析、翻译的,当它出现错误时,一般找不到错误出处;d模型迁移性较弱,比如新闻性模型翻译不了政治性文本,这就意味着有多少文本类型,就需要研发多少模型。胡老师认为,如果能够在建模的时候,将人类的知识加入其中,将会使机器翻译更准确。

6智能问答,就是计算机运用信息检索和自然语言处理技术自动分析用户提问、辨识用户意图,并提供精准答案的系统。智能问答也运用了语音识别技术、检索技术、语音合成技术和海量的知识库等。


面对语言智能,我们该做什么

胡老师提到,语言智能发展给外语专业教育和外语专业人才带来的冲击,那么面对语言智能,我们该怎么做呢?胡老师阐述了他的想法。首先,调整外语专业的培养方案,外语学习者不仅需要语言知识、跨文化素养,还需要有语言智能专业的相关知识。其次,增设语言智能课程,比如语言智能基础、语料库基础、自然语言处理等。再者,创新教学模式,语料库技术和语言智能技术的应用可以推动外语专业课堂教学的数据化和可视化,可以将有关教学内容的讲解与分析建立在数据分析和大量语料观察的基础之上,教学因而更加直观、客观,从而有效提高翻译人才培养质量。最后,培养对接语言智能发展的外语人才,要求学生既掌握较强的翻译技能,也掌握语言智能技术。胡老师指出,在语言智能时代,数据为王,但数据不是从天而降的,需要语言学专家来研制语音语料库。机器翻译系统的研制也需要外语专业人才,比如需要双语术语库,需要技术评估,需要译前译后编辑等一系列人为操作。


结语

讲座最后,胡老师总结道,语言智能时代已悄然而至,机器翻译逐渐取代人工已成不争的事实。我们应当未雨绸缪,努力培养对接语言智能发展的外语专业人才,努力构建适应语言智能发展需求的外语专业人才培养体系,着力培养掌握语言智能基础知识及相关能力,精通外国语言文学知识,具有双语转换能力的高端外语专业人才。程老师也针对讲座内容简要总结道,大家一定要踩准时代发展的点,思考如何将语言跟人工智能联合起来,同时也要明白自己喜欢干什么,能够干什么。胡老师的讲座不仅为大家普及知识,还拓展了大家的视野和思维方式,为大家今后的学业职业发展提供了选择方向。

讲座现场


SISUer

通过参加这次讲座,我认识到了语言智能的概念,了解到了语言智能的应用范畴和未来发展方向,这也引发了我对未来外语学习方向的思考,受益颇深。今后,我会积极主动地学习一些有关语料库、语言智能方面的知识,不断充实自己,让自己成为有跨学科、交叉学科知识的高端外语人才。


推荐学习资源

1. 《人工智能》,李开复、王永刚著,2018,文化发展出版社;

2. 《语音识别原理与应用》,洪清阳、李琳著,2020,电子工业出版社;

3. 《人工智能导论》,李德毅主编,2017,中国科学技术出版社。

《人工智能》

《语音识别原理与应用》

《人工智能导论》

 


返回原图
/