拟新增学位授权学科或专业学位授权点的申报及论证材料

365bet官网 > 信息公开 > 信息公开事项

2014年语言智能与技术自主设置目录外二级学科论证方案
发布日期:2016-07-13浏览次数:字号:[ ]

语言智能与技术自主设置目录外二级学科论证方案

 

摘     要

随着社会信息化的发展,大数据、云计算、社会网络、以及移动互联筑构的现代网络环境下的社会生活,向语言智能与技术提出了新的需求与挑战。语言智能与技术学科的设立是契合时代发展,符合社会对语言智能与技术人才的需求,也是365bet官网学科特色建设的重要方面。

语言智能与技术是面向自然语言,研究语言信息的形式化表示和计算方法;采用计算机技术,研究语言信息的抽取、存储、加工和应用技术;为语言研究、教学和其他应用研究开发所需的技术和工具。

语言智能与技术可以服务于一切以语言为对象的研究和应用。在我国学科体系中,语言信息处理是语言学及应用语言学、计算机应用技术、教育技术学等二级学科下的研究方向。目前在我校,语言信息处理是语言学及应用语言学二级学科下面的一个研究方向,该研究方向在张普教授、宋柔教授等的带领下,现在已经建设成为具有10余位中青年学术骨干形成的研究梯队,在课程体系建设、人才培养方面积进行了良好的探索、在计算语言学理论、语言工程、语音工程、语言教育技术和语言数据挖掘等多个方向上取得具有特色的成果。

我校以汉语国际教育为特色和龙头专业,而这个专业的发展,越来越要依靠信息技术。信息技术水平的高低,是汉语国际教育水平高低的硬指标,而且这一指标的重要性将越来越突显。无论国内还是国际,尚无一所大学或研究机构,在汉语国际教育和计算机技术结合方面达到了我校的水准,更无一家单位具有我校在这方面的发展潜力。我校要取得世界一流的语言大学的地位,从发展语言智能与技术学科入手,是最有效的途径。

初步统计,以语言智能与技术为主要研究方向的在职教授有9人,副教授5人,讲师2人,还有一批教授和副教授的研究工作与语言智能与技术相关。师资队伍方面,该学科年龄和层次搭配合理,且大多数专业人员都是语言学和计算机科学的两栖专家,在我校建立语言智能与技术二级学科,具备较好的人员基础。

语言智能与技术学科内涵既包含学科基础研究内容,也包含语言应用中所涉及的具体问题。在我校设立语言智能与技术二级学科,可以建立以下研究方向:计算语言学理论、语言工程、语音工程、语言教育技术和语言数据挖掘。计算语言学侧重开展语言智能与技术的基础理论和方法研究;语言工程重点解决语言应用中的实际问题;语音工程重点解决语音应用中的实际问题;语言教育技术可以结合我校的语言教学工作,探索使用信息化技术支撑语言教育的手段和方法;语言数据挖掘研究面向语言的机器学习方法,构建语言常识。

在我校建立语言智能与技术二级学科,在这个学科下招收博士和硕士研究生,开展语言智能与技术理论和应用的研究,建设在国际上有影响的语言智能与技术研究中心,为365bet官网建设“世界一流的语言大学”添砖加瓦。


 

目      录

 

一.学科基本概述.............................................................................................................. 6

学科内涵.......................................................................................................................... 6

国内外设置该学科的状况和发展情况................................................................................ 7

该学科的主要研究方向及研究内容................................................................................... 9

该学科的理论基础.......................................................................................................... 12

该学科与其相近二级学科的关系..................................................................................... 13

二.设置该学科的必要性和可行性.................................................................................... 16

社会对该学科人才的需求情况......................................................................................... 16

设置该学科的目的.......................................................................................................... 17

本单位设置该学科已具备的基础..................................................................................... 20

该学科的发展前景.......................................................................................................... 23

三.该学科的人才培养方案............................................................................................... 24

培养目标........................................................................................................................ 24

生源要求和选拔方式....................................................................................................... 25

课程体系的设计方案及依据............................................................................................ 26

培养和学位的基本要求................................................................................................... 27

四.该学科的建设规划..................................................................................................... 29

研究方向........................................................................................................................ 29

师资队伍........................................................................................................................ 29

人才培养........................................................................................................................ 30

科学研究........................................................................................................................ 30

学术交流........................................................................................................................ 31

教学科研基本条件.......................................................................................................... 31

经费保障........................................................................................................................ 31

 


一.    学科基本概述

(一)          学科内涵

语言是人类信息最重要的载体,承载了人类文明和智慧的发展。随着社会信息化的发展,语言智能与技术日趋深入到国家军事、政治、经济、学问、科技、信息等核心领域,彰显出前所未有的重要功能、战略意义和安全价值。大数据、云计算、社会网络、以及移动互联筑构的现代网络环境下的社会生活,向语言信息处理提出了新的需求与挑战。365bet官网的建设目标是“世界一流的语言大学”,语言智能与技术学科的设立是契合时代发展,顺应我校建设目标。

语言智能与技术可以服务于一切以语言为对象的研究和应用。在我国学科体系中,语言信息处理是语言学及应用语言学、计算机应用技术两个二级学科下的研究方向。从当前语言信息处理在语言研究中所承担的功能与对学科的作用来看,将语言信息处理和相关方向提升,建设成为我校的二级学科,可以整合学科资源,完善学科体系,强化人才培养。

语言智能与技术学科内涵既包含学科基础研究内容,也包含语言应用中所涉及的具体问题。在我校设立语言智能与技术二级学科,可以建立以下研究方向:算语言学、语言工程、语音工程、语言教育技术和语言数据挖掘。计算语言学侧重开展语言智能与技术的基础理论和方法研究;语言工程重点解决语言应用中的实际问题;语音工程重点解决语音应用中的实际问题;语言教育技术可以结合我校的语言教学工作,探索使用信息化技术支撑语言教育的手段和方法;语言数据挖掘研究面向语言的机器学习方法,构建语言常识。

语言智能与技术的内涵:面向自然语言,研究语言信息的形式化表示和计算方法;采用计算机技术,研究语言信息的抽取、存储、加工和应用技术;为语言研究、教学和其他应用研究开发所需的技术和工具。

(二)          国内外设置该学科的状况和发展情况

语言信息处理和计算语言学最早起源于美国,其学科和教育的形成也始于欧美。虽然没有国内的学科分级制度,但是欧美许多大学由实验室和研究团队通过为本科生和研究生开设课程和讨论班,来授予相关方向的学位。从这层意义上来讲,也可以被视作我国的“二级学科”。其中具有较大影响力和较悠久历史的有美国约翰霍普金斯大学、斯坦福大学、卡耐基梅隆大学、马里兰大学、哥伦比亚大学等,欧洲的有剑桥大学、莱比锡大学、亚琛工业大学、都柏林大学等。近年来欧美国家高度重视语言信息处理事业的发展和学科建设,并投入大量人力物力,在国家安全、新一代互联网和在线教育等方面着力突破语言处理这一关键关口。2012奥巴马政府通过了大数据计划,以国家力量推进相关产业和政府、国防应对信息技术革命的能力。语言信息处理技术是其中的重要支撑技术。

同样在国内,已经有若干家高校和研究所开展了语言信息处理相关学科的学科建设和人才培养。更有数十家科研院所和高校开展相关方向科研工作。这是近年来的一个科研热点。

北京大学在App与微电子学院下设有“语言信息工程系”,旨在为App工程和现代语言服务行业培养高层次、实用型、复合型、国际化的专门人才,培养学生具有从事涉及互联网大数据处理、语言信息处理技术的App应用系统研发能力或从事现代语言服务的能力。该系目前开设“语言信息处理”专业与“计算机辅助翻译”两个专业。

清华大学分别在人文学院、计算机学院下属的“自然语言处理与社会人文计算实验室”招收计算语言学和语言信息处理方向的硕士、博士研究生,分别授予文学学位和工学学位。

教育部语言与文字应用研究所下设“语言文字应用系”和“计算语言学研究室”,将“计算语言学”作为一个二级学科单独招收博士、硕士研究生,开展包括文字计算、语言信息处理方面的研究。

社科院语言研究所将“语音与自然话语处理学科”作为重点学科,下设有“机器翻译和自然语言信息处理专业”。开展自然语言处理、机器翻译方面的研究。

西藏大学在“中国语言文学”之下设立了“藏语计算语言学”的二级学科,于2013年申报获得博士研究生点。该学科是我国首个自主建设的藏语计算语言学二级学科。

上海交通大学在电子信息与电气工程学院所属“计算机科学与技术”学科下,设立“计算语言学”二级学科,其培养的研究生均授予工学学位。

此外,中科院自动化所、中科院App所、中科院计算所以及哈尔滨工业大学、厦门大学、苏州大学、复旦大学等高校均有语言信息处理、计算语言学方向的研究生招生计划。

我国政府对语言信息处理的战略支撑与规划也有悠久的历史:早在1957年就开展了机器翻译研究,是世界上第四个开展机器翻译研究的国家。改革开放以后从国家层面支撑了多样化的语言信息处理评测和课题研究。进入新世纪后,语言信息处理在提升国家信息化水平,国家语言能力的战略中起到了越来越重要的作用。

综合国内外的情况来看,“语言信息处理”及“计算语言学”已经形成较为完备的学科体系,所研究内容明确,研究方向清晰,在我校,研究团体具有一定规模,具备了成立二级学科的必要条件。

(三)          该学科的主要研究方向及研究内容

结合我校的特点设立“语言智能与技术”学科,主要研究方向分为以下:计算语言学、语言工程、语音工程、语言教育技术和语言数据挖掘。

计算语言学是本学科的理论基础,主要研究语言信息的分析和生成的基础理论和方法。包括词汇、句子、篇章等各个语言层次的词法、句法、语义、语用等常识表示和计算模型。

语言工程是语言信息服务于社会生活各种应用的实践,相比计算语言学,语言工程不以语言信息处理普遍问题作为研究目标,更关注解决具体应用问题。针对具体应用问题,结合应用特点,应用语言信息处理理论和方法,给出满足应用要求的解决方案。

语音工程是在研究语音产生、传递和知觉的科学,其研究内容是揭示基于人类发音器官的生理、物理机制的声音产生规律、语音信号在各种环境及媒介中的传输特性、以及基于听觉器官和神经系统的语音知觉和理解机制。研究的技术内容包括语音识别、话者识别、语音合成、语音编码、人机对话等。

语言教育技术运用现代教育理论与信息技术,通过对语言学习资源和语言学习过程的设计、开发、使用、评价和管理,实现优化语言教学和语言学习的理论与实践。

语言数据挖掘是数据挖掘技术在语言研究领域的应用,在语言研究领域,客观上需要收集、加工和处理大规模数据和语料,并从这些的语言材料中查找有用的信息、发掘新的语言规则及论证语言规律。

以上研究方向既独立、各有侧重,又有联系、相互支撑,计算语言学是学科理论基础,语言工程是包括语言信息的各类应用,语音工程是包括语音信息处理的理论和应用,教育技术是结合我校特点,重点开展的语言信息研究和开发工作,语言数据挖掘重点在面向语言的机器学习方法研究,从海量语言数据中挖掘语言常识。

以上研究方向的具体研究内容详述如下:

  1. 计算语言学研究内容包括:

  • 研究语言形式化理论。

  • 研究语言分析方法与语言计算模型,包括词汇、句子、篇章等各个语言层次的词法、句法、语义、语用分析等。

  • 研究语言生成技术和方法,主要面向句子和篇章段落的生成。

  • 语言大数据及智能计算中的语言研究和应用。包括面向语言大数据的数据挖掘和常识抽取算法等。

  1. 语言工程研究内容包括:

  • 研究语言大数据资源采集、加工、存储、统计、数据挖掘等处理技术。

  • 研究语料库标注和检索技术和方法。

  • 研究社会计算相关的技术和方法,包括语言生活监测与语言信息安全。

  • 研究语言翻译技术,包括机器翻译、计算机辅助翻译技术等。

    (3)语音工程研究内容包括:

  • 第二语言的语音习得规律,计算机辅助二语语音习得技术,包括发音自动评测等。

  • 中介语韵律标注体系与语音数据库建设。

  • 语音病理学。

  • 语音识别与合成。

(4)语言教育技术研究内容包括:

  • 研究母语和第二语言语言教育技术理论。

  • 研究数字化语言教育资源建设的技术和方法,包括多媒体素材、课件、语料库、语音库的开发与应用技术等。

  • 面向语言教学者,研究大数据和移动互联下的教学模式和方法,研发数字化课件设计和制作技术。

  • 面向语言学习者,研究数字化、网络化和移动互联下,学习模式、学习方法和学习绩效评估方法,研发各类语言学习工具和系统。

    (5)语言数据挖掘研究主要内容包括:

  • 语言大数据及智能计算中的数学模型研究。

  • 数据挖掘和常识抽取算法研究及其在语言研究中的应用。

  • 文本分析挖掘。

     

(四)        该学科的理论基础

语言智能与技术具有显著的多学科交叉特点,是语言学、计算机科学、数学、教育学等的交叉学科。语言智能与技术一般采用形式化表示和数学建模的方法,依据语言学理论,研究合适的算法,利用计算机,解决语言研究和应用中的问题。作为重要的应用领域,语言教育技术自然与教育学密切相关,最直接相关的包括教育技术学。

语言智能与技术作为二级学科的理论基础包括以下几个方面:

(1)语言学

语言学是语言智能与技术基础理论之一。语言智能与技术研究对象是人类交际中使用的自然语言。语言学理论揭示了人类自然语言的普遍规律和原理,包括语音学、词汇学、句法学、篇章和语义学在内的语言学研究成果,对采用计算机手段解决语言研究和应用中的问题起到重要的理论引导作用。同时,语言智能与技术的发展,使得语言学可以借助更广泛的语言事实揭示语言规律。信息化研究手段也会大大提高研究效率,因此会极大推动语言学基础理论的研究。

(2)计算机科学与技术

计算机科学是语言智能与技术的基础理论和方法之一。语言智能与技术旨在采用计算机技术,解决语言研究和应用中的问题,包括语言数据的存储和访问、语言数据信息化方法、语言信息服务等,它们都需要计算模型及处理技术支撑。

涉及计算机科学基础理论和方法的方面包括:数据结构、算法分析与设计、程序设计、数据库技术、网络技术等。

(3)数学

数学是语言智能与技术基础理论之一。语言学发展中的乔姆斯基学说,形式化理论和方法都与数学密切相关。数学中的语言形式化理论、统计方法、机器学习等都是语言智能与技术基础理论内容。

(4)教育学

语言教育是教育的一个重要方面。教育学自然是语言教育的基础理论。语言教育相关的技术是语言智能与技术的重要研究和应用方向之一。在教育学中,教育技术学与语言教育技术关系更为密切,包括:语言学习资源和语言学习过程的设计、开发、使用、管理和评价的理论和实践。

(五)   该学科与其相近二级学科的关系【重点说明与其相近学科的区别】

在目前学科分类体系中,规划中的语言智能与技术的研究方向分散在多个学科门类的二级学科下,例如:计算语言学是中国语言文学中语言学与应用语言学二级学科的一个研究方向;计算语言学和语言工程是计算机科学与技术中计算机应用技术二级学科的一个研究方向;语言教育技术是教育学中教育技术学二级学科的一个研究方向。此外,语言教育技术中的汉字教学技术研究方向,与中国语言文学中汉语文字学相关;语言工程中的机器翻译和计算机辅助翻译研究方向,与外国语言文学中的外国语言学与应用语言学相关。

考虑到以上学科现状,大家整合语言智能与技术相关的主要研究方向,把语言智能与技术设置为二级学科,语言智能与技术学科将这些学科有机地结合起来,在自身发展的同时将为这些上级学科的发展注入生命力。使语言学研究与语言信息更加紧密联系,增强动力和活力;加强计算机应用技术下自然语言处理的语言理论研究,使自然语言处理有语言基础理论支撑;建立人工智能的数据挖掘研究与语言的大数据处理联系,增加实证意义;语言教育技术研究同语言理论、计算机科学理论结合,为语言教育技术发展提供支撑。

语言智能与技术与各个相关二级学科的关系如下:

(1)语言学与应用语言学

语言学和应用语言学包括很多研究分支,以前语言信息处理作为其研究方向之一,这种做法随着发展显示出局限性。首先,语言信息处理内涵不断加大,在语言应用服务社会的作用越来越凸显,所以在研究对象、研究方法和应用价值方面,不再适合作为语言学及应用语言学的一个研究方向,应该提升为二级学科;另外,随着信息技术的发展,语言学及应用语言下其他研究方向,也借助信息技术开展研究工作,与语言信息处理已经不再是简单的并列的不同研究方向的关系。

(2)计算机应用技术

计算机应用技术按照处理对象不同,包括语言、文字、图形、图像和视频等诸多方面,其中跟语言相关的计算语言学、语言信息处理、中文信息处理等都可以被认为是计算机应用技术中的研究方向。这些名称不同侧重面不同,但是研究的对象都是语言,都是人工智能研究的核心领域。

随着大数据、云计算等计算机技术的发展,语言信息处理技术已然被赋予了新的内涵,从我校的特点来看,将其提升到二级学科的高度,对推动计算机应用技术的发展是有益的,也符合学科的发展。

(3)汉语言文字学

汉语言文字学分为现代汉语和古代汉语两个大方向,主要研究从上古到现代的汉语的口语系统与文字系统的演变规律、结构特征和现实状况。其研究方法多采用实证方法,包括语言、语音和文字字形数据的采集、加工、统计与分析等。语言信息处理方法为汉语言文字学研究工作提供了强有力的技术支撑。

语言智能与技术以汉语言文字为处理对象,不仅仅支撑语言文字学理上的研究工作,更关注语言文字应用中产生的问题,包括字形计算等问题。

(4)教育技术学

教育技术学是以教育科学的教授理论、学习理论、传播理论和系统科学理论为基础,应用现代科学技术成果与系统科学的观点和方法,在既定的目标前提下探求提高教学效果的技术手段和教学过程优化的理论、规律与方法。教育技术学为语言智能与技术中的语言教育技术提供理论引导。

同时语言教育作为教育的一个方面,具有其特有的、具体的内在规律,语言教育技术就是针对语言教育,研究语言教学的技术方法,提高语言学习的效率。

(5)外国语言学与应用语言学

一般认为翻译理论和实践是外国语言学与应用语言学的重要内涵,机器翻译和机器辅助翻译是翻译实践中重要的技术支撑手段,机器翻译和机器辅助翻译可以提高翻译效率,在翻译实践中越来越受到重视。机器翻译水平的提高,得益于翻译实践中产生的大数据和翻译常识,重视语言智能与技术,深入开展机器翻译和机器辅助翻译对翻译实践大有裨益。

 

二. 设置该学科的必要性和可行性

(一)          社会对该学科人才的需求情况【重点说明社会对该学科高层次人才的需求情况】

语言是人类智能的最突出表现,语言智能与技术的过程,就是赋予信息以智能的过程。它将在信息时代实现对人类智能的放大和链接,因此具有极为重大的科学意义和应用价值。同时,语言智能与技术的研究与应用正逐步引领信息技术的新革命,其经济效益与社会效益十分巨大,难以估量。因此本学科的发展也将逐渐成为衡量一个国家现代化水平的重要标志。在今天,本学科的建设也是确保国家信息安全,语言安全的重要基础。

世界上各发达国家都把语言智能与技术作为国家发展的重点与长期战略,对其研究、资助及应用提到了前所未有的高度,人力、物力、财力的投入持续提高。随着语言智能与技术在现代社会重要地位的逐步凸显,社会对本学科各层次专业人才需求旺盛,本学科毕业生具有文理交叉的特点,是同时具有语言学与计算机科学相关常识与技能的复合型人才,既可以从事语言信息相关科学研究,还可以从事相关工程实践,具有较好的就业前景。在教育机构、各大科技企业及政府、咨询单位等均有广泛需求。

对本学科高层次人才,社会需求更为强烈。目前,大数据、常识图谱、计算大脑及MOOC等各类新概念层出不穷,但其核心研究与技术均与语言智能与技术息息相关。因此,世界各大资讯、教育机构和高科技企业如苹果、脸书、GOOGLE、IBM、MicroSoft等及相关研究机构,我国的百度、阿里、Tencent、新浪、讯飞等知名企业,与语言信息及安全相关的国有企业、政府机构等对语言智能与技术的高层次人才需求旺盛。可以预见,随着未来语言智能与技术的覆盖度与广度的进一步扩大,对本学科高层次人才的需求将持续扩大。

 

(二)          设置该学科的目的【重点说明设置该学科与本单位发展目标和学科特色形成的关系】

365bet官网的发展目标是“建设成为世界一流的语言大学”。“建立和形成国家完整的语言科学研究和语言技术研发体系”是对这一目标的重要实践。信息技术是语言科学研究领域的理论和应用研究基础,设置语言智能与技术学科将对构建学校的四大学术方阵,完善语言科学的学科体系与人才培养模式,起到重要的支撑作用。并将成为语言科学研究领域理论和应用研究的重要基础。

我校以汉语国际教育为特色和龙头专业,而这个专业的发展,越来越要依靠信息技术。信息技术水平的高低,是汉语国际教育水平高低的硬指标,而且这一指标的重要性将越来越突显。无论国内还是国际,尚无一所大学或研究机构,在汉语国际教育和计算机技术结合方面达到了我校的水准,更无一家单位具有我校在这方面的发展潜力。我校要取得世界一流的语言大学的地位,从发展语言智能与技术学科入手,是最有效的途径。

(1)语言智能与技术学科的建设符合学校发展目标和学科规划。

学校在“十二五规划”中提出“增强学科间的协作能力,促进新兴交叉学科的生长和发展”,“争取把中国语言文学一级学科整体建设成为国家重点学科”。语言智能与技术学科是语言学和计算机科学的交叉学科,设立并发展语言智能与技术学科,既能够为“中国语言文学”一级学科注入计算的活力,利用现代信息技术促进语言研究手段的现代化,又能够为“计算机科学与技术”学科提供语言学的理论引导,赋予我校计算机学科以鲜明的语言计算特色。

学校在规划中还提出,“加强科研工作,以促进学科发展、解决汉语国际教育及相关学科中面临的重大问题为主攻方向”。设立该学科,可以更好地将语言智能与技术应用于对外汉语教育实践中,通过计算技术提取、处理对外汉语教育研究中的难题。同时,对外汉语教育的发展也将丰富语言智能与技术的研究内容,从而在语言智能与技术和对外汉语教育之间形成良性互动。

(2)设置语言智能与技术学科有助于丰富、完善学科建设内涵。

语言智能与技术主要是语言学和计算机科学的交叉学科,从学科分类角度来看,计算语言学是语言学及应用语言学二级学科下的研究方向,自然语言理解和机器翻译等语言智能与技术的相关方向隶属于计算机应用技术二级学科。语言教育技术是教育技术学二级学科下的一个研究方向。

随着语言智能与技术研究范围及其应用范围的不断扩大,固有的学科层次设定已经限制了该领域的进一步发展。为避免目前已有学科的研究方向过于庞杂,有必要厘清目前语言学及应用语言学二级学科中计算语言学的研究方向,以及计算机应用技术学科中自然语言处理研究方向的内涵与性质。事实上,多年来在我校,语言智能与技术无论从理论、技术还是方法上,已经形成了向其他诸如汉语言文字学、语言教育学等诸多方向辐射、渗透的态势。同时,对于计算机应用技术学科来讲,诸如图形图像处理、生物信息技术、网络安全等方向也都不同程度渗入了语言智能与技术。实际上,语言智能与技术自身已经发展成为有着完整理论体系和技术应用的领域。将语言智能与技术设置为二级学科将有助于丰富国家和学校的语言科学和计算机科学的学科建设内涵,对完善学科结构有着重要的促进作用,有利于形成新的学科增长点。

(3)语言智能与技术学科的建设有利于整合学校科研团队,突出团队优势和学科特色。

语言智能与技术二级学科将以计算语言学、语言技术、汉语教育技术等为主要研究方向。经过多年的发展,我校在这些研究方向上已经有了丰厚的积淀。1987年我校创建了语言信息处理研究所,2003年成立了应用语言学研究所,2004年成立“国家语言资源监测与研究中心平面媒体分中心”,2009年建立汉语国际教育技术研发中心。多年来,伴随着这些研究机构的发展,我校在语言智能与技术方面已经形成了自己的鲜明特色:面向国家和社会的需求,研究计算语言学、应用语言学理论,发展语言技术与工程、汉语教育技术、国家语言资源监测等关键技术和进行大数据资源建设,支撑对外汉语教学和语言研究。

语言智能与技术二级学科的设置将有力地推动我校在语言信息处理方面积累的师资队伍、科研团队、技术与数据资源等各方面的整合,使大家的力量更加凝聚,学科特色更为突出。在我校多年的学术积淀基础上,建设目标是建成国际上最高水平的汉语信息理论的研究中心,语言教育的技术中心和语言教育资源中心。

(4)通过学科建设,吸引优秀生源,打造品牌专业,更好的满足社会需求。

随着互联网和社会媒体的迅速发展,以及人工智能等计算技术的突飞猛进,语言智能与技术已经是一个重要的研究和应用领域,国家和社会对语言学和计算机科学交汇融合培养出的复合型人才也提出了更大的需求。设立语言智能与技术二级学科,将更加有利于吸引该领域的优秀生源,培养出更多语言与计算的复合型优秀创新人才,满足社会对语言智能与技术人才与技术的需求,适应社会发展和学术进步的需求。

(三)          本单位设置该学科已具备的基础

365bet官网开展语言智能与技术研究工作有非常悠久的历史。1987年,在国内最早建立了语言信息处理研究所,马希文教授、张普教授、宋柔教授等著名专家为我校语言信息处理研究工作奠定了坚实的基础。现在,一批中青年学者活跃在相关的研究领域,经过多年耕耘,在计算语言学、语言工程和语言教育技术等多个方向上取得一系列领先成果。在硕士研究生人才培养方面,已经形成了较为成熟的课程体系和教学体系,为社会输送了语言智能与技术方面的人才。

(1)研究机构

作为语言类高校,学校重视语言教学研究与信息科学的交叉融合。多年以来,随着学校事业的发展,成立了一系列语言智能与技术相关的研究和开发单位,包括:

1987年成立的“语言信息处理研究所”,是国内第一家语言信息处理研究所。

2003年成立的“应用语言学研究所”,主要从事语言信息处理相关的理论和方法研究。

2004年成立“国家语言资源监测与研究中心平面媒体分中心”,中心与相关单位合作。每年《中国语言生活状况报告》和流行语发布成为了北语品牌成果和活动之一。

2010年成立的“汉语国际教育技术研发中心”,是国内该领域唯一一家专门从事语言教育技术研发的科研机构。

2012年成立的“国家语言信息处理实验教学示范中心”,是我校唯一一个国家级实验教学中心。

此外,学校的对外汉语教学研究中心也设有语言信息处理方向。经过多年发展,365bet官网在语言信息处理学科建设方面取得了显著成绩,形成了特色鲜明,文理结合的多学科交叉的科研体系。

(2)人员基础

365bet官网在国内是最早开展语言信息处理研究工作单位之一,马希文教授、张普教授、宋柔教授等著名专家为我校语言信息处理研究工作奠定了坚实的基础。现在,一批中青年学者在相关领域开展研究工作,形成了特色鲜明、层次合理的研究梯队。一些老师积极参加国内外语言信息处理相关学术机构,开展学术活动。在国内,365bet官网在语言信息处理领域成为了具有重要影响力的研究单位。

初步统计,以语言信息处理为主要研究方向的在职教授有9人,副教授5人,讲师2人,还有一批教授和副教授的研究工作与语言信息处理相关。师资队伍方面,该学科年龄和层次搭配合理,且大多数专业人员都是语言学和计算机科学的两栖专家,承担着多个国家级或省部级科研项目,具备较好的计算语言学教学科研基础。

表:研究方向学术带头人

研究方向

学术带头人

主要研究人员

计算语言学

杨尔弘教授

邵艳秋教授、王志敏教授、刘鹏远副教授

语言工程

荀恩东教授

罗智勇副教授、于东讲师(博士)

语音工程

张劲松教授

曹文教授、张林军副教授、解焱陆副教授

语言教育技术

徐娟教授

张习文教授、郑艳群教授、付永刚副教授、安维华副教授

语言数据挖掘

刘贵龙教授

李吉梅副教授、石嘉明副教授

 

(3)人才培养

目前,365bet官网在语言学及应用语言学下,招收硕士和博士研究生、在计算机应用技术下招收语言信息处理硕士研究生。经过多年发展,研究生教育已经形成规模,具有完善的语言信息处理课程体系, 具有很强的人才培养优势。已经培养出一批计算语言学领域的学科人才,积累了丰富的人才培养经验。多年来社会对本专业的毕业生需求旺盛。毕业生就业主要去向包括:高校、高科技企业、国家政府机关等从事对中文信息处理、网络教学的科研、外汉语教学、教学与管理工作。

(4)科研成果

多年来,校内相关研究机构在语言信息处理领域开展深入研究工作,在词语和篇章分析、字形计算、术语学、语言监测、语言教育技术等多个方面取得了丰硕的科研成果。研发了多种大型语言数据资源,在国内外处于领先地位。多项科研成果应用于学校语言教学实践中,并被国内外多家企事业和科研单位采用。全国本科生和硕士生对外汉语教材,以及对外汉语教学研究书系、学科发展报告中,凡有关汉语教育技术方面的内容/分册均由我校教师承担。

近年来,大家承担了国家863计划1项、科技部支撑项目1项,共承担国家级科研项目21项,省部级项目14项,北京市科项目3项,我校科研项目12项,博士后及横向项目7项;开发语料库16个,语言处理工具及系统18个,国家专利2项,编写学术专著和教材8本,在国内外学术期刊和会议上发表论文255篇。

 

(四) 该学科的发展前景

随着互联网的发展,语言信息处理的应用范围越来越广泛,并且已经渗透到了社会生产和生活的诸多方面。从个人电脑到企业内部网络,再到互联网和移动设备,从资讯、图书、情报领域到信息安全、电子商务、大规模在线教育、智慧城市、计算大脑等,都能够看到语言信息处理技术在发挥巨大作用。语言信息处理大大提高了人类处理语言文字信息的效率,增强了人机交互的自然度与便捷性。在这种背景下,各大企业纷纷成立自然语言处理研究部门,并大量招聘语言信息处理方面的人才,大有供不应求之势。

在智能信息处理学科方面,近年来包括大数据、云计算、深度学习等为代表的计算技术有力地推动了语言信息处理技术的进步。互联网搜索引擎、GOOGLE机器翻译系统、IBM “沃森”深度问答系统,均成为语言信息处理技术不断取得阶段性突破的标志。

语言是人类思维的窗口,也是透视社会的窗口,对语言信息处理的研究是人工智能进一步发展的突破口,也是打开社会计算之门的金钥匙。语言技术与社会科学,如社会学、传播学、广告学等相互结合的趋势明显,利用语言技术自动地从社会媒体中挖掘常识和规律,预测社会发展趋势,具有非常广阔的应用前景。

近年来,顺应学科发展的需要,国内外各高校开展语言信息处理研究的实验室越来越多。北京大学、清华大学、中国社会科学院语用所、西藏大学等高校和科研机构更是设立了语言处理相关的学科专业,从而更集中地开展科学研究和人才培养。越来越多的语言信息处理相关学科的设置,将丰富、完善学科的体系及学科内涵,促进科学和社会的发展。

 

三. 该学科的人才培养方案

(一)          培养目标

为保障国家语言安全和信息安全的人才需要,应对我校科研的信息化进程,适应语言学学科自身发展的需求,完善我校语言研究与教学的学科建设和高层次人才培养体系,大家将按照复合型和国际化的人才培养需求,培养具有扎实语言学常识和信息技术,具备跨学科研究能力,胜任工程开发和理论探索,全方位服务语言学研究、语言教学和语言信息处理事业的高级专门人才。

在专业方面,学生应具有坚实的语言学、计算机科学技术基础和外语水平。熟练掌握有关语言信息处理专业基础理论并具有深入的专业常识,了解所属研究领域的发展现状、趋势和研究前沿,至少熟练掌握一门外语,能够阅读本专业的外文资料,具有独立从事本学科或相关学科领域的教学、科研或专门技术工作的能力。

在培养环节上注重工程实践和理论研究相互结合,信息技术与语言学常识相互渗透,从而培养适应能力强,发展潜力大,在工业界和学术界都有施展空间的跨界人才。

语言信息处理的学科培养目标可概括为:

  1. 掌握自然语言的形式化模型与计算方法;

3.掌握语料库及语言大数据建设、管理的原则与方法;

4.具备语言信息资源采集、加工、检索与统计分析能力;

5.掌握语言教学系统设计理论,具有语言教育信息处理的能力;

6.掌握多媒体资源开发与应用技术,具有语言教学系统应用与评价能力。

(二)          生源要求和选拔方式【重点说明学习者应具备的基础常识、基本素质、能力等】

语言信息处理学科招收博士研究生,在中国语言文学博士一级学科下授予文学博士学位。

(1)招生对象:

  • 应届硕士毕业生;硕博连读本科毕业生。

  • 具有硕士学位或同等学力,有志于从事语言信息处理事业者;

  • 海外具有同等资质的相关专业人员。

(2)基本要求:

  • 热爱中华学问,遵纪守法,具有较高思想素质和道德品德;

  • 掌握语言学基本理论和基本常识;

  • 掌握计算机科学与技术的基本常识并具有一定的动手能力;

  • 具备良好的外语听说读写译的能力;

  • 具有相应的研究能力、良好的团队协作能力、一定的创造性思维能力和初步从事科学研究的意识。

(3)选拔方式:

  • 入学考试采用笔试与面试相结合的方法,着重考核学生的专业基础常识、专业能力与综合素质。

(三)          课程体系的设计方案及依据

语言信息处理二级学科的课程设置以理论研究和实际应用为导向,结合我校语言学研究、汉语国际教育、对外学问传播的实际需求,形成公共基础课、专业必修课、专业选修课、导师面授课等多层次的课程体系。

(1)其中,公共基础课主要培养学生基本的思想道德品质和外语能力,包括:公共英语(小语种学生可改选相应语种课程),政治理论。

(2)专业必修课程主要针对学生研究方向的基础理论,培养和提升学生常识的深度和广度,使其对学科具有良好的总体认识,并能够独立阅读文献,承担一定科研任务。包括:形式句法学、形式语义学、语料库语言学、语音处理技术、计算语言学、语言学研究中的科学方法、统计自然语言处理、语言教育技术概论等。

(3)专业选修课程围绕学科发展的前沿问题,扩展和补充相关的研究进展和现状,使学生对学科发展前景形成进一步认知,以推动其科研工作的开展。包括:汉字字形计算、韵律加工与识别、语言认知与计算、教育测量理论、中文信息处理、汉语国际教育概论、文本信息挖掘、机器翻译、机器学习、语义网络与本体计算、模式识别、教育心理学。

(4)导师面授课程主要针对每个学生的科研课题展开,由导师负责讲授,其意义在于培养学生解决实际问题,在实践中获得科研能力。

(四)          培养和学位的基本要求【培养环节的设置与要求,质量保证的措施,学位论文的基本要求等】

(1)培养环节

采用全日制学习方式,学习年限一般为3至5年。可提前答辩,但不得短于3年,也可以延迟答辩,但不得超过8年。具体年限由导师根据情况决定。

博士生的培养实行导师负责制。采取以导师为主的集体引导的方式。遵从学校研究生管理制度的相关规定。同时注意发挥所在科室、教研室在培养博士生工作中的作用,为博士研究生创造良好的学术环境。

博士研究生的培养以科学研究为主。重点是培养独立从事科学研究工作的能力,并根据培养方案的要求、学位论文的需要和个人的特点来选择学习相关的课程。在拓宽基础、加深专业、掌握前沿的基础上,学会进行创造性科学研究的方法,并培养严谨的科学作风。

导师要根据本学科培养方案的要求,结合博士生的基础和特长,在博士研究生入学半年内引导博士研究生制定个人培养计划。培养计划应对课程学习、开题报告、学术活动、科学研究、学位论文等具体要求和进度做出详细计划。博士研究生课程学习可与论文工作穿插进行,但最迟要在论文开题前获得全部学分。

(2)教学质量保证

导师和引导小组要重视对博士研究生的思想政治教育和道德品质教育,关心博士研究生的全面成长,培养其良好的职业道德和团队精神、拼搏精神。导师应积极安排和帮助博士研究生参加国内外学术交流,了解国内外学术动态,开阔科学视野,活跃学术思想,掌握学科前沿。

博士研究生所在单位应努力为博士研究生创造良好的学术环境。各学科专业应积极举办学术沙龙或学术报告会,为博士研究生创造学习和交流的机会。并支撑博士研究生参与国内外评测、竞赛和学术/工业会议。

(3)论文与学位管理

博士生申请论文资格的基本条件包括:必须修完所有规定的课程;完成论文选题报告并获得博士生引导小组与专家委员会的认可。学位论文选题应紧密结合信息社会时代特色,能够体现较高的理论研究水平与较高的应用价值。对学位论文的评阅与审核必须正确把握研究生学位论文的规格和标准,对论文的选题、开题、调研、撰写、定稿、答辩等环节严格把关。

修满规定学分,完成论学位文并通过答辩者,经365bet官网学位评定委员会审核,授予博士学位,同时获得博士研究生毕业证书。

 

四.    该学科的建设规划【从研究方向、师资队伍、人才培养、科学研究、学术交流、教学科研基本条件、经费保障等方面分别论证】

(一)   研究方

目前,语言信息处理二级学科包括以下主要研究方向:计算语言学、语言工程、语音工程、语言教育技术和语言数据挖掘。这些方向在365bet官网具备比较完整的建设基础。在深入这几个方向研究工作的同时,大家将根据学科特点和要求,进一步拓展研究方向。

这些研究方向都具有丰富的内涵,在建设时,需要重点突破,重点开展术语学、语篇分析、语言监测、社会计算、语言资源建设、移动学习技术、语音评测、语义计算、计算机辅助翻译等方面的研究工作,争取在这些研究方向上,取得领先水平。

(二)   师资队伍

本学科师资力量强,已经有三名博士生引导教师,完全具备培养博士研究生的能力与条件。为了进一步优化教师队伍,大家拟从两个方面进一步强化师资队伍建设,一是提升已有师资的教学科研水平,包括加强选派访问学者,在职称、学缘、年龄等各个方面优化师资队伍;二是要造就知名学者,扩大学科影响力。积极鼓励青年教师的科研立项,主持和承担重大科研项目,以科研项目为平台,聘请一定数量兼职教授和兼职研究员。

(三)   人才培养

在语言智能与技术二级学科下,培养博士研究生,授予文学博士,根据学科特点和社会人才需求,建立研究生培养课程体系,以优质的教学培养优质人才,完善博士生论文培养工作。培养具备扎实的学科常识基础,独立的教学科研能力,可以满足本学科发展的各个方面的需求的毕业生。

建立硕博连读制。语言智能与技术是一个交叉学科,要学习语言学、计算机科学技术、教育学、数学等课程,还要写出具有较高创新水平的论文,3年时间明显不足。若能硕博连读6年,更有利于人才培养。

利用365bet官网特色,培养国际学生,扩展学校人才培养体系,为学校发展提供新的生源增长点。

(四)   科学研究

在计算语言学研究方向,开展语言信息研究和应用中的基础理论和方法研究,研究涵盖字形、词法、句法和语义的各个层面语言信息的分析和生成方法,为学科发展开展基础性工作,重点开展在大数据背景下,术语学和篇章语义计算的方法;语言工程方向重点研发语言资源建设的标注和应用方法,为中介语语料库和多语平行语料库建设提供平台和技术保障,开展语言监测、社会计算和语言安全相关的研发工作,研发机器翻译和计算机辅助翻译核心技术和系统;在语言教育技术方面,面向汉语母语教学和二语教学,研发语言教学和学习的资源和系统,重点开展在线语言学习课堂、语音评测、移动互联下语言学习技术,为北语模课提供资源和核心技术支撑。

在学科建设同时,关注语言信息相关的国家战略和国家需求,主动开展研究工作,服务国家战略和需求;突出重点,深入开展研究工作,争取得到社会科学、自然科学等国家重大项目的基金支撑。

(五)   学术交流

语言智能与技术二级学科具有显著的交叉学科特点。学科要发展壮大,需要多学科的融合发展,积极开展学科内和跨学科学术交流,积极发起、主办、承办各类相关的学术活动,活跃学术氛围,提升语言信息二级学科在国内外的学术地位和影响力。

在各类相关的学术刊物上发表科研成果,在条件成熟时,创办学术刊物。积极开展与相关企业和研究机构的合作,建立联合实验室,发挥365bet官网语言资源优势。鼓励参加各类学术机构和协会活动,鼓励在相关学术协会兼职,扩大365bet官网的影响力。

(六)   教学科研基本条件

建立和发展语言智能与技术二级学科具备硬件条件和App条件。语言智能与技术在我校具有基础。大家可以利用现有的学部学院架构,整合各个相关的学术单位

科研教学基础条件是学科建设的物质保障,大家将全力创造良好的教学科研条件,配备、完善各项基础设施,促进学科的快速、健康发展。

(七)   经费保障

近年来,学术队伍已承担了多项国家自然科学基金项目、北京市自然科学基金项目、国家社科基金项目、教育部项目等。今后,还将进一步拓展经费来源,力争经费来源多元化,规模化。学校将进一步加大对本学科教学科研条件和教学科研环境建设的力度,以期进一步提高教学、科研的总体水平,形成高水平科研平台,培养更多的高层次专门人才。

 




打印本页 关闭窗口
Produced By 大汉网络 大汉版通发布系统
XML 地图 | Sitemap 地图