作者:郑通涛,曾小燕
摘要:汉语国际教育迅速发展,与之相应的研究却跟不上快速发展的步伐,其最主要的问题在于缺乏科学且可靠的汉语中介语语料库支持。国内中介语语料库存在的问题主要在于缺乏高质量且真实的口语语料资源和跨学科视角、语料数据来源存在局限性、缺少建设学习者的历史语料库、语料库数据尚不能充分共享等五个方面。中介语语料库建设具有复杂动态和非线性涌现的特征。基于大数据思维,"新一代汉语中介语语料库"的设计原则应增设词网技术、学习者特征、社会语言学特征三项;建设原则应遵循真实性、广泛性、历史性、跨学科、课内外、全媒体、无障碍共享等七项原则;实施方法应配置新一代互联网信息的管理系统和抽取系统、网络智能挖掘技术及网络代理。
关键词:大数据; 汉语中介语,语料库; 复杂动态系统; 数据挖掘
获取全文