用好数字技术,加快国家通用语言文字普及


(来源:光明日报)

转自:光明日报

  在国家通用语言文字普及攻坚和质量提升中,持续推进语言文字数智化建设,以数字化赋能国家通用语言文字推广普及具有重要意义。教育部、国家语委、中央网信办2025年1月发布的《关于加强数字中文建设 推进语言文字信息化发展的意见》强调,“加大国家通用语言文字推广普及数字化赋能力度,高水平开展基于数字技术的普通话水平测试,服务铸牢中华民族共同体意识。”笔者以为,大数据分析、自然语言处理、生成式人工智能等技术的迅猛发展,给国家通用语言文字的普及攻坚和质量提升带来了新路径和新方法。

大数据分析技术赋能国家通用语言文字普及的全面攻坚。依托专业工具和算法,大数据分析技术可以导入海量样本并进行数据预处理,从而将样本归类提取,生成某种模式或趋势。这里的大数据分析技术着重强调数据处理的全覆盖,即首先要对国家通用语言文字普及状况和成效进行基本了解与综合分析,通过数据导入生成数据库,内容涵盖多重变量,如受教育程度、语言习得与掌握、外出务工经历等个体和社会差异。相关部门借此可优化语言资源配置,合理调配资源分布,对国家通用语言文字普及程度较低地区的群众展开全面分析,定制贴合未达标群体的适配型语言学习方案与优化学习策略,进行全方位普及攻坚。其次,大数据分析技术可对已有数据进行结构化描述,通过可视化分析方法,导出发展趋势曲线图,直观、全面地呈现语言掌握与语言使用的地域分布、代际差异等,有助于精准制定国家通用语言文字类别化、可适用的推广方案;借助关联性分析方法,将群体语言使用情况进行相似度计算,对具有相同或相近的群体语言特征进行归纳,形成语言数据的线性结构。

  此外,相关部门还可利用大数据分析技术科学评估语言推广效果,通过对政策实施前后的数据进行比对,分析不同路径的推广普及效力,适时调整资源投放和策略倾向;以定制化语言服务为引领,收集不同性别、年龄、职业、教育背景群体的语言能力等数据变量,整合分类、分层解构,充分发挥语言学习平台智能推送精准化、专业化的优势;以聚焦重点区域为抓手,分析统计民族地区群众国家通用语言文字的普及程度、提升效果,有效保障对国家通用语言文字普及薄弱地区和群体各方面的资源支持。

自然语言处理技术赋能国家通用语言文字普及的靶向攻坚。国家通用语言文字的普及率能够反映群体的基本掌握情况,但距离达到标准普通话的水平还有一定差距。以普通话水平测试为依据,各省基本要求,语文教师的普通话水平需达到二级甲等及以上,其他学科教师需达到二级乙等及以上;但在偏远地区或民族地区的中小学校,还有一些教师难以达到这一要求。自然语言处理技术旨在让计算机理解和处理人类自然语言,分析个体语言应用差异,包括语音识别、文本生成、机器翻译、情感分析等。利用自然语言处理技术,我们可以收集语言学习者在国家通用语言文字听、说、读、写方面的实践样本,考察其发音偏误、词汇错用、语法漏洞等问题,精准定位个体在国家通用语言文字学习上的薄弱项,开展针对性攻坚。“靶向”强调“定点”“定人”,即充分发挥自然语言处理技术的精准性、确定性,从字、词、句、段落到语篇,从语音、词义到语法,全面考察群体国家通用语言文字的掌握程度,纠正语言文字使用的不标准、不规范问题。

  相关单位或企业可以开发语音识别与合成技术,通过人机对话的方式,创建智能语言交流平台,让语言系统实时识别、纠正学习者的发音偏误,如音调、平翘舌等问题,并给出偏误提示和针对性训练;运用系统自动识别文本书写规范,纠正错别字、语义不明、语法失范、标点误用等问题,审定文章结构、逻辑理路、主题表达等内容,帮助学习者有效提升书面读写能力;通过算法识别语音或文本的情感倾向,优化口语和写作素材的情感适配,从“会说、会写”提升为“说好、写好”。

生成式人工智能技术赋能国家通用语言文字普及的持续攻坚。国家通用语言文字学习并非一蹴而就,而是一个长期且持续的过程。我国已连续开展28届全国推广普通话宣传周活动。生成式人工智能技术基于算法和模型,在系统学习和机器模拟的基础上生成图文、音视频等资源。我们可利用生成式人工智能技术,突破时空界限和资源瓶颈,智能生成适配不同群体、契合地方文化的优质学习资源,使国家通用语言文字学习更贴近当地习惯和社会风俗,让普通话更加“有情”“有感”。计算机技术的应用往往是机械性的模仿,但要真正做到对人类认知、情感的模拟,还需要进一步提升人工智能技术的应用水平。语言不仅是交际工具,更是表达思想、交流感情的重要手段。我们需要综合运用心理学、认知科学等,生成带有人类思想、情感的音视频、文本,使国家通用语言文字普及更具人性化和接受度,尤其是对文化风俗的情感考量,要选用合适的语言文字表述。

  生成式人工智能技术还可在以下方面赋能国家通用语言文字普及推广:一是建设虚拟师资队伍,将公开课资源库中优秀国家通用语言文字授课教师的教学风格和授课内容进行数字化复刻,以在线讲授、答疑与互动的方式共享优质资源,缓解教育资源不均衡的问题;二是细致描绘语言学习者画像,将学习者的语言掌握程度、知识储备情况、社会生活环境、个人文化认知、语言学习习惯、日常兴趣爱好等信息进行整合,生成定制化语言学习系统;三是营造沉浸式语言学习场景,搭建生活化、情景化的语言学习场域,深度还原当地文化生活的现实情境,帮助学习者在仿真环境中反复模拟,增强学习的积极性和主动性;四是制定专属学习计划,结合个体语言能力、学习时间、预期目标等,向智能系统提出指令,根据学习内容进行拆解,以达到循序渐进的学习效果。

  国家通用语言文字普及经历了不同的发展阶段,新时代要大力推广国家通用语言文字、实现国家通用语言文字教育全覆盖,仅仅依靠单一的学校教学、线下培训是远远不够的,迫切需要精准化、可适配的数字化应用,这是有效解决群体国家通用语言文字学习诉求的根本和保障。

(作者:赵妍,系中国社会科学院民族学与人类学研究所助理研究员)


评论列表 0

暂无评论