人机互动协商能力:ChatGPT与外语教育

摘要:当前,以ChatGPT1为代表的生成式人工智能正以迅雷不及掩耳之势,风靡全世界。人们不再仅仅讨论“准用不准用”“该用不该用”的问题,而是更加关注在应用领域“如何用才更有效”的问题。基于运用ChatGPT完成多种任务的实践,我们发现,人机互动协商能力(human

感谢您关注“永大英语”!

文秋芳 梁茂成

1. 引言

当前,以ChatGPT1为代表的生成式人工智能正以迅雷不及掩耳之势,风靡全世界。人们不再仅仅讨论“准用不准用”“该用不该用”的问题,而是更加关注在应用领域“如何用才更有效”的问题。基于运用ChatGPT完成多种任务的实践,我们发现,人机互动协商能力(human-AI interactive negotiation competence,简称HAINC)是AI能否充分发挥其功能的关键。然而,ChatGPT突如其来的问世使得大中小学措手不及,各级教育目标都明显缺失对HAINC的培养。本文将首先探讨在外语教育中增加这一新的培养目标的重要性和必要性,接着探讨 HAINC的定义、构成要素及其内涵,最后就该能力的培养提出建议。

2. 培养HAINC的重要性和必要性

现有文献在讨论AI与教育的关系时,往往局限于AI的使用前景(如周建设 2019;周建设、薛嗣媛 2023)、AI给教育带来的机遇与挑战(如Halaweh 2023;Michel-Villarreal et al. 2023;刘三女牙等 2019;杨宗凯等 2023;周洪宇、李宇阳 2023)等宏观话题,鲜有文章从实践操作视角,讨论如何更有效地提高师生使用AI的能力。我们认为从用户角度出发,需要把更多的注意力放在如何迎接挑战、扬长避短、有效利用新技术为教育服务等方面。为了了解ChatGPT的功能和有效使用路径,我们在各类工作中反复尝试使用ChatGPT。例如,与它讨论新概念的定义、论文题目的选择、论文的撰写和修改、外语教学材料的编制、外语教学设计,等等,充分了解它能帮助我们做什么,不能做什么。

与AI的互动大大增加了我们参与教研活动的积极性,让我们感到从事科学研究不再是一个人的活动,而是在遇到困难时有一个可以随时求助的助手。这个助手虽不能为你解决所有问题,但能为你在解决问题的过程中提供灵感、提供新视角,推动科研工作继续深入。

与AI多种多样的互动实践使我们深切体会到,AI对每个语言学习者和教师的未来都会产生深远影响。对于学习者,一些人认为AI能够缩小学习者在学习成效上的差异,依据是AI可以提供更多语言学习资源,且能随时随地为学习者提供帮助。AI不再只是工具,而是学习者的语言交流伙伴,可为学习者及时提供反馈。这就好比学生身边多了一位不知疲倦、乐于助人的本族语志愿者和学习伙伴。当然,也有人持相反意见,认为AI很可能会扩大学习者之间的差异。在AI的帮助下,高水平学生的潜力更可能得到充分释放。AI集众人智慧于一身,大大超出单个或多个教师的能力,就像一个挖不尽的宝藏,用户的挖掘能力越强,从中获得的宝物就越多。

在传统课堂教学中,“抓两头带中间”是常见的教学策略。教师通常会根据大多数学生的情况来选择教学内容,决定教学进度,高水平学生的潜力往往会受到抑制,得不到充分发挥。在有限的课堂教学时间内,教师所能教授的内容有限,虽然不同水平的学习者从同样的输入中所获得的理解和收获可能不同,但至少教师对所有学生提供的输入在质、量以及方式上都是相同的,由此产生的差异相对有限。此外,单个教师所拥有的知识容量有限,无论为好学生提供多少额外帮助,与AI相比都显得微不足道。

大部分高水平学生的HAINC很强,获得AI帮助的空间很大,而低水平学生由于HAINC相对较弱,从AI处获得的帮助可能会相对有限。根据近期与ChatGPT的交互经验,我们深深体会到HAINC是从AI处获得更多帮助的关键。因此我们认为外语教育目标亟待增强对HAINC的培养,否则学生的学习成效差异不但不会缩小,反而会扩大,教育公平问题会变得更加突出。

3. HAINC的定义和构成要素

要培养学生的HAINC,必须弄清楚这一概念的定义,它与人际互动协商能力之间存在何种差异以及它由哪些要素构成。

3.1 HAINC的定义及其与人际互动协商能力的差异

HAINC指的是人类用户在与AI交流时需要具备的一种特殊技能,不仅包括人类用户理解AI能力和局限性,对AI提出恰当要求,根据AI反馈采用恰当方式调整自己沟通策略的能力,还包括AI依靠大语言模型解读用户指令(prompt)2 和反馈后,进行策略调整的能力。人类用户和AI在寻求实现共同目标的过程中,通过持续的相互调整和适应,最终达到最佳的沟通效果。

HAINC虽然强调互动和协商,但在实际交流中人类用户和AI的地位并不平等,呈现明显的“主-从”关系。人类用户始终处于主导地位。每次目标的提出、指令的发布、对反馈的分析、对策略的调整,这一切都由人来决定。而AI只是被动适应者,在其能力范围内做出反应并执行任务。这种不平等的关系是HAINC与人际互动协商能力之间的本质区别。导致这种主从关系的主要原因是人类用户与AI在如下三方面存在明显差异。

一是情境理解和意图表达。在人际交流中,交流双方常常对情境和意图心领神会,无须过分明晰的表达,而AI则不然。AI经常无法理解非明确编码的信息,如语境、语调、面部表情和身体动作等。即使新型AI发展迅速,并已具备一定的多模态处理能力,但其识别用户非语言信息的能力仍然有限。AI的这一能力局限对HAINC的影响是,在人机交流中,人类需要对自己的沟通行为不停地做出必要调整,以便于AI正确解读。

二是主观感知和反馈处理。人类用户可根据实时反馈调整沟通策略并理解彼此之间共享的主观经验。然而,AI处理反馈和理解主观经验的能力都是基于大语言模型的算法。这对HAINC的影响是,当今技术背景下的AI尚不能有效地应对人类复杂的情感和意识状态。

三是动态学习和策略调整。人类有着与生俱来的强大的学习和适应能力。相比之下,尽管先进的AI系统具有一定的学习新信息和适应新环境的能力,但这种学习通常仅限于特定的任务或场景,且模型需要大量数据的支撑和反复的训练。这对HAINC产生的影响是,AI的策略调整主要基于大量的历史数据和反复训练,可能无法实时或快速适应新的、即时变化的场景,这就需要人类对互动和沟通策略进行额外的调整。

3.2 HAINC构成要素循环图

上述HAINC的定义及其与人际互动协商能力的差异是我们确定HAINC关键要素的基础。下面我们要讨论两个问题:HAINC由哪些要素构成?这些要素在实际操作中如何运行?

3.2.1 循环图概述

我们提出HAINC包括五大要素:理解AI、设定目标、发布指令、分析反馈、调整策略,可用循环图表示(图1)。五大要素不总是线性或孤立运行,而是在人机互动的过程中相互影响、相互依赖,形成一种连贯的、循环的动态机制,从而实现有效的人机互动。例如“发布指令”环节需要在“理解AI”和“设定目标”的基础上进行。当收到AI的反馈后,用户可能需要重新“理解AI”“设定目标”或者“发布指令”。另一方面,“分析反馈”“调整策略”也可能会影响用户对AI的理解和目标设定,这就形成了一个持续调整和优化的过程。只有当五大要素形成一个完整体系,我们才能更好地与AI进行互动。

从逻辑上说,这五个要素有先后顺序。第一步“理解AI”是人机互动协商的基础和前提,只有理解了AI的能力和局限,我们才能做出有效的目标设定和任务分配,因此“理解AI”位于循环图的最上方。第二步是“设定目标”,即规定AI的工作方向,也就是我们希望AI完成何种任务、取得何种结果。第三步“发布指令”是实现目标的关键步骤,我们需要对实现目标的路径进行宏观和微观规划,编写AI能够理解的清晰指令。这也是许多人称之为“提示词工程”(prompt engineering)(Lo 2023)的一个步骤。第四步是“分析反馈”,即当AI执行完任务后,我们要检查 AI 的任务完成情况,考察目标是否实现,分析AI的行为是否符合预期。接着就是“调整策略”,即基于AI生成的反馈来调整我们对AI的理解、设定目标、发布指令等系列活动。调整后,整个过程会重新开始,形成一个新的迭代周期。如此循环往复,直到用户得到预期的结果。因此,这五个要素不仅是有序的执行步骤,更是一个持续的、反复的循环。一项任务的完成,可能需要多次反复迭代,才能更有效地构建和调整人机协同方式,使AI生成的结果不断趋近于预期结果。

3.2.2 五要素详解

1)理解AI。所谓“理解AI”是指用户要理解AI之所能和所不能,以及与AI互动的基本原则。作为普通用户并不需要深度了解ChatGPT构建的具体过程及其背后的理论,但需要了解它能做什么、不能做什么,以及如何让它去做它能做的事情。换句话说,大语言模型的自然语言理解能力尚不能达到人类的水平,因此人类在与大语言模型互动的过程中,需要不停地迁就对方,用它能够理解的语言(指令)与其进行交流。清楚这一点后,我们在给出指令时,就需要尽量提供具体且清晰的信息,以方便AI通过大语言模型理解指令并据此给出反馈。

2)设定目标。所谓“设定目标”是指人类用户给AI设定需要完成的任务。设定目标时要遵守下面三条原则。第一,任务要有可行性。也就是说,要求完成的任务不能超出AI的能力范围。第二,目标要清晰,细节要充分,发出的指令不能过于笼统。大目标一定要细化为一系列的小目标,让AI逐项完成。第三,目标不能违反道德规范,例如不能要求AI代替用户来完成教师布置的作业或者代写学术论文。AI确实能够为用户撰写论文提供帮助。例如,它能根据用户所读的文献和提出的研究问题,帮助撰写提纲,用户可根据提纲撰写每部分内容;能够对用户所写内容进行校对,修改文字,甚至可以拓展某方面内容,提出修改意见。用户可以向AI求助,但不能完全依赖AI。

3)发布指令。发布指令即“提示词工程”,指用户用清晰、准确的语言对设定目标进行充分描述。这是最为关键的环节,决定任务能否完成。一个好的指令一般包括三个要素。第一个要素是交流双方的身份(role)信息。比如,用户作为学生,希望AI提供帮助,对其完成的作文进行修改,此时双方的身份分别为学生和修正者(corrector)或校对人(proofreader)。明确交流双方的身份有利于充分激发AI在对应领域的潜能,并以用户期待的形式做出反馈。第二个要素是输入(input),即用户需要AI读取的信息,它可以是一篇待修改的作文初稿,也可以是一篇待翻译的原文,等等。第三个要素是输出(output),即用户对自己预期得到的结果进行尽可能充分的描述之后,希望AI给出的反馈。以下是一个请求AI修改作文的指令:

Prompt: As a dedicated TEFL teacher and English grammar expert, your role is to enhance a provided student-written {text}3. For each sentence, you will provide an original and revised version, explaining the necessary changes and highlighting the applicable grammatical rules. The table format will include columns labeled Original, Revised, Error, and Comments. Additionally, you will offer constructive feedback on the overall writing quality, maintaining a positive and encouraging tone.

指令的第一个要素,即双方身份分别为学生和英语老师 / 英语语法专家。需特别提醒的是,我们可以要求AI具备多重身份,这样有利于同时激发AI在两个或多个领域的潜能。指令的第二个要素是输入,即附加在指令后的学生英语作文。指令的第三个要素则是以表格形式输出的AI反馈。表格共有4列,分别列出原文句子、AI修改后的句子、语法错误和评语。如果用户需要其他信息或输出为其他格式,可以对指令相关部分进行相应的修改。

1) 分析反馈。分析反馈指的是对AI完成任务的情况进行深入细致的分析,找出存在的问题。用户需要了解AI输出的结果有时会存在语言问题、事实错误、逻辑混乱。比如,在 ChatGPT 3.5中,我们曾询问“鲁迅与周树人之间是什么关系?”得到的答案是“鲁迅和周树人是中国现代文学史上两位不同的作家”,但在ChatGPT 4.0中询问相同的问题,答案则是“鲁迅和周树人是同一位作家”。由此,我们认为,鉴于AI是基于大语言模型生成答案而非从历史事实中提取答案,因此即便使用了最新的AI系统,用户仍有必要对事实性描述进行逐一核实。再如,当我们询问AI“你能为我的论文撰写提供何种帮助?”时,它会回复“AI不能代用户写论文”,但同时又说,“如果你给我相关文献和研究问题,我可以给你提供论文的大纲,根据大纲逐段撰写,后期还能帮助校对。”很显然,AI的回应前后矛盾。此外,AI的回应流畅性也不完美,常常出现一些不符合使用习惯的中文,即便是英文也会偶尔出错。因此,用户一定要带着质疑的眼光逐一审视AI的所有反馈。

2) 调整策略。调整策略指的是用户一旦发现AI的反馈中存在问题,便需及时增加新指令进行追问,或修改原来的指令。例如,我们曾经要求AI分别为三个不同水平(中级下、中级、中级上)的中国大学生编写同一主题(“比较中西餐桌文化异同”)的英文阅读材料,长度分别为350词、400词和450词,文章包括三部分内容:a)major differences and similarities in Chinese and Western table manners,b)the reasons underlying the differences and similarities,c)the significance of making such a comparison。AI根据要求写出了三篇不同水平同一主题的英语阅读材料。生成的三篇文本在内容、难度等方面基本符合要求,只是词数未达标。中级下水平只有231个词,中级水平只有199词,中级上水平只有244词。于是我们要求AI根据词数要求重写三篇材料,尝试了两次都未成功。这时我们突然意识到AI可能无法同时处理三篇文章的词数问题,我们于是再次改变指令,每个指令只要求AI修改一篇文章的词数,最终顺利完成了任务。

4. 培养HAINC的建议

鉴于HAINC是一种新能力,我们建议开设专门的HAINC课程,对学生进行系统培养。由于目前大学生的课时较多,每天的课程安排较满,HAINC课程可穿插在英语课中进行,也可利用周末或其他业余时间单独开设。这是一门新课程,教学内容一定要精心设计,使其既有系统性,又有可操作性。

4.1 HAINC课程内容

我们建议HAINC课程开设10—12课时,大致包括三个板块:1)AI导论(2课时);2)案例教学(4课时);3)项目操作(4—6课时)。这三个板块不完全呈线性关系。“AI导论”开设于“案例教学”之前,“项目操作”需要为“AI导学”和“案例教学”提供进一步实践的机会。因此第一、第二板块具有前后逻辑关系,而第三板块与第一、二板块几乎同步进行。为了压缩课时,HAINC课程的教学内容一定要精选,同时要与英语教学紧密结合,提供的实践任务要既能培养HAINC的运用能力,又能提高学习和使用英语的能力。

4.2 HAINC教学原则

培养HAINC的原则与培养语言能力的原则非常相似,只是在具体表现上有其自身特点。实施时需要贯彻三条原则:实践导向、循序渐进、及时反馈。

第一,实践导向。这个原则强调将理论知识应用于实践的重要性。在教授如何使用ChatGPT的过程中,学生需要理解AI的工作原理和用途,但相关内容的讲授一定要在解决实际问题中展现,理论与实践不可割裂。建议教师从问题出发,让学生尝试解决实际问题。他们遇到困难的时候才是最佳的教学时机,若在此时帮助学生点明相关理论问题,学习会更有成效。在AI导论课中,教师可先向学生提出一项任务:如果你要在ChatGPT 的帮助下学习一篇新的英语课文,你该如何做?面对此项任务,教师可带领学生向ChatGPT求助。例如:

指令1:我在学习一篇新的英语文章,希望你提供帮助,你需要我把课文原文发给你吗?

ChatGPT:是的,如果你需要我帮助你学习一篇英语课文,你需要先把文本内容发送给我看。这样我才能了解它的内容,进而提供有关词汇、句型的解析,或者帮助你理解和解释文本中的主题、意义和其他重要部分。

指令2:如果文章比较长,该怎么办?ChatGPT阅读文章,长度上有限制吗?

ChatGPT:在给出你特定的答案时,我需要考虑到输入的长度和我生成的输出最长长度。对于我的模型来说,我接受的输入字数有一定上限,大约在2,048个字符左右。如果你的文章比这个长度长,你可能需要将它分割成几部分,然后逐一发送过来。

指令3:如果将文章逐段给你,你会忘记吗?

ChatGPT:作为一个人工智能模型,我实际上没有记忆功能。我不能记住以前的输入或者我提供的输出,也就是说,我无法持续或跨时间地记住信息。我每次产生的回答都是基于我当前的输入,不会受之前输入的影响。因此,每段文本都需要在其自身的情境中包含足够的信息来使我理解并产生有用的回答。

指令4:你说“我无法持续或跨时间地记住信息”,我不明白你的意思,你能进一步解释吗?

ChatGPT:当然,我来解释一下。当我说我不能持续或跨时间地记住信息,我的意思是,我无法将一个问题或者一段情境的信息保存下来并用于处理后续的问题或者情境。

从ChatGPT的回答中,学生可以知道,它发挥能力需要具备一定条件。例如它需要文章全文,但长度有一定限制;对它的每个提问都要提供足够的信息,等等。如果由教师直接告知学生这些内容,效果肯定会大打折扣。只要教师精心设计教学任务,学生就能在与AI互动的过程中了解AI的所能和所不能。这就是HAINC课程“实践导向”的基本要义。

第二,循序渐进。这个原则鼓励学生在理解和解决问题的过程中由易向难过渡,逐步推进,不要让学生感觉到明显的跳跃性。例如在安排案例教学时,如需要四个案例,这四个案例的难度可逐步增加。我们可从运用AI帮助学生学习新英语课文(这是英语课上最常见的任务)开始,后续的三个案例可以是英文命题作文、英文命题口语报告、英文口笔语语体转换。这四个案例从理解到产出,从口语到书面语,从单一语体到两种语体的辨析,都具有典型性,而且在难度上循序渐进,能够切实帮助学生利用AI解决英语学习中的困难。就单个案例内部的教学过程而言,也需要循序渐进,下面以英语口、笔语语体转换为例进行说明。

口、笔语两种语体的转换可能是最为少见的课堂任务,但这又是中国英语学习者的难点。中国英语学习者撰写的作文通常是书面语体与口语体的混合(文秋芳、丁言仁、王文宇 2003)。非英语本族语教师虽有这方面的意识,但可能不知如何帮助学生克服这一问题。我们在使用ChatGPT的过程中,发现AI能够为此提供帮助。那么,教师如何利用这一案例来引导学生学会使用ChatGPT呢?这一案例包括两项任务:一是要求ChatGPT将书面语体文章转化为口语体文章,二是要求ChatGPT列出给定文章中两种语体的具体差异。很显然,第二项任务要在完成第一项任务的基础上进行。这就是在落实循序渐进的原则。

在完成第一项任务时,教师可先向学生提问:如何让ChatGPT帮助我们完成英语口笔语语体的转换?学生可能会回答,虽然理论上知道这两种语体的主要差别,例如词汇的使用、句子的复杂性等,但不知道它们的具体表征,更不知道如何转换。教师可接着说:ChatGPT可为我们提供帮助。学生可能七嘴八舌,提出各种关于如何使用ChatGPT并获取帮助的不同建议。教师可综合大家的建议,提出一个解决方案:我们与ChatGPT的互动从指令1开始。

指令1:我们要通过校英文广播站,号召全校的中国学生和国际学生节约用水,我们已经有了一篇有关节约用水的英文书面文章,想请你帮助我们将其改成口语体英文文章,文章长度与原书面文章大致相同。

ChatGPT很快根据指令完成了任务,然而生成的文章虽是口语体,但其中使用了不少本族语者常用的习惯用语。学生随即发出指令2提出修改要求。

指令2:对不起,我们中的绝大多数都是非英语本族语者,理解本族语者使用的习惯用语有困难。你能考虑我们的困难,对上述文章进行修改吗?

ChatGPT按照要求将文章中本族语者常用的习惯用语进行了替换。学生接着又通过指令3对其提出新要求。

指令3:我想请你将书面语体与口语体的文章作个对比,指出哪些地方体现了这两种语体的差异。

由于指令3的指示语不明确,ChatGPT没有如学生预想那样,针对两篇给定的文章列出两种语体的差别,而是从词语、句子结构等各个方面详细讲解了两种语体的差别,于是学生发布下列新指令:

指令4:刚才你在比较两种语体差别时,举例没有针对具体文章。请你再试一次,举例时务必用我们给你的书面语体文章和你改写的口语体文章。

此时教师可围绕这个案例中所有发布的指令,组织学生讨论如何优化指令的撰写。我们先分析第一项任务。设定的目标看似很明确,要求ChatGPT将书面语体改成口语体。发布的指令也很清晰,不仅提供了文章用途、文章主题、听众等背景信息,还规定了文章长度。在分析ChatGPT的反馈时发现不符合要求,所谓的口语体只适合英语本族语者。可能我们会感到奇怪,第一个指令中已经明确指出,广播节目的听众是中国学生和国际学生,ChatGPT为什么不能按照要求完成任务呢?这里就涉及AI能力的局限性,它一次不能完成符合多个条件的任务。一般情况下,我们预先不知道它一次能满足哪几个条件,这就需要我们通过分析反馈,试探性地理解AI之所能和所不能,就AI未完成的任务,重新发布指令。由于AI不能一次性满足用户要求,用户需要不断循环往复,直到目标达成为止。

现在来分析第二项任务:要求ChatGPT列出同一主题“节水”在口语体和书面语体上的差异及其具体例子。我们想当然地认为,指令3已经清楚地表达了我们要实现的目标,因为前面一直在讨论“节水”这个主题的两种语体,ChatGPT肯定会根据我们讨论的两篇文章来回答问题。然而事实上,AI不会像人际交流一样根据前后讨论的语境来给予反馈。指令4就是在我们分析反馈,进一步理解AI的能力之后,重新设定的目标和发布的新指令。上述过程形象生动地展示了HAINC五要素的循环过程,可让学生了解作为AI用户,五要素流程迭代循环的次数要由用户的目标所决定。

第三,及时反馈。这一原则强调教师要给学生完成的任务提供及时和恰当的反馈。HAINC课程的第一、二板块都在课堂上进行,教师给予的反馈属于即时反馈,而第三板块是项目操作,学生需要在课后独立或小组完成任务。任务有两种类型:1)复习型,即与“AI导论”和“案例教学”中讨论的问题类似,巩固课堂上所学的知识和技能;2)拓展型,期待学生能够解决新问题。对于“项目操作”部分的作业,学生至少要在下次上课前两天提交,留出时间给教师评价。对于复习型任务,教师只需浏览任务完成情况,如发现明显问题,下次上课时给予及时性补救教学。拓展型任务应是反馈的重点。要遵循“及时反馈”这一原则,教师需要提前阅读学生与AI互动全过程的记录,以便从中挑选出具有典型意义的作业,并在下次上课时邀请学生上台演示整个过程,师生共同讨论存在的问题和优化指令的策略。由于每个学生都完成了布置的任务,有各自的体验,因此参与讨论的积极性会比较高。

5. 结语

从ChatGPT的实际运用中可以看出,人类用户与人工智能系统的有效协商交流,在提高沟通效果上起到关键作用。然而,现阶段我们的教育体系对HAINC的培养还是空白。提高HAINC并不仅仅是对新概念的了解,更重要的是为学生提供一个循序渐进的学习和训练过程。因此,我们提议在外语教育中融入HAINC的教学,同时以“实践导向、循序渐进、及时反馈”为教学原则,提高学生对AI的理解和驾驭能力,将AI的潜能充分应用于语言学习之中。此外,以ChatGPT为代表的人工智能仍处于快速发展之中,我们还将面临更多的挑战,例如对于使用AI的伦理道德规范以及如何鉴定AI作用的边界等问题还缺乏清晰、明确的规章制度,我们认为这些问题必须在使用中得到逐步解决。我们期望有更多外语教育研究者关注这一问题,拥抱AI,让外语教育插上AI的翅膀,飞得更快、更高、更远。

(本文首次发表在《外语教学与研究》2024年第2期)

来源:永大英语

相关推荐