大学生不考试啦,那未来怎么评价?

360影视 动漫周边 2025-08-06 19:29 3

摘要:近期,多所“双一流”高校纷纷启动对绩点制度的调整与改革。复旦大学已引入“P/NP”成绩机制,允许部分课程不计入绩点;南京大学、华中科技大学、上海财经大学、中国人民大学等高校,也在逐步弱化绩点排名的权重,推动以“去量化”“去内卷”为导向的学业评价变革。2025年

观察家

近期,多所“双一流”高校纷纷启动对绩点制度的调整与改革。复旦大学已引入“P/NP”成绩机制,允许部分课程不计入绩点;南京大学、华中科技大学、上海财经大学、中国人民大学等高校,也在逐步弱化绩点排名的权重,推动以“去量化”“去内卷”为导向的学业评价变革。2025年7月26日,北京大学宣布自2025级本科生起取消绩点(GPA)制度,成为近年来改革力度最大的高校之一。

作为一个长期高度依赖绩点的教育体系,这一系列变化不仅是对教学管理细节的微调,更标志着高校对“唯分数论”的反思正在从边缘走向主流。绩点制度的松动,不只是技术性的修修补补,它所触及的,是教育预设的根基。

在本文中,胡泳追问:分数究竟是什么?我们为何如此依赖它?从“绩点制改革潮”出发,他引导我们重新理解学习的意义,思考一种可能的“无分数”学习想象。

文/胡泳

评分制度是现代教育最突出的特点之一。在成千上万间教室中,评分早已成为普遍接受的教育常规。这一制度的“自然性”,堪比教科书的使用、学生按课桌排列的方式,或教师的在场——它们都是“学校教学语法”(grammar of schooling)的一部分。从小学年级到高等研究生项目,教师每周要花大量时间批改作业和考试,学生为分数而焦虑,不断比较彼此的成绩,家长则以各种方式表达对孩子分数的关注乃至焦虑。

上过学的中国人几乎都熟悉一句顺口溜:“考考考,教师的法宝;分分分,学生的命根。”考试与分数,似乎在整个教育过程中都是天经地义的存在。那么,让我们首先提出一个看似简单的问题:“分数究竟是什么?”

一、分数是什么?

从最基本的层面来看,成绩是教师用来评估和报告学生表现的一种方式。通常,它以分数(0到100分)和相应的字母等级(A至F,通常不包括E)的形式呈现。例如,考试得了89分,那么对应的成绩就是B+。成绩已成为青少年时期极为重要的一部分,以至于我们发明了“平均绩点”(GPA)这样的指标,用一个看似精确的数字来表达学生的学业表现,方便他人快速评判。

这种评分制度可追溯至1785年,当时耶鲁大学校长埃兹拉·斯泰尔斯(Ezra Stiles)将毕业班学生分为四个等级:“最优者”(optimi)、“次优者”(second optimi)、“较差者”(inferiors)和“最差者”(pejores)。可以说,成绩制度在美国教育体系中由来已久。

如今,成绩已成为几乎所有美国学校作出学生相关决策的主要依据。无论是升班还是留级,抑或是学生应进入何种课程层次(如大学预科课程、荣誉课程或大学先修课程AP),都取决于成绩。很多高中通过成绩计算GPA和学生排名,而高校在录取过程中,也通常将成绩作为筛选学生的重要标准之一。

与青少年时期许多转瞬即逝的事物不同,成绩具有持久而深远的影响:一旦被记录,便成为决定未来成功的关键机制。中学、大学,乃至雇主,都通过这一机制评估个体的学术成就。想要让父母满意、考上大学、获得奖学金、找到好工作——无论目标是什么,你都需要拿到好成绩和高分。

正因如此,人们很容易将“成绩”视为一种既定且不可避免的存在——仿佛它自古如此,而对其历史起源与演变过程缺乏认识。结果是,尽管成绩本身存在诸多局限性,各相关方却很少对其提出批判性反思与质疑。

然而,成绩并非一直存在于美国的教育体系中,全球也不必照搬其做法。成绩制度并不总是以相同的形式出现,也并非始终服务于同样的目标或产生一致的影响。因此,重新探讨“分数”究竟为何存在,有助于我们更批判性地理解当下评分制度的地位,并进一步思考:成绩是否真的必要?它的功能与作用是什么?其效用与潜力又如何?

考虑到这些问题所能带来的启发,令人惊讶的是,历史学界对这一主题却鲜有关注。若要厘清成绩的起源、设定目标以及其为何演变为今日模样,有必要将其置于教育发展史的更广阔背景中加以考察。

早期的美国评分系统深受欧洲模式影响——以持续竞争、奖励机制和名次排序为核心,服务于教学目的。但随着强制性大众教育的引入,情况发生了根本性变化。大众教育将学校置于一个日益受复杂官僚体制主导的社会中心,其中也包括教育体制本身。

那些原本偏向本地化、个性化、用于教师与学生家庭之间沟通的评分系统,开始承担起外部沟通与系统组织的职能。教育从业者日益将成绩视为构建教育体系的工具,而不仅仅是教学手段——评分制度逐渐被赋予了“学习成果的通用语言”这一功能。

随着19世纪末美国教育改革者努力构建全国性教育体系,评分制度逐渐从教学工具转变为组织管理工具,用于促进学生流动、学校沟通和系统协调。尤其是在1899年美国大学入学考试委员会(即今天的大学理事会)成立后,这一趋势更为明显。推动标准化评分的目的,是使各大学不仅重视班级排名,还能基于统一标准判断成绩:不同学校的A等成绩应具有可比性。教育改革者强调,评分系统必须具备快速解读的特性,具备抽象性与标准化形式的特性。评分制度由此成为教育官僚化进程中的关键技术之一,是教育量化的主要手段,也是学生分类的核心机制。简而言之,评分制度可以被视为现代主义的一种重要体现。

当然,并非所有人都将成绩制度视为无可指摘。事实上,许多教育者曾对成绩带来的影响表示担忧,特别是它对课程设置与教学活动的干扰。一位名叫I.E.芬克尔斯坦(I.E. Finklestein)的教育者曾指出:“当我们考虑到几乎所有教育机构都普遍使用某种分数系统——无论是数字还是字母——来表示学生的学业成就,并且当我们看到师生双方都对这些分数作为真实成就的指标抱有极大信任时,我们不禁对这一评分系统可靠性的盲目信任感到惊讶。学校管理者一直自信地使用着一种完全没有校准的工具……”

1918年,经济学家托斯丹·凡勃伦(Thorstein Veblen)批评道:“学术评分和学分制度……不可抗拒地将越来越多的教学实践扭曲为机械化的测试,同时不断扼杀所有在其范围内出现的个人主动性与抱负。”著名教育思想家约翰·杜威(John Dewey)在20世纪初的大量著作中也强调,学生应以主动探索与真实体验为学习核心,而非被动接受标准化评分主导的教学模式。

尽管存在上述批评,教育政策制定者仍不断推进其系统建构的目标,追求教育的客观性与统一性。这一努力贯穿整个20世纪。随着学校数量增加及多个国家引入义务教育,对标准化进步衡量方式的需求推动评分制度广泛流行。

尤其是在大学,GPA制度作为量化学业评价机制,在全球高等教育中被广泛采用。它具有显著优势,也存在结构性弊端。到了2025年,我们所处的世界早已不同于19世纪。那么,我们是否已经需要重新探索一种更全面、更包容、更契合当代需求的评估体系?

二、评分制掏空教育的灵魂

评分制度的设立有两个主要目的:激励学生,以及评估其理解程度。但实际上,它在这两个方面都适得其反。评分制度不仅鼓励无意义的任务,扭曲学生的学习动机,同时也无法有效评估其真实的理解水平。

如今,在大学课堂上,无论是什么学科,教师往往必须设计一系列“可评分”的作业来支撑课程的存在;而学生则将时间投入到那些可以快速获取分数的任务上,而非那些真正蕴含“活的思想”的作业内容。我多年的教学经验表明,学生对成绩的关注程度越来越高。他们走进课堂,思考的已不再是这门课能带来什么知识或思维方式,而是它是否容易通过、作业是否简单、老师是否给分宽松。符合这些条件的课程往往成为学生争抢的“香饽饽”。“水课”泛滥、刷绩点成风,分数至上的心态引发激烈内卷。功利性的学习不仅令学生疲于奔命于机械任务之中,也悄然掏空了教育的灵魂。

评分制度还往往加剧学生之间不健康的竞争。“你考了多少分?我是不是比你高?”这类比较屡见不鲜。高GPA成了保研、出国、申请奖学金的通行证,也催生了越来越多的学术不诚实行为。围绕成绩的焦虑不断累积,教学也被深刻裹挟:教师被动迎合评分标准,以考试为导向进行教学;学生则采取死记硬背、揣摩出题人思路、制定应试策略等方式进行学习。实际上,在这个根深蒂固的体系中,我们真正衡量的,往往不是“学习本身”,而是“考试成功的能力”——这两者并不等同。

另一个令人担忧的问题是,学生被简化为一个单一的数字。教育系统日益忽视每位学生独特的个性,因为每个人都被纳入一个标准化的工业化框架,按照统一的变量加以筛选和评判。GPA这种量化机制难以准确反映学生的学习风格、兴趣取向、潜在能力及成长轨迹。

成绩单并不是引导学生走向知识盛宴的“胡萝卜”,它本身反倒成了教育的全部焦点。分数让学生误以为,知识本身并不值得追求。于是,他们像驴子追着胡萝卜一样奔跑——奔向的不是知识,而是成绩。唯有拆除这套虚假的脚手架,真正的学习动机才有可能生长出来。

一旦摆脱由分数驱动的激励误区,学生的注意力就将回到更有意义、也往往更具挑战性的学习任务上。相应地,教师也必须设计出内容本身足够有价值的作业,而不是依赖分数去驱动学习意愿。最终,教师以什么吸引学生,学生就会依托于什么。如果能打破从小被灌输的“奖赏机制”,学生将获得真正的学习自由,遵循内在的标准前行,而这种内在标准往往比获得“A”等级所要求的更为严格。唯有好奇心与内在驱动力,才能真正培养出优秀的学习者,而不是靠操控与计分来塑造所谓“优等生”。

要真正讨论评分的问题,必须区分“成绩”和“评估”这两个概念。评估应该是一种反馈机制,其目的是帮助学生了解自己当前所处的水平,并引导他们朝向更深的理解或更高的掌握水平前进。评分并不总能做到这一点,而评估应该做到。值得一提的是,“评估”(assessment)一词源于拉丁语 assidere,意为“坐在旁边”。这正是评估的本义:陪伴学生,观察其理解程度——他们知道什么、不知道什么——并据此判断他们需要什么。有时,成绩也可以提供类似信息,但很多时候,学生根本不知道成绩意味着什么。它只是一个相对于班级平均水平的数字,而非指引他们接近知识与真理的坐标。

同样,我们也应区分“挑战”与“压力”这两个概念,它们并不总是同步出现。学生在自愿接受的挑战中,往往能够超越自我;而在被迫接受的任务中,却难以实现同样的效果。在学生尚未发展出学习兴趣之前,学业焦虑便已将他们推入被动的学习状态。多数学生并非因为对未来的憧憬或对知识的热爱而学习,而是出于一种对“差成绩可能带来灾难”的模糊恐惧。从恐惧出发,固然在短期内可能有效,但它扼杀了真正的学习之源。

三、问题出在哪?

从历史发展的轨迹来看,最终是“评分派”占据了上风。人们普遍接受“打分”作为常态,并转而争论“最有效的评分方法”应当是什么。教师不仅将分数视为有效的激励工具,随着教育体系的扩张和高校数量的增长,成绩也逐渐成为最实用的交流语言。许多家长坚信,学校对儿童和青少年最重要的教育成果,体现在那张成绩单上。

然而,批评声音始终未曾消失,既有呼吁重建学生内在动机的传统观点,也有聚焦学生福祉的新兴思潮——因为越来越多的年轻人因成绩不佳而焦虑,甚至陷入沮丧与抑郁。

当学生成绩优于同侪时,会不会感到自豪?当成绩落后时,又是否会感到羞耻?这些感受绝非琐事。在情绪层面,它们令人筋疲力尽,并可能在日常生活中带来巨大的心理压力;在现实层面,它们影响大学录取、职业机会乃至财务稳定性。成绩已成为影响学生身体与心理健康的重要变量。

随着学生厌学情绪日益加重,我们仿佛回到了原点。教育正面临一项根本性挑战:是否要彻底取代评分制度?在过去一个多世纪里,人们始终在“主观反馈”与“客观评分”之间摇摆。然而,那些在历史上试图摒弃评分制度所暴露的问题至今仍未解决:我们该如何比较不同学生的学习水平?毕竟,大学录取体系本身就是围绕成绩设计的。那么,教师呢?在班级人数庞大的情况下,教师又如何既评分又为每位学生提供充分反馈?

这正是围绕评分制度辩论的核心所在:学生、教师、家长,甚至大学招生官,实际上根本无法确切理解一个字母成绩——这个被我们视为学生学校生活核心指标的评估体系——究竟意味着什么。比如,一个“A”是否真能代表学生完全掌握了历史课的内容?一个“C+”是表示学生“差不多”理解了数学知识,还是说他其实是个数学高手,只是未能按时提交作业?

困惑源于评分标准的缺乏统一。事实上,即使在同一所学校中,教授同一门课程、面对同一年级的教师之间,也往往没有一致的评分标准。这就造成了所谓的“成绩迷雾”——我们搞不清一个“A”或“C+”到底意味着什么,因为一个字母常常被赋予了太多彼此无关、甚至互相冲突的信息。

不同教师之间,评分方式的差异巨大。几乎每位老师对作业、课堂表现、小测验和考试的权重都有不同处理方式。一个学生可能在考试、小测验和课堂讨论中展现出对知识的扎实掌握,但仍然不及格,仅仅因为作业权重设定过高,而他在这方面总是遇到困难。这种情况显然是不公平的,也揭示了加权评分体系之间存在的巨大差异——它直接影响一个学生是否被视为“成功”,哪怕他已掌握课程的核心内容。

有的老师将作业纳入评分,有的则完全不计;有的为作业打分,有的只看是否完成;有的教师将大型测验设为关键权重,有的则不然。学校难以统一教师的评分方式,而普通学生往往也无从理清这些差异。此外,是否应将“非学术因素”计入评分也一直存在争议,比如最常见的“迟交作业”。将学生行为纳入成绩,其实是试图强加一种狭隘的“成功学生”标准,这无疑扭曲并削弱了成绩本应具有的客观性。

对学生而言,这增加了他们的认知负担。他们不仅要理解课程内容,并在学术上取得高分,还需应对一个并不总是透明的评分体系。对教师而言,评分同样困难,尤其是在学生面临升学与择业压力的情况下。例如,两个分数之间的微小差距,往往难以真正体现学生在理解力或掌握程度上的本质区别。许多时候,打分不过是一种形式化操作,难以捕捉学习的真实状态。

四、构建一种新系统

在21世纪,我们是否仍应接受“评分”作为衡量学生学习成果的主要方式,并努力让其更加客观?还是应该探索一种无需评分的知识表达与沟通机制?值得注意的是,根据前文的历史溯源,评分系统其实并不“古老”,而是在相对较短的时间内迅速建立的。几乎整个现代评估体系与大学录取标准,都是在第二次工业革命期间构建起来的。

评分制度的“新鲜性”恰恰是我们必须重新审视它的重要原因之一。一个制度若建立得足够久远,往往容易被当作理所当然的惯例;反之,越是近代的制度,就越值得我们去拆解、质疑,并重新建构。

那么,如果取消成绩,研究生院或雇主又该如何区分学生?事实上,成绩在这方面的作用本就有限。在当下普遍存在的“成绩膨胀”现象中,高分已难以有效区分学生差异。一些高校设置“课程优秀率不超30%”,迫使教师在评分时人为控制分布,进而影响评分公正性。同时,为了配合GPA体系及“优秀率”限制,教师往往倾向于打出“安全分”,这限制了教学的灵活性与个性化发展。正因如此,研究生院和企业早已将注意力转向学校声誉、课外经历等更能体现学生综合素质的因素。

总体而言,“打分”对孩子的影响并不积极:成绩不佳者会因挫败而失去动力,而成绩优异者往往也只是为了追求一个与“学习”本身无关的外在目标。久而久之,习惯低分的学生开始怀疑学校的意义,进而放弃努力;而那些总拿“A”的学生,则可能因一次未能满分而陷入焦虑。

这些现象与真正的“学习”毫无关系。学生不再关心自己哪里做得好、哪里需要改进,也不关心课程内容本身。他们只关心一个分数——这是典型的“外在动机”。而我们的目标,应是重建“内在动机”——那种出于好奇心与自我驱动的学习渴望,这是终身学习的源泉。

当外在动机被过度使用时,反而会造成伤害。入学之初,孩子们兴趣广泛,但不久后他们便学会只关注“考试会不会考”,因为考试之外的内容“不值分”。已有大量研究表明:分数削弱了学生对学习的兴趣,至多只能以错误的理由激励成绩好的学生。

与分数挂钩的外在动机还会增加学生的心理压力,甚至引发不健康行为,如完美主义、焦虑乃至身心瘫痪。它还可能让学生彻底放弃某个领域:“我数学考了C,所以我不擅长数学。我不是这方面的人,也就不需要再努力了。”

如果我们的目标是让每一位学生都参与学习并获得成长,那么给他们一个“你不够好”的分数,无异于适得其反。这会摧毁学生自我提升的动机,反而拉大表现优异者与落后者之间的差距。成绩差的学生因缺乏激励而愈加掉队,成绩好的学生则继续保持领先。

更关键的是,那些成绩优秀的学生,也未必真正“做得好”。他们可能成绩亮眼,却同时面临严重的焦虑、社交困难、身心健康问题,对课堂之外的事务漠不关心。典型的“全A”学生早已被这个系统吞没:他们做被要求做的事,满足被规定的标准,为了升学制定紧张的时间表,却不再知道自己为何而学,结果是失去想象力,也失去了方向感。最重要的是:他们并不快乐。

今天的评分系统还面临一个全新的挑战——学生使用AI进行作弊,这暴露出教育制度与技术演进之间的摩擦。例如:用AI自动生成论文或作业,用AI润色绕过语言评估,用AI解题完成编程作业,甚至通过“提示工程”伪装原创内容以规避检测。对此的回应不应仅限于“禁止”,而应从根本上重新设计评价机制与学习动机体系。比起问“如何阻止学生使用AI作弊”,更该追问:“他们为何要作弊?”而“追逐高分”正是答案的一部分。

我们亟须重新设计一个新的评价体系。这种体系应当涵盖学习日志、课堂参与、团队协作等多维要素,强调“过程性评价”而非结果导向;在评分方式上,推广以“等级制”结合“叙述性评语”的模式,避免精细化的数值排名,转而强调个性化反馈与成长性导向;同时,应构建动态更新的“能力画像”,通过电子档案记录学生在不同情境中的真实表现与成长轨迹,从而更全面地反映其学习能力与潜力;此外,还应弱化甚至取消GPA的排名功能,正如北京大学的改革所体现的那样,其核心目标在于打破“绩点至上”的迷思,推动教育回归“以学习者为中心”的本质。

在斯坦福大学,某些课程已尝试以个性化反馈取代打分。每位学生每周与助教进行一次讨论,针对作业进行修改,这类反馈以及教授的书面回应,才是真正促进学术成长的方式。教师也因此摆脱了“会计”或“警察”的角色,回归教学本质。

大学改革势在必行。只要高校招生仍以成绩为中心,高中阶段就难以摆脱其束缚。幸运的是,一些美国高中已开始系统探索新的模式。例如:允许低分学生重做作业,强调“学习”本应不是惩罚,而是掌握内容的过程,无论尝试多少次。

有的学校甚至只设置两个等级:“掌握”和“进行中”,给予学生无限次机会达到熟练程度。传统评分系统是一种一次性定论,而更好的方式则允许反复尝试,使学习成果与努力过程更加匹配。

归根结底,问题不在于我们是否应废除评分制度,而在于我们是否愿意重新思考它,并重新设计评价逻辑,使其更真实地回应当代社会和个体发展的实际需要。每所学校都应从自身语境出发,开启这场反思;而那些深陷于数字与排名迷思的大学,也该重新理解“评分”的意义。唯有如此,评价才能真正以学习者为中心,服务于成长。

北京大学的绩点改革具有重要象征意义。它不仅打破了一种制度惯性,更挑战了一整套教育文化的预设。真正的改革,不止于取消某项指标,而在于重新提出:什么是学习的价值?什么是评价的正义?谁有权定义成功?未来的高等教育改革,应以此为契机,在制度、文化与实践之间搭建桥梁,让“多元评价”不仅是一种技术手段,更成为面向人的教育哲学。


来源:经济观察报

相关推荐