当前位置: 首页 > 政策研究 > 正文

政策研究

政策研究

高洁 方征:评价、评估、考核、监测: 教育评价若干同位概念辨析及启示

来源: 日期:2023-10-08点击:

作者简介:方征,华南师范大学基础教育治理与创新研究中心教授;高洁,华南师范大学教育科学学院博士生

摘 要:清晰的概念体系是教育评价建构理论知识、开展常规实践的逻辑前提。而当前,我国在评价、评估、考核、监测的概念界定上却存在客体指向模糊、功能定位不明、指标体系繁杂等问题。为解蔽这一困局,本研究对上述概念进行了深层辨析。评价是通过分析与教育项目相关的事实、问题和建议,衡定教育项目的价值属性,确保教育项目驶于正确的价值轨道;评估是依据学生认知技能和非认知技能的发展状况,检析学生的学习成就,助力学生提高学习成效;考核是凭借教师的教学实绩,判别教师的工作绩效,驱动教师改善教学质量;监测是通过动态、实时、全面地采集教育系统的运行数据,为教育决策提供证据支持,以增强教育治理的科学性。因此在教育评价单一实践中,应恪守概念的同一性;在教育评价专业领域内,须达成概念的统一性;在教育评价本土化建设时,当兼顾概念的国际性。

关键词:教育评价;教育评估;教育考核;教育监测

自 20 世纪 30 年代泰勒(Tyler,R.W.)将评价引至教育领域以来,评价即在教育发展中扮演着重要角色,是教育规划、实施及改进中不可或缺的工具。随着教育研究与实践的深入发展,又出现了若干与评价相近的概念:评估、考核、监测。这些概念对教育评价理论及实践的重要性是不言而喻的。一方面,概念是构建教育评价理论最基本的工具和单元,也是理论中最为核心的部分,没有有效的概念,理论的价值就不值一提;另一方面,概念是教育评价实践活动的指南,人们如何理解教育评价系列概念就会如何开展相关活动。但当前我国对评价及其同位概念的界说却存有困局。有鉴于此,本研究尝试厘清各概念的边界,以期这一得之见能成为引玉之砖,引发有关该问题的真知灼见。

一、教育评价若干同位概念的界说困局

评价是教育领域中最为常见的事项,但若问起什么是评价,评价与其相近概念如评估、考核、监测有何区别时,人们通常无从说起。引发这一状况的根源是对教育评价系列概念的界定含糊不清。而早在 20 世纪 60 年代,第四代评价理论创始人古巴和林肯(Guba & Lincoln)便论证了不充分的概念界说是教育评价研究与实践失败的重要原因。因此,为确保我国教育评价的科学性、专业性及实效性,有必要分析、认识进而消解这一困局。

(一)概念的客体指向模糊

概念及其指向具有单义性:至少在同一学科领域内,一个概念只能指向一类事物,同一事物须用同一概念表达,不容任何歧义。然而,在我国教育领域中,评价、评估、考核、监测的客体指向却含糊不清。一是同一概念多重指向。例如,将教育评价界定为关涉人成长的活动,教育场域内的意义建构,对教育领域中各相关人、事、物等进行教育价值判断。再如,将教育评估视为事实判断与价值判断的统一,现代教育管理的手段,测定、分析、比较教育活动过程和结果。二是不同概念同一指向。具体表现为将评估、监测统一定义为监控、预警、修正教育活动运行轨迹,以确保如期实现教育目标的活动,或直接将评价、评估、监测等视为绝对同义词,在研究中随意替换。

概念与客体指向间的表里不一,从本质上反映了学界对教育评价领域中客观事物的理解、认识与分类尚未达至理性、稳固、真切的状态。这意味着若不加考究、辨明地使用现有概念指导教育评价实践,实践活动极有可能会因指向不明而陷入不着边际、没有界限的虚无状态。这一状态为行动者提供了变换乃至异化教育评价名目的空间,使得本应被关注的事物湮没无闻,与短期利益相关的事物无限放大。

(二)概念的功能定位不明

功能是评价、评估、考核、监测的重要特性,不仅表征着它们作用于其他事物的能力,也是彼此相区别的标志之一。通过系统梳理现有观点发现,我国学界对评价、评估、考核、监测的功能定位,不仅莫衷一是,甚至略显矛盾。在一方学者看来,评价、评估、考核、监测的功能极为相似。其中,评价的功能为导向、监测、激励、筛选、诊断;评估的功能是导向、监控、鉴定、激励等;考核旨在为偏离目标的行为提供正确导向、实施激励等;监测同样也具有导向、诊断、监控等功用。而在另一方学者的研究中,它们的功能却又各不相同。评价意在推动教育改革,改善教育质量;评估意在促进学生学习;考核意在激发教师的创新力,提高学校办学质量;监测意在引领并监控教育发展。

这一状况不禁令人疑惑:评价、评估、考核、监测的功能究竟如出一辙还是迥然相异?如果如出一辙,则代表它们所指之物相差无几,既然如此,学界为何不做统一指称,反而冒着违背专业术语单义性的风险,使用多重名号?如果迥然各异,又是哪项活动的功能被遮蔽了、其本真功能又是什么?此问题若不解决,教育评价系列活动会因功能定位不明,陷入持续性的功用贫困,只为评价而评价,缺失了教育活动本应有的教育性与人文性。

(三)概念的指标体系繁杂

对概念下定义时不能仅依赖于对事物属性的抽象描述,更关键地是要赋予概念一套可操作的指标体系。这是概念连接实践的桥梁,也是有效避免概念间牵丝扳藤的上乘之策。指标体系须建基于对概念表征之物的深度分解。由于人们对教育评价系列概念的客体指向认知各异,与之相关的各级各类指标自然也就呈现出一幅繁杂景象。以广为关注的创新创业教育评价为例,通过 CNKI 检索发现,截至目前学界为其构建了 232 种指标体系。每一指标体系都各具特色,例如,有学者基于 CIPP 模型,建构了环境基础力、资源配置力、过程行动力和成果绩效力4 个主指标,彰显特色的 12 个分指标和 22 个子指标;有学者则通过群组 G1 法,创建了包含环境、教育投入、教育产出的 3 个准则层,8 个一级指标和 20个二级指标。然而,即便成果如此丰硕,创新创业教育评价的指标设计依然无法满足实践诉求,亟待系统完善。

繁杂的指标体系加大了各概念与实践接轨的难度系数。教育评价实践因缺乏可操作的指标体系,时常出现不合情理的状况。以我国教师绩效考核为例,现行的中小学教师绩效考核方案指标体系过于全面、冗长,重结果轻过程,缺少科学性、合理性,引发了数据收集过程主观、片面,缺少透明性、时效性。这使得教师和学校间频繁发生人事纠纷。综上所述,教育评价及其同位概念的界说让人恍惚难辨。这给教育评价研究与实践带来了负面影响。而事实上,评价思想虽在我国渊源已久,但作为现代教育学的分支学科却是西方的舶来品。在其所辖的概念体系中,评价的英文术语为 evaluation,指审慎衡量事物的价值或品质。评估的英文术语为 assessment,是指人们围坐在一起彼此倾听、共同探究,以达成对事物的认知。考核的英文术语为appraisal,指管理者对雇员工作绩效的判定。监测的英文术语为 monitoring,指持续关注与检测事物的发展样态,以便开展必要的变革。它们本都有着较为明确的客体指向、功能定位和指标体系,本研究将对之进行逐一分析。

二、教育评价若干同位概念的客体指向

作为服务于教育发展的实践活动,教育评价系列概念的客体指向虽然都围绕教育领域,但却因起源背景的差异有着显著不同。它们或侧重于教育项目,或关注教育系统中的某一要素,或着眼于教育系统的整体质量。正是客体指向间的差异,决定了它们有着不同的功能定位和指标体系。

(一)评价:聚焦教育项目

在日常教育实践中,不少人认为只要涉及评定、衡量与检验的活动都应归为评价(evaluation),但事实并非如此。评价被泰勒(Tyler,R.W.)引入教育领域伊始,是为判断教育项目的目标实现程度。随着实践的深入发展,基于教育目标的评价显现出诸多不足。例如忽视了教育目标有科学与非科学之分,是需要评价的对象,而非评价尺度;忽略了教学过程、教师素养、学生素质等其他影响教育目标实现的因素。为使评价更好地助力教育发展,学界在对泰勒式评价进行反思、批判的基础上,提出了全新的教育评价模式 :目标游离式评价(Goal-freeevaluation)、CIPP 式评价等。新一代的评价不再只关注教育项目的既定目标,而是本着整体性、全局性的原则,对教育项目本身、项目实施过程、项目实际成效进行衡量与判断。以 CIPP 式教育评价为例,该模式认为教育评价是系统调查教育项目的过程,应突破仅关注目标实现程度的思维局限,对教育项目进行综合分析与考量。同时,现有与教育评价相关的多数理论、概念和实践也都以教育项目评价为基础。需要特别说明的是,这里的教育项目既可以是教育系统中清晰具体的某一部分,如学校组织、教育实践主体等,也可以是开创性的教育实验、新兴的教育政策等。

(二)评估:关注学生学习

考究教育评估(Educational assessment)的客体指向,需溯源到形成性评价(formative evaluation)和总结性评价(summative evaluation)的出现及其概念演进。20 世纪 60 年代末,斯克瑞文(Scriven,M.)在总结既往教育改革经验的基础上,提出了用以指导课程与教材革新的形成性评价和总结性评价。布鲁姆(Bloom,B. S.)在此基础上,从学习者的视角出发,将形成性评价和总结性评价做了进一步区分。他指出形成性评价是在教学过程中的每一个阶段,都为学生提供学习成效反馈;总结性评价则只在课程结束时,对学生的学习成就做以评判。自此,形成性评价和总结性评价便蕴含着关注学生学习之意。而由于评价“evaluation”的词根为“value”,强调对事物 价 值 的 认 知 ,评 估“assessment”源自拉丁文“assidere”,含有人们围坐在一起彼此倾听、共同探究之义,十分生动地体现了课堂中的学习场景。学者们便开始使用形成性/总结性评估(formative /summative assessment)来彰显这一变化。随着评估一词在教育实践中的广泛应用,21 世纪初叶,第三版《国际教育百科全书》将教育评估(Educational assessment)作为新增词目收录其中,用以指称围绕学生学习展开的评判、估定。与此同时,世界上大多数国家与地区,如北美、欧洲、澳大利亚,在制定与评估相关的政策措施时,都会重点突出评估关注学生学习的独特内质。

(三)考核:围绕教师绩效

考核(appraisal)是人力资源管理的重要方略,起初主要用于审查企业员工的工作绩效。后因问责制在公共管理与治理中的兴起,才被应用于教育领域。并在教育问责制的实践要求下,以教师绩效为客体指向。具体而言,在问责制下,委托人有权针对代理人的岗位等级制定职责规范与工作目标,以此为标准对代理人进行绩效考核,并根据考核结果对代理人实施奖惩,同时要求代理人对与工作相关的事宜进行解释、说明。映射到教育实践中,由于教师是教育服务的终端代理人,任一层级的委托人对代理人的问责,最终都会落脚于教师的工作表现,也即教师绩效。同时,教师绩效也是各层代理人回应委托人问责的有力凭据。在此状况下,考核自然而然地指向教师绩效。可以看到,当前国际教育领域中,以考核为主题的研究基本都围绕教师绩效,具体涉及教师绩效考核的现状分析、模式构建、功能效用等。此外,经济合作与发展组织(OECD)开展的首个教师教学国际调查项目(Teaching and Learning International Survey)在谈及教师绩效评定时,也专门使用考核一词做指代。

(四)监测:指向教育系统

监测(monitoring)在教育领域中的实施与运用源于“证据驱动下的教育治理模式”的兴起。简言之,证据驱动下的教育治理要求决策者基于科学、有效且具有说服力的证据,来制定或遴选出有助于从整体层面提升教育质量的政策、项目和产品。这意味着教育决策者必须熟知教育系统各个层面的发展程度、内部关系、影响因素和未来趋势。在此背景下,各国开始创立以教育系统为客体指向的监测制度。在英语语境下,监测意为“to watch and check sth over a period of time in order to see how it develops,so that you can make any necessary changes”,即对事物的发展样态进行持续关注与检测,以便开展必要的变革。围绕监测建立的运行体系可以基于标准化、智能化的指标与程序,对教育系统的资源投入、运行过程、输出结果,进行系统化、层次化和实时化的观察与检测。由此生成的数据信息不仅有助于精准衡量教育系统的整体质量、内在联结和发展趋势,而且可以明晰区域间、城乡间、校际间的教育质量差异和发展需求,为教育决策提供充分的证据支持。

三、教育评价若干同位概念的基本功能

教育领域中与结果评定相关的四大活动:评价(evaluation)、评估(assessment)、考核(appraisal)、监测(monitoring)虽然都以促进教育发展为根本目标,但每一个活动都在以独特的着力点发挥这一功效。这是它们各自独立且不会被取代的重要原因。

(一)评价:衡定教育项目的价值取向

评价(evaluation)的功能经历了从“目标实现”到“助力决策”再到“价值衡定”的发展演变。20世纪 30年代,教育评价之父泰勒(Tyler,R.W.)指出,评价的目的是为确定教育目标的实现程度。发展至 70 年代,斯塔弗尔比姆(Stufflebeam,D.L.)在对泰勒评价思想继承和批判的基础上,提出评价的作用在于为决策提供有效的信息。而后,斯克瑞文(Scriven,M.)在本体论及后实证主义认识论的启迪下,认为评价本质上是一门赋予价值的科学,没有价值判定的评价不是真正的评价 。斯克瑞文(Scriven,M.)的这一观点得到了学界的普遍认可:国际研究者曾以何谓评价为主题展开了调查,84.6%的被试表示评价的功能为衡定教育项目的价值取向。价值判定由此成为评价的核心功能。这一功能又可分化为两大层次:一是政府以评价为抓手对教育项目的宏观价值引领。譬如,本世纪初,美国颁布的《不让一个孩子掉队法案》便是国家以评价为媒介,确保教育秉承公平、公平价值取向的典范。二是教育系统内部根据既定价值目标对教育项目所作的价值判定。例如,国际环境教育组织,依据环境教育活动促进学习者认知、情感、参与性知识、技能发展的价值目标,对环境教育项目展开的价值评定。

(二)评估:增进学生的学习成效

评估通过向学习者提供有意义的反馈,使学习者了解自我学习进度与预期目标间的差距,进而调整学习策略,增进学习成效。关于学习的评估(Assessment of Learning)、为了学习的评估(Assessment for Learning)和作为学习的评估(Assessment as Learning)是这一功能的三大作用机制。其中,“关于学习的评估”旨在评判、记录学生的学业成就,引导学生确定未来学习方向。“为了学习的评估”是日常教学实践的重要组成部分,旨在使学生拥有清晰、可行的学习计划与策略。有五个实施步骤:一是阐明学习目标,分享成功准则;二是设计有效的课堂讨论与活动,引出学生掌握学校内容的证据;三是给学生提供基于证据的反馈,推动其继续前行;四是开展同伴评估,使学生成为彼此的学习资源;五是开展自我评估,增强学生的学习主动性。“作为学习的评估”旨在引导师生将评估视为一种有价值的学习活动,融入日常教、学生活中,以使评估更好地促进学生学习。

(三)考核:驱动教师改善教学质量

教师的教学质量是学生学业成就和未来生活成就的一个极其重要的决定因素。因而,在国际上,以教师为主体的考评活动,基本都以驱动教师改善教学质量为目标。指向教师工作绩效的考核(appraisal)自然也不例外。详言之,学校通常以教育委托人重点关注的“教学质量”为出发点和落脚点,制定教师绩效考核方案,并将该方案置于教师人事管理的制度框架内,将考核结果与教师的职称评定、岗位晋升、培养培训、福利待遇等紧密相关。在此规约下,教师若想实现职业理想,就要摒弃职业生活中的拿来主义、功利主义、守旧主义等不良行为倾向,不断提高教学质量。譬如,具有世界级影响力的美国“Stronge 教师考核方案”就以提升教学质量为本,将考核细化为教师教学工作中的每一环节。同时,学校会在考核结束后,依据相关结果,制定针对性的教师专业素养提升计划,以驱动教师改善教学质量。

(四)监测:推动教育治理的科学化

监测伴随着“证据驱动下的教育治理模式”的兴起而出现,并推动着教育治理的科学化发展。具体而言,国际民主社会下的教育治理拥有多元的治理主体和权力中心。这虽然有助将公平、全纳、协商等价值理念融入教育中,但也极易使教育发展被民意裹挟,失去应有的客观性和专业性。在此状况下,各国开始建立监测制度,动态、实时、全面地收集教育系统的数据信息,以为教育治理者们发表教育决议、规划教育利益分配格局提供充分的证据支撑。同时,监测结果的发布与共享,还有利于打破传统权威机构对教育信息的绝对垄断,消解治理主体间因信息不透明、不对称而产生的能力差和权力差,使多元治理主体平等地参与教育决策。综上所述,通过监测,教育治理不仅有效规避了民粹主义风险,而且保证了治理的多元民主特性以及治理结果的科学性。

四、教育评价若干同位概念的指标体系

前已述及,指标体系是概念连接实践的桥梁。在教育评价系列活动中,行动者正是通过指标体系的指引,收集反映事物状态的数据信息,以此把握事物的发展动向。因此,除客体指向与基本功能外,辨明评价、评估、考核、监测的指标体系是厘定其边界的又一关键行动。

(一)评价:取决于教育项目的实际诉求

评价的指标体系取决于待评项目的现实诉求。待评项目可根据作用对象的不同分为三类。一是以教育政策为代表的开创性教育项目的评价。此类评价着重于判断教育政策价值目标的实现程度,指标体系的设计一般从两方面着手:一方面是将应然层面的政策目标解构为可观察、可测量、可验证的指标;另一方面是基于核心利益相关者,如政策制定者、政策执行者、政策目标群体等,设定反映实然层面的政策执行过程及其结果的指标。通过两类指标的比对分析,得出教育政策实际效果与本原价值期望间的差距。二是关于教育组织的评价。这一评价或重点关注学校是否实现了既定的价值目标,或侧重于对学校的教育实践活动进行价值判断。指标体系主要源于学校的办学样态,例如学校的基础设施、办学方向、管理机制、课程教学、教师素养等。三是关于教育实践主体的评价。在此类评价中,评价者通常依据国家或权威机构颁布的专业准则对教育实践主体的行为表现做出价值判断,指标体系也是依据这些准则而设定。譬如,美国 Stronge 校长评价体系的数据收集指标便是依据美国州际学校领导认证协会(ISLLC)制定的校长专业标准设计而成。

(二)评估:源于学生的学习成就

评估的指标体系源于对学生学习成就的解构与重释。在国际教育领域中,人们通常将学生的学习成就分为认知技能成就和非认知技能成就。认知技能是学生在知识学习中,通过知识编辑将陈述性知识转为程序性知识而产生的能力。发展成就体现为学生所学课程的测验成绩,如随堂测验、单元测验、期中测验、期末测验等。非认知技能也被称为社会情感技能,是难以被智力测验或学业成绩表征的能力,具体指学生在不同情境下展现出的稳定性思想、感觉和行为模式。根据经济合作与发展组织(OECD)的研究成果,了解学生非认知技能的发展成就,可遵循以下指标收集数据信息:一是人口统计信息,包括年龄、年级、性别、父母的社会经济状况等。二是幸福、态度与理想,展现为学生的生活满意度、个人幸福感、受教育目标、职业理想、获得的社会支持和外部压力等;三是学生对人际关系尤其是对亲子关系和同伴关系的看法与感受;四是学生的学校生活状况,涵盖学校归属感、考试焦虑度、师生关系等;五是简短的认知能力测试,以客观评估非认知技能对学生发展的作用力。

(三)考核:落脚于教师的教学实绩

前已述及,考核聚焦于衡量教师的工作绩效。所谓工作绩效是指教师在履行岗位职责中展现出的多元结构行为及结果的综合体。这一综合体以服务学校的核心技术——教与学为根本导向。因此,考核的指标体系自然落脚于教师的教学实绩。在具体实践中,考核者了解教师教学实绩的典型方法是亲临教学现场,从课堂组织力、教学内容呈现力、师生互动力、学生学习力等维度对教师的教学状况进行观察、记录与分析。与此同时,考核者还经常遵循以下指标收集相关数据:一是以校、班为单位,分层次对比分析教师执教班级的学生发展成就;二是在学生群体中开展有关教师教学能力的实证调查;三是分析教师已具备的专业理念、专业知识和专业技能;四是组织教师审视与剖析自我教学状况。

除此之外,有利于营造良好教学氛围的组织公民行为也是衡定教师教学实绩的重要指标。譬如,协助同事开展教学实践、主动遵守并维护学校的规章制度、积极参加学校活动、关注学校发展态势和社会声誉等。

(四)监测:解构于教育系统的运行样态

为了给教育治理提供更为详实的决策证据,在国际教育领域中,监测的指标体系已从单一的学生学业成就转向多维的教育系统运行样态。为深度解构教育系统发展态势,监测项目组通常以普维斯(Purves, A. C.)提出的 CIPO(Context-Input-Process-Outcome)模型为指引,从背景、投入、过程、结果四个方面确立指标体系。譬如,当前最权威的国际教育监测项目 PISA,自 2012 年起就一直遵循 CIPO 模型来设计数据收集指标。在该教育项目中,教育背景层面的指标包括学校背景和学生背景,学校背景涉及地理位置、办学规模、办学类型、办学水平等要素,学生背景包含性别、年龄、社会经济地位、国家、种族等内容;教育投入层面的指标是国家对学校的政策支持和专业引领;教育过程层面的指标内含课程教学、课堂氛围、学生受教育机会等方面;教育产出层面的指标以学生的认知技能成就和非认知技能成就为核心。多维的指标体系使监测得以为教育治理者科学分析教育发展态势,做出兼具合法性、时效性和公正性的决策,提供了强有力的证据支撑。

五、教育评价若干同位概念的辨析启示

综合上述分析,教育评价及其同位概念在客体指向、基本功能和指标体系上并非处于模糊、混沌的状态,而是有着清晰的界定。因此,在教育评价单一实践中,应恪守概念的同一性;在教育评价专业领域内,须达成概念的统一性;在教育评价本土化建设时,当兼顾概念的国际性。

(一)在教育评价单一实践中,应恪守概念的同一性

按照词汇使用原则,只有绝对同义词(absolute synonym)才可相互替换。经由上述分析可知,评价、评估、考核、监测各有差异,只是相对同义词,不可随意替换。同时,从学理的角度而言,概念是对某类客观实体共时性特征的概括,与其所表征的客观实体是内在统一的共生关系。在现实世界中,并不存在脱离特定客观实体而独立自存的具有广泛概括性和普遍应用性的概念。也即是说,教育评价系列概念具有惟一性和排他性。在单一评价实践中,应根据实践目的选择特定的概念术语并以一贯之。但反观我国教育评价领域内的政策文本、学术著作及活动记录,不难发现“同一概念多重指向”“不同概念同一指向”却是普遍现象。如此不仅有悖于概念的惟一性与排他性,并可能致使实践活动陷入内在逻辑混乱、外在边界模糊的尴尬境地。为使教育评价更好地服务于教育发展,理应在单一实践活动中恪守概念的同一性。

(二)在教育评价领域内,须达成概念的统一性

作为专业的社会实践活动,教育评价需具有清晰明确的概念体系,这是其进行内在建制与外在呈现的逻辑前提。但当前我国对评价、评估、考核、监测等概念却有着多元释义,不仅模糊了各概念能指与所指间的边界性,更难以为教育评价研究与实践活动提供先决条件。而事实上,教育评价及其同位概念都有着独树一帜的行使规范。其中,评价通过分析与教育项目相关的事实、问题和建议来衡量教育项目的价值属性,确保教育项目行驶于正确的价值轨道;评估依据学生认知技能和非认知技能的发展状况,检析学生的学习成就,助力学生提高学习成效;考核凭借教师的教学实绩,判别教师的工作绩效,驱动教师改善教学质量;监测通过动态、实时、全面地采集教育系统的运行数据,为教育决策提供证据支持,以增强教育治理的科学化。我们或可以此为基础,对教育评价系列概念进行深入的公开论证,进而达成具备公共理性的统一释义。

(三)在教育评价本土化建设时,当兼顾概念的国际性

作为典型的“后发外启型”学科领域,我国教育评价在引进国外评价理论的基础上发展而来。为建设彰显我国特色的评价理论体系,学者们在使用教育评价系列概念时,通常会抛开概念的本原释义,对之进行解构与重构。这虽有效避免了对国外教育评价理论的盲目应用与拔高,有助于发展出本土化的教育评价思想,但却使得教育评价及其同位概念陷入无章法使用的混乱局面。该局面不仅削弱了我国教育评价的专业性、科学性和客观性,也不利于我国形成富有时代特征、体现世界水平的教育评价体系。而事实上,教育评价若干同位概念的国际应用规范是连接各国教育评价研究的纽带,也是推动教育评价理论知识在世界范围内生产、传播与运用的基石。我国若想在国际教育评价领域中彰显中国理念,贡献中国方案,应适当兼顾上述概念的本原内涵。

综而观之,明确的概念界定是教育评价研究与实践走向专业化的必要前提。但当前我国对教育评价及其同位概念的界定却处于混沌状态,难以为教育评价研究与实践提供先决条件。在此状况下,有必要创设话语空间,引导人们审慎辨证概念间的差异,并达成具有规范性和约束力的共识。

文章来源:《教育发展研究》2022年第19期