허경철 前 교육과정평가원 연구본부장

현대사회에서 개인, 조직, 심지어 국가도 평가를 받는다. 교육분야에서 '교육평가'는 학생들의 교육 성취를 재는 활동이기도 하고 교육 기회를 학생들에게 적절히 배분하기 위한 절차나 수단이기도 하다. 한국 사회에서(사실상 세계적으로도) 교육은 경쟁의 장이고 경쟁은 평가를 통해 판가름나야 한다. 이때 평가는 물론 공정하고 투명해야 한다. 그러나 우리 교육에서 평가에 대한 논란이 끊이질 않고 있다. 에듀인뉴스가 '교육평가를 평가한다'를 주제로 기획시리즈를 마련했다. 전문가들의 교육평가에 대한 진단과 대안 제시부터 좌담에 이르기까지 다양하게 준비한 기획에 독자들의 관심을 기대한다.<편집자 주>

Ⅰ. 절대평가라는 용어(개념)가 논의되는 교육적 상황

절대평가는 현재 수능 시험과 내신 평가라는 두 가지 교육적 맥락에서 논의되고 있다. 수능 시험과 관련하여 교육부는 지난 8월 10일 현재 중3이 2020년 후반에 치르게 될 2021학년도 수능 시험의 성격과 구조에 대한 ‘2021학년도 수능 개편 시안’을 발표하였다.

1안과 2안의 두 가지 안으로 발표하였는데, 1안은 수능 과목 중 4과목에만 절대평가를 적용하고, 2안은 수능에 포함되는 전 과목에 절대평가를

적용하는 것이었다. 이 안은 향후 여러 차례의 공청회 등을 거쳐 8월 31일에 최종안이 확정될 예정이다.

내신 평가와 관련해서는 아직 교육부가 구체적인 시안을 공개하고 있지는 않으나 현 정부는 평가의 방식을 현재의 상대평가에서 절대평가로 전환한다는 입장을 지난 대선 공약에서부터 최근까지 일관성있게 유지하고 있다.

최근 수능과 절대평가와의 관계에 대한 논의는 수능 과목 중 몇 개의 과목을 절대평가에 적용할 것인가에 집중되어 있다. 4과목(영어, 한국사, 탐구, 제2외국어나 한문)에만 적용할 것이냐, 전 과목에 적용할 것이냐의 논의이다.

내신과 절대평가의 관계에 대한 정책은 아직 심각하게 논의되고 있지 않은 형편이다. 절대평가라는 평가 방식을 수능시험과 내신평가에서 어떻게 적용하는 것이 교육의 질 향상을 견인할 수 있겠느냐의 문제를 제대로 파악하기 위해서는 절대평가와 관련된 여러 가지 문제를 종합적으로 검토해 보아야 한다.

절대평가와 상대평가의 차이, 현재의 수능시험 체제에서 절대평가가 사용되는 방식, 현재의 내신평가에서 사용되는 평가방식과 현 정부가 제안하게 될 평가방식과의 차이 등 여러 가지 다양한 요소에 대한 종합적 검토가 필요하다.

Ⅱ. 상대평가와 절대평가의 차이

학계에서는 상대평가라는 용어 대신 '규준지향평가(Norm Referenced Evaluation)', 절대평가라는 용어 대신 '준거지향평가(Criterion Referenced Evaluation)'라는 용어를 사용한다. 이 두 용어가 상대평가나 절대평가라는 용어보다 학교 교육 평가 상황에서 평가가 의미하는 바를 보다 명료하게 드러낼 수 있기 때문이다.

상대평가는 아주 간단하게 말하자면 내가 받은 점수가 얼마나 잘한, 혹은 잘 못한 점수인가는 상대방의 점수에 의하여 결정되는 평가방식이다. 내가 90점을 받아도 상대방이 95점을 받으면 나의 점수는 잘 못한 점수가 되고 반대로 나의 점수가 60점이어도 상대방의 점수가 50점이면 나의 점수는 잘 한 점수로 평가되는 방식이다.

이 평가 방식에서 나의 성취 정도에 대한 평가의 기준은 오로지 상대편인 다른 사람이 된다. 그리하여 이 평가에서는 석차, 서열, 등수가 문제 되고 평균과 표준편차도 문제 된다. 평가의 결과가 심각한 영향을 미치는 중요한 상황에서는 남보다 1점이라도 더 맞으려는 심한 경쟁 상황을 산출하는 평가이기도 하다.

절대평가는 나의 점수에 대한 평가가 상대방의 점수가 아니라 ‘사전에 설정된 기준’에 의하여 이루어지는 평가 방식이다. ‘사전에 설정된 기준’에서 기준이란 점수, 성취율, 특정 교육목표 등 다양한 형식을 취할 수 있다.

A를 맞기 위한 사전 기준, 혹은 준거 점수가 95점으로 정해져 있다면 90점인 나의 점수는 A가 되지 못하고 B가 된다. 나뿐만 아니라 95점을 받지 못한 학생들은 모두 A를 받지 못하고 B를 받게 된다. 우리 학년 전체 학생중에서 95점 이상 되는 학생이 한 명도 없는 경우 우리 학교에서는 A를 받는 학생이 한 명도 없게 되는 방식이다.

이 평가방식에서는 상대방이 얼마나 잘, 혹은 잘 못 하느냐가 나의 평가에 전혀 영향을 미치지 못한다. 비교의 잣대는 ‘상대’가 아니라 ‘기준(준거)’인 것이다. 그러므로 이 평가에서 경쟁의 대상은 상대방인 동료가 아니라 외부에서 사전에 설정한 기준(준거)이 된다.

Ⅲ. 절대평가와 수능시험 체제

현행 수능시험 체제와 2021학년도 수능 개편 시안의 주요 내용은 <표 1>과 같다. 위 그림에 의하면 현행 수능체제에서는 영어와 한국사 과목을 절대평가 하게 되어 있다1).

1) 영어의 경우 원점수 100점 만점에서 90점 이상이면 1등급, 80점~89점이면 2등급, 70점~79점이면 3등급과 같이 10점 간격으로 급간을 설정, 총 9등급으로 구분되어 있다. 다른 학생 점수와는 무관하게 자신의 점수만으로 사전에 설정된 기준 점수에 의하여 등급이 결정된다. 한국사의 경우 원점수 50점 만점에서 40점 이상~50점 이하는 1등급, 35점 이상~39점 이하는 2등급, 30점 이상~34점 이하는 3등급과 같이 5점 간격으로 하여 총 9등급으로 설정하고 있다.

나머지 과목은 상대평가를 하게 되어 있다. 개편 시안에서는 절대평가를 하는 과목의 수와 구성이 다소 달라지는 것 이외에는 본질적인 차이가 없다. 현재 이루어지고 있는 논쟁의 초점은 2021학년도에 4개의 과목에 절대평가를 적용할 것이냐, 전 과목에 적용할 것이냐이다.

수능시험 과목에 절대평가 적용의 범위를 정하는 문제는 여러 가지 중요한 의미를 지닌다. 적용의 범위가 넓을수록, 즉 절대평가를 적용하는 수능시험 과목 수가 많아질수록 수험생의 시험 준비 부담은 줄어든다. 또한 절대평가의 등급 수가 적어질수록, 즉 9등급에서 5등급이나 3등급 혹은 2등급(Pass-Fail)으로 줄어들수록 학생의 시험 부담은 줄어든다.

그러나 절대평가 적용 과목 수가 많아질수록, 절대평가의 등급 수가 적어질수록 대입과 같은 선발 상황에서 수능시험의 변별력이 약화하는 현상은 필연적이다. 고3 학생들의 시험 부담이 줄어드는 것, 수능시험 대비를 위한 사교육비가 감소하는 것, 고교 교육과정이 수능시험 준비라는 억압에서 상당 정도 자유롭게 되는 것 등은 절대평가가 넓은 의미에서 ‘교육의 질’을 높이는 데 기여하는 측면이라고 볼 수 있다.

그러나 수능시험에서 절대평가를 확대·적용하는 것은 상위권 대학 정시 모집에서 절대적으로 유용하게 쓰이는 선발 도구로서의 수능의 기능을 대폭 약화하는 문제를 일으킨다. 지난 정부에서는 수능시험의 교육적 기능보다는 선발적 기능을 중시하는 쪽으로 수능정책을 시행해 왔다고 볼 수 있다. 그리하여 수능시험에 상대평가의 원리를 적용했다.

그러나 절대평가로 교육의 질을 높이려 한다면 수능시험에서 절대평가의 원리를 적용하는 범위를 가능한 한 최대로 확대하는 것이 바람직하다. 가능한 한 모든 수능과목에서 절대평가를 실시하고, 절대평가 등급 수를 줄여서 수능 시험의 선발 도구 효능을 약화하는 것이 바람직한 것이다.

Ⅳ. 절대평가와 내신평가

수능 시험의 전 과목을 절대평가로 하고, 등급(혹은 급간) 수를 2개로까지 줄여 ‘자격시험화’ 했을 경우 수능의 선발 도구의 효능은 최저화된다고 볼 수 있다. 그러나 수능시험이 현행 학교 교육에 미치는 부정적 영향을 고려할 때 수능 시험의 약화는 바람직한 방향이라고 볼 수 있다.

그렇다면 수능시험의 변별적 기능이 약화되었을 때 대입 선발의 변별력을 높이기 위하여 내신평가만은 상대평가를 유지하는 것이 타당하다고 할 수 있는가? 교육의 질 제고나 질 관리라는차원에서만 본다면 내신평가 역시 절대평가의 방식을 취하는 것이 타당하다. 내신평가를 절대평가로 하는 것은 수능시험을 절대평가로 하는 것보다 교육의 질 제고라는 결과에 훨씬 더 직접적이고 강력한 영향을 미치기 때문이다.

현행 내신평가에서 가장 중요한 부분은 교과목별 학업성취 정도에 대한 평가방식이다. 현재 고등학교의 경우 교과별 성취 정도에 대한 평가는 상대평가와 절대평가를 함께 사용하고 있다.

상대평가를 하기 위하여 교과별로 학생이 취득한 원점수, 학생이 속한 집단의 평균점수, 그리고 그 집단의 표준편차를 기술한다. 그리고 이와 함께 석차등급2)을 표기한다.

2) 석차등급이란 과목별로 과목 전체수강생을 성적 순서(점수석차)에 따라 일렬로 줄을 세운 후 상위 4%까지는 1등급, 4~11%까지는 2등급, 11~23%까지는 3등급, 23~40%까지는 4등급, 그리고 마지막 하위 4% 이하는 9등급이라는 등급을 부여하는 방식을 의미한다. 이 방식에 의하면 학생들의 과목별 성적은 9등급 중 어느 하나의 등급으로 구분되어 표기된다. 상대평가의 전형적 방식이다.

이러한 수치들을 사용하면 집단(학급이나 학년) 내에서의 개별 학생의 상대적 위치(서열이나 순서)를 정확하게 알 수 있다. 교과별 학생들의 성취 정도는 절대평가 방식으로도 표기된다.

특정 과목에서 성취해야 할 수준을 100으로 보았을 때 90% 이상의 성취율을 보인 학생에게는 A, 80% 이상~90% 미만의 성취율을 보인 학생에게는 B와 같은 방식으로 10% 간격으로 차이를 두고 등급을 부여하다가 마지막 등급으로 60% 미만의 성취율을 보인 학생에게는 E를 부여하는 방식이다.

학생들의 교과목별 성취 정도를 사전에 설정한 성취율이라는 기준에 따라 A~E까지의 5개의 등급으로 구분하여 평가하는 방식이다.3)

3) 이런 의미의 절대평가 방식은 고교의 모든 과목에 대하여 적용되는 것은 아니다. 보통교과의 일반과목과 심화과목에 한해서만 5단계 절대평가를 하고 있다. 현행의 고교 교육과정에 의하면 보통교과는 기본과목, 일반과목, 심화과목의 3가지로 구분되어 있다. 그러나 기본과목은 기초수학, 기초영어 두 과목뿐이다.

이처럼 현행 고교의 과목별 내신 평가는 상대평가와 절대평가 방식 두 가지를 병용한다. 그러나 대학은 학생을 선발할 때 이 두 평가 방식이 제공하는 정보 중 상대평가가 제공하는 정보를 주로 활용한다.

절대평가에 따른 결과가 ‘과목별 성취도’라는 이름으로 위와 같은 형식으로 제공되기는 해도 과목별 성취도가 의미있게 사용되는 경우는 거의 없다. 그리하여 고등학교에서의 교과별 내신평가는 실제적으로는 상대평가뿐이라고 할 수 있다.

이러한 상황에서 교과별 내신평가를 절대평가로만 한정한다면, 그리하여 수능시험도 전 과목 절대평가, 고등학교 교과별 내신평가도 절대평가로 할 경우 대입 선발의 2가지 기본 도구인 수능과 내신의 변별력이 크게 저하되는 것은 필연적이다. 그러나 수능과 내신이 모두 선발을 위한 평가 도구로서의 변별력이 약화할수록 고교 교육의 질이 향상될 가능성은 커진다.

Ⅴ. 절대평가와 성취평가제

현재 수능시험에서는 영어와 한국사 두 과목만 9등급 절대평가제를 시행하고 있다. 내신에서는 고등학교 일반교과의 보통과목과 심화과목들에 대해서만 5등급 절대평가제를 실시하고 있다.

그러나 내신의 경우 전술한 바와 같이 상대평가도 병행하여 이루어지고 있고, 고교와 대학, 학생과 학부모, 그리고 교사 모두 상대평가 결과만을 중시하기에 실질적으로는 고교 교과별 내신 평가는 상대평가라고 볼 수 있다.

절대평가를 시행하는 방식은 다양하다. 현재 수능시험 개편 시안에서 논의되는 바와 같이 절대평가 적용 과목을 일부러 한정할 수도 있고 전 과목으로 확대 적용할 수도 있다. 적용의 범위가 넓을수록 변별의 효과는 떨어지나 교육의 질 제고 효과는 높아진다.

절대평가는 등급, 기준, 준거의 수를 적게 할 수도 있고 많게 할 수도 있다. 현행 수능시험의 영어와 한국사와 같이 9등급으로 구분할 수도 있고, 현행 고교의 과목별 성취도에 대한 내신평가에서처럼 5등급으로 나눌 수도 있다(과목에 따라 3등급, 2등급으로 되어 있는 것들도 있다). 등급 수가 많을수록 변별의 효과는 높아진다고 볼 수 있으나, 등급의 의미를 명료하게 설정하는 것이 어려워진다.

절대평가는 또한 등급을 나누는 등급 기준(혹은 분할 기준)의 의미나 성격을 학교가 정할 수도 있고, 국가가 정할 수도 있다. 현재 고교 내신평가에서 적용되는 절대평가의 등급기준은 단위학교에서 정하게 되어 있다. 대개 원점수를 중심으로 하여 90점 이상이면 A, 80점 이상 90점 미만이면 B라는 식으로 등급을 부여한다.

그러나 등급 기준을 학교가 아니라 국가가 정하기도 한다. 우리나라의 경우 절대평가 등급 기준의 의미나 성격을 국가가 정하는 절대평가를 기존의 절대평가와 구분하여 ‘성취평가제’라고 부르고 있다.

Ⅵ. 교육의 질 관리를 위한 절대평가의 시행 방안

수능시험 과목에서 절대평가 방식을 적용할 과목 수를 4개로 한정할 것인가, 과목 전체로 할 것인가에 대한 공청회 토론의 내용을 보고 어느 기자는 ‘변죽만 울린 수능 공청회’라고 평가한 바 있다. 수능시험 제도에 대한 근본적 개선을 위한 심각한 논의도, 수능시험의 절대평가화를 통한 교육 전반의 질 개선을 위한 깊이 있는 논의도 이루어지지 않았기 때문이다.

절대평가의 도입 문제는 사실 교육의 질 관리나 개선의 문제와 깊이 연관되어 있다. 그리고 절대평가의 본질적 특성이나 기능에 비추어 볼 때 절대평가가 교육의 질관리나 향상에 기여할 수 있는 역량은 수능시험이라는 맥락에서보다는 내신평가라는 맥락에서 더욱 광범위하고 명료하게 드러난다.

교육의 질을 개선 또는 관리한다는 말은 여러 의미를 지닌다. 학생의 시험 부담을 줄여 준다는 것도 넓은 의미에서 교육의 질 개선이라는 범주 속에 포함될 수 있다. 그러나 교육의 질 개선이나 관리라는 용어의 핵심적 의미는 모든 교육적 실천이 가능한 한 높은 수준으로 학생의 성장과 발달을 이루게 한다는 의미이다.

학생들의 성장과 발달을 평가하는 고교 내신평가의 여러 영역 중에서 가장 중요한 부분은 교과학습발달상황, 즉 교과목별 학업성취도 평가 영역이다. 이 영역에서 절대평가를 제대로 도입·실시하는 것은 학생들의 성장과 발달을 도모하는 가장 중요한 방안이 된다. 즉, 교육의 질 관리나 개선을 위한 가장 중요하면서도 효과적인 방식이다.

수능시험 영역에서보다는 내신평가 영역에서, 내신평가의 어떤 다른 영역에서보다 교과학습발달 영역에서 절대평가의 교육의 질 개선이나 관리 측면의 효과가 크게 나타난다. 그러나 현재와 같은 방식의 절대평가로는 절대평가 방식이 지니는 교육적 효과의 잠재 가능성이 제대로 드러나기 어렵다.

각 과목 시험에서 학생들이 취득한 점수를 학교가 임의로 설정한 기준선(혹은 분할선)을 준거로 하여 5등급으로 구분하는 현행의 절대평가 방식은 학생이나 교사들에게 제공하는 교육적 정보가 너무 빈약하다.

A는 그저 100점 만점에서 90점 이상을 맞았다는 것, 그리고 그런대로 잘 했다는 것 정도를 알려줄 뿐이다. 그 시험이 얼마나 쉬웠는지 어려웠는지, 그 시험이 어떠한 내용이나 목표를 다룬 시험이었는지, 학생들이 그 시험에서 어떤 부분을 잘 하고 어떤 부분을 잘 못 했는지 알려주는 바가 거의 없는 ‘공허하며 형식적인 절대평가’ 방식이다.

절대평가가 본연의 역량을 제대로 발휘하기 위해서는, 그리하여 교육의 질 관리 도구로서 유용하게 활용되기 위해서는 ‘성취평가제’ 혹은 ‘성취평가적 절대평가’ 방식이 도입·활용되어야 한다.

절대평가의 한 유형으로서의 성취평가제는 2011년 12월에 이미 교육부가 도입하기로 발표한 바 있다. 중학교 전 교과와 고등학교 전문교과는 ‘12학년도에 1학년부터 적용하고, 고등학교 보통교과는 ‘14학년도에 도입하여 ‘17학년도 대입부터 적극 활용할 계획이었다.

그러나 그 이후 이러한 계획은 시행되지 못했고, 더 진척된 바가 없다가 최근 현 정부에 의하여 다시 새롭게 언급되고 있는 형편이다.

성취평가제는 등급의 분할기준이 학교에서 치르는 교과별 시험점수를 바탕으로 하는 것이 아니라 교과별 국가 교육과정에서 제시하고 있는 교육목표들의 성취정도를 바탕으로 설정된 것이다.

성취평가제에 의한 등급점수 A는 100점 만점에서 90점 이상을 의미하는 것이 아니다. 일정 기간 성취해야 할 교과별 교육과정 목표 중에서 90% 이상을 성취했음을 의미한다. 성취평가제는 이러한 의미의 교과목별 성취도에 대한 전반적(평균적) 성취 수준 정도도 제공하지만 교과별 교육과정 목표 중에서 어느 목표를 어느 정도 성취했는가에 대한 정보도 제공한다.

그리고 이 정보는 다음 단계의 교수-학습 과정이 효율적으로 이루어지게 하는 데 필수적인 기초 자료로 활용된다. 그리하여 성취평가제는 교육의 질을 개선·관리할 수 있는 제대로 된 절대평가 방식으로의 역할을 성공적으로 수행할 수 있게 한다.

우리 교육의 질을 더욱 높은 차원으로 끌어올리기 위해서는 수능시험에서 절대평가를 가능한 한 광범위하게 확대하여야 한다. 적용되는 등급의 수도 가능한 한 적어야 한다. 교과별 내신평가에서도 상대평가 대신 절대평가 방식이 적용되어야 한다.

절대평가 방식 중에서도 가능한 한 성취평가제적 절대평가가 시행되어야 한다. 성취평가제적 절대평가를 통한 교육의 질 관리나 개선의 문제는 입시에서의 변별력이나 객관성을 보장하는 문제보다 훨씬 더 중요하며 근본적인 문제이기 때문이다.