<<
>>

3. Процесс измерения и оценки качества знаний учащихся

Процесс измерения и оценки качества знаний учащихся состоит из следующих операций:

— выявление наличия знаний;

— измерение абсолютного показателя качества знаний;

— определение относительного показателя качества знаний;

119

Bespalkol.qxd 28.02.2008 16:15 Page

В.П.

Беспалько. ПРИРОДОСООБРАЗНАЯ ПЕДАГОГИКА

— соотнесение относительного показателя качества с принятой шкалой;

— присвоение качеству соответствующей оценки.

Выполнение этого процесса может осуществляться различными способами. Это может быть глазомерная процедура, при которой экзаменатор производит в уме в свёрнутом и сокращённом виде все названные выше операции оценивания, заканчивая их присвоением знаниям учащегося некоторой оценки. Мы уже знаем, что это субъективный подход к оцениванию со всеми присущими ему иллюзиями, неизбежными нарушениями валидности контроля и личностным отношением к учащемуся и его ответу. При субъективном подходе к измерению и оценке качества знаний учащихся результат процесса не воспроизводим при повторных пробах и может варьировать в широких пределах.

Примерами субъективного подхода к оцениванию знаний учащихся являются все виды устного опроса, диктанты, изложения, сочинения, решения задач и выполнение прочих экзаменационных заданий, если они осуществляются без соблюдения приведённой выше последовательности операций процесса оценивания.

Другой подход, который мы назовём объективным, состоит в том, что для выявления наличия знаний всегда используется адекватный инструмент, позволяющий соблюсти содержательную и функциональную валидность пробы. К примеру, для проверки умения читать используется задание на чтение, т.е. проверяется правильное произнесение элементов текста (слов, предложений, знаков препинания), а не проверяется понимание смысла самого текста, не требуется его интерпретация или реконструкция. Последнее — это нарушение содержательной валидности теста. В печати часто можно прочесть, что американские школьники настолько безграмотны, что даже в старших классах не умеют читать. Это следствие содержательно инвалидного тестирования, при котором, вместо проверки умения читать, проверяется понимание учащимся многозначной семантики и логики текста со специально завуалированным межстрочным смыслом. В одной из американских публикаций, рассматривающей причины плохой подготовки абитуриентов вузов, утверждается, что этой причиной является их неумение читать сложные тексты. В публикации расшифровывается, что такое сложный текст. Это текст, в котором:

120

-е-

ВеБра1ко1.дхсС 28.02.2008 16:15 Раде 1ИК1

Лекция № 4. Инструменты диагностики качества знаний учащихся. Тесты

а) смысл сообщения выражен не явно, а скрыт внутри текста;

б) отношения между персоналиями или идеями не очевидны, и о них можно только догадываться;

в) словарь сообщения нетипичен и состоит из редких слов. Возникает естественный вопрос: «Кто же виноват в том, что

абитуриент проваливается на вступительном экзамене?». Абитуриент или «шифровальщик» этих искусственных и неоднозначных текстов, грубо нарушающих требование однозначности и общепонятности теста?

При объективном подходе к оценке знаний учащихся после завершения операции выявления наличия ранее усвоенных знаний всегда осуществляется операция измерения абсолютного показателя его качества. В том же примере оценки качества чтения это может быть объём прочитанного, число допущенных ошибок прочтения или произношения, время, затраченное на прочтение текста, и пр., но не неподдающаяся количественной оценке догадливость испытуемого о скрытом смысле, зашифрованном в тесте.

Измерение относительного показателя качества состоит в определении различного рода коэффициентов, позволяющих сопоставлять и сравнивать успехи различных учащихся и одного и того же учащегося в разные периоды обучения. Обращаясь к тому же примеру с чтением, назовём такие его относительные показатели, как отношение объёма прочитанного ко времени чтения или число допущенных ошибок определённого рода к объёму прочитанного или времени чтения. В третьей лекции мы ввели два относительных показателя: коэффициент усвоения Ка и коэффициент автоматизации Кт.

В той же третьей лекции было показано, как использование относительного показателя качества позволяет соотнести его с определённой шкалой. Очень удобной шкалой для суждения о качестве знаний оказалась 12-балльная шкала отношений относительно Ка.

По известному коэффициенту усвоения Ка не составляет труда выполнить последнюю операцию объективного процесса измерения и оценки знаний учащегося — присвоение измеренному знанию соответствующей оценки, которая однозначно показывает уровень усвоения и его качество.

Главное достоинство объективного измерения и оценки знаний учащихся состоит в воспроизводимости результата процес-

121

ВеБра1ко1.дхсС 28.02.2008 16:15 Раде 12К2

122

В.П. Беспалько. ПРИРОДОСООБРАЗНАЯ ПЕДАГОГИКА

са при любом числе повторных проб (при надлежащей, конечно, надёжности измерения).

Субъективные методы контроля качества знаний учащихся я бы рекомендовал применять только для текущей классной работы с целью организации беседы по теме занятия, оперативной мотивации учения и получения самого грубого представления об успешности проведённого занятия.

Для итогового оценивания качества знаний учащихся и косвенной оценки качества занятия надо использовать только объективные инструментальные методы.

4. Тесты как инструменты объективного оценивания знаний учащихся

История тестирования и тестов восходит к началу ХХ века, когда два известных французских психолога А. Бине и Т. Симон впервые предложили тесты для оценки качества интеллекта личности. До инициативы Бине—Симона тесты использовались для изучения свойств других психических процессов и не касались высших психических функций человека: мышления и в целом его интеллектуальных операций. Предложение французских психологов осуществлять опосредованное измерение и оценку человеческого интеллекта было встречено мировой психологической общественностью с энтузиазмом, так как открывало новые возможности исследования высших психических функций человека и давало им в руки вполне осязаемый инструмент их диагностики. Что психологи не хотели замечать с самого начала и на что закрывают глаза до сих пор, так это отсутствие хоть какой то бы ни было теоретической базы под широко развернувшимся тесто-творчеством. Даже само понятие интеллекта, лежащее в основе исходного Бине—Симона теста, до сих пор не имеет однозначного определения в психологии.

С тех пор как Бине—Симон предложили свой первый тест, утекло много воды и опубликовано много разных тестов, на разные лады трансформирующие исходный тест этих психологов. В Европе и Америке развилась целая индустрия тестирования и образовался широкий рынок тестов. Производство и применение тестов поставлено на поток. Было изобретено множество разновидностей тестов, среди которых наибольшую популярность получили интеллектуальные, личностные, способностей, дости-

122

Bespalkol.qxd 28.02.2008 16:15 Page IH^-S

1223

Лекция № 4. Инструменты диагностики качества знаний учащихся. Тесты

жений, профессиональной пригодности, психического здоровья и пр. разновидности тестов. Примечательно, что за все сто лет составления и применения тестов не сложилась сколько-нибудь различимая психолого-педагогическая теория создания тестов и тестирования. Опубликованные на эту тему работы под названием Educational measurement (Ed. Robert L. Brennan) представляют собой феноменологическое изложение умозрительных и рецептурных рекомендаций, никак не подкреплённых единой и валидной психолого-педагогической теорией (см. Лекцию № 5). Коммерческое развитие деятельности тестирования привело к тому, что предлагаемые тесты не выдерживают требований валидности и не воспроизводят объективного процесса измерения и оценки тестируемого качества. Ниже мы покажем эти дефекты массового тестирования на примерах американского и российского опыта.

Но прежде всего необходимо ознакомиться с теорией тестирования — как она сложилась в наших исследованиях на базе современной психолого-педагогической науки.

Из всех ныне различаемых видов тестов нас будут интересовать только тесты, непосредственно обслуживающие учебный процесс, так называемые тесты достижений.

Их первой особенностью является то, что с их помощью выявляется только качество усвоения учащимся учебного материала, который ему по условиям обучения (программа, учебник) должен быть заведомо известным (содержательная валидность).

Их вторая особенность состоит в том, что они легко могут быть соотнесены с изложенными в третьей лекции параметрами и критериями, описывающими качество усвоения знаний учащимися (функциональная валидность).

Теория построения и применения тестов базируется на представлении (постулате) о том, что процесс усвоения знаний и умений учащимся совершается постепенно во времени и является последовательным восхождением учащегося по уровням мастерства в изучаемом предмете. Задача теста, следовательно, — выявить, на каком уровне достижения находится в данное время учащийся. Эта задача приводит нас к выводу о том, что не может существовать единый тест для выявления качества усвоения деятельности учащимся: тест должен соответствовать, как говорят, быть валидным, уровню диагностируемого мастерства. К сожалению, в мировой практике делается попытка выявить качество ус-

123

Ве8ра1ко1.дх<С 28.02.2008 16:15 Раде 1:^4

В.П. Беспалько. ПРИРОДОСООБРАЗНАЯ ПЕДАГОГИКА

воения мастерства учащимся в предмете одним-единственным эклектичным тестом, содержащим неупорядоченную смесь тестов разного уровня. Полученный таким путём показатель качества усвоения не даёт правильного представления о действительном качестве подготовки. Он (показатель), кроме того, не обладает свойством стабильности, так как при другой смеси, казалось бы, тех же тестов может получиться результат прямо противоположный предыдущему тестированию. Такие, кстати, «непонятные» вещи происходят в настоящее время в системах образования Америки и России. Обе страны внедряют итоговое тестирование выпускников общеобразовательной школы. Возникает, однако, парадоксальная ситуация: учащиеся, успешно преодолевшие школьные тесты, проваливаются на тестах, предъявляемых им при поступлении в высшие учебные заведения. Школьные и вузовские педагоги в недоумении обвиняют друг друга, а ларчик открывается очень простым ключом, сделанным из уровней усвоения: в школьной смеси тестов больше тестов первого уровня, а в вузовской — второго и даже третьего уровня. Вот поэтому-то даже успешные школьники проваливаются на экзаменах в вузы. Выход из положения состоит не в том, чтобы обвинять друг друга, а, изучив излагаемую здесь теорию тестирования, договориться о требуемом и достижимом уровне усвоения предметов школьниками и затем применять содержательно и функционально валидные тесты для диагностики конечного уровня усвоения и в школе, и начального в вузе.

<< | >>
Источник: Беспалько В.П.. Природосообразная педагогика. М.: Народное образование, 512 с.. 2008

Еще по теме 3. Процесс измерения и оценки качества знаний учащихся:

  1. ИНСТРУМЕНТЫ ДИАГНОСТИКИ КАЧЕСТВА ЗНАНИЙ УЧАЩИХСЯ. ТЕСТЫ
  2. 13.3. Оценка знаний учащихся1
  3. ТЕМА 13. ПРОВЕРКА ЗНАНИЙ И УМЕНИЙ УЧАЩИХСЯ, ПРОБЛЕМА ОЦЕНИВАНИЯ РЕЗУЛЬТАТОВ ОБУЧЕНИЯ ИСТОРИИ
  4. Способ измерения оценки.
  5. § 4. Деятельность учителя и учащихся в процессе обучения
  6. 21.4. Оценка качества окружающей среды
  7. 5. Оценка качеств руководителя.
  8. Методы биологической оценки качества воды
  9. 6. Оценка психофизиологических качеств.
  10. 4. Оценка индивидуально-психологических и темпераментных качеств.
  11. 6.8. Формирование самостоятельности учащихся в процессе обучения
  12. 7.5. Оценка состояния и нормирование качества воды
  13. ОЦЕНКА КАЧЕСТВА ВОДЫ
  14. Глава 2.1. Оценка профессиональных качеств сотрудников