| |||
Электронный научно-педагогический журнал. Издается с 7 ноября 1995 года. | |||
Электронное научное издание.
Зарегистрировано в Федеральном
депозитарии электронных изданий ФГУП НТЦ "Информрегистр"
Министерства связи и информатизации РФ. | |||
| |||
Саенко Николай Михайлович
Терминология, связанная с разработкой тестовых заданий В рамках настоящей статьи проводится попытка на основе анализа дифференциальных признаков отдельно взятого тестового задания определить наиболее операциональные термины, которые могут быть использованы методологами-тестологами при создании тестовых заданий, отвечающих важнейшему признаку их качества – нормативности [1; с.79]. Начнем с относящихся к процедуре создания задания терминов «конструктирование тестового задания» и «композиция тестового задания». Термин «конструирование тестового задания» связан с учебной целью, поставленной учителем: хочет ли он определить уровень достижений учащихся, или выявить слабых (отстающих) учеников по определённым темам, или диагностировать общий уровень знаний в классе. Термин «композиция тестового задания» обозначает формулировку тестового задания и дистракторы, дополнительный материал (если это тестовое задание с несвободно конструируемым ответом), либо формулировку тестового задания с предложенным к нему материалом или без него (если это задание со свободно конструируемым ответом, т.е. творческое). Заметим, что термин «композиция тестового задания» логично применять по отношению лишь к определенному тестовому заданию. В отношении теста в целом (состоящем из ряда заданий) следует применять термин «композиция теста». Отдельно взятое тестовое задание можно охарактеризовать рядом показателей:
Приведем в качестве примера тестовое задание по русскому языку: «В каком слове произносится звук [с]: 1) сбросить; 2) счёт; 3) извлечь; 4) близко». Это задание адекватно воспринимается учащимися, т.к. в школьном курсе «Фонетика» они знакомятся с понятиями «звук», «буква» и с тем, как они соотносятся в потоке речи. Задание обладает доступностью, так как учащиеся знают, что произношение и написание в русском языке – разные явления; задание и приведенные дистракторы сбалансированы, так как приведенные варианты слов содержат буквы «с», «з», и учащиеся должны подумать, всегда ли эти буквы соответствуют произнесению звука [с]. Задание обладает определенной степени трудности, потому что необходимо вспомнить о таких явлениях, как влияние звуков друг на друга в потоке речи. Другой пример - тестовое задание по биологии: «Структуру двойной спирали имеет молекула: 1) белка; 2) ДНК; 3) тРНК; 4) рРНК». Данное тестовое задание обладает признаком адекватности восприятия, так как формулировка тестового задания учащимся понятна. В тестовом задании максимально сбалансированы и внутренне согласованны формулировка задания с дистракторами. Задание обладает определенной степенью трудности, так как вторичная структура белка имеет форму одинарной спирали, а ДНК, тРНК и рРНК относятся к одному классу – нуклеиновые кислоты. Заметим, что тестовое задание существует не само по себе, но как элемент системы теста. В рамках этой системы задания должны отвечать ряду требований:
Только в этом случае можно говорить о релевантности системы тестовых заданий. Вышеназванные требования (дифференциальные признаки) отдельно взятого тестового задания должны характеризовать и систему тестовых заданий в целом.
Дифференциальные признаки должны сопровождаться расшифровкой того, что должен отражать и за счет чего работает данный признак. Скажем, признак «трудность тестового задания» должен отражать степень трудности тестового задания (другими словами, в его расшифровке должен содержаться ответ на вопрос: «Сколько тестируемых может ответить правильно?»), а работает этот признак за счет выявления процента правильных ответов. Все вышеназванное является важнейшей характеристикой качества теста благодаря качеству составляющих его элементов и их сбалансированности.
Конструирование тестовых заданий – достаточно трудоемкое занятие, оно должно осуществляться преимущественно концептуальным путем и обеспечивать валидность методики. Концептуальный путь предусматривает предварительную разработку программно-валидного конструкта – модели диагностируемого явления, обоснованной данными соответствующей концепции, оперирующей однозначно определяемыми терминами. Наиболее распространенными терминами, отражающими качество теста и процесс обработки результатов, являются термины «валидность» и «надежность». Вопрос о валидности тестов был поставлен впервые в 1890 году. В послесловии к статье Дж. Кеттела основоположник тестологии Ф. Гальтон «критиковал Кетелла за то, что тот не посчитал нужным упомянуть о важности сравнения результатов тестов с независимым измерением тех же самых переменных» [2; с.18]. Позднее понятие «валидность» интенсивно разрабатывается психологами, когда ставится задача установить соответствие между степенью выраженности интересующего свойства личности и методом его измерения.
«Краткий психологический словарь» даёт следующее определение валидности
– один из важнейших критериев качества теста, означающий пригодность
теста для измерения того, что он по замыслу должен измерять [3; 38].
Аналогичное определение валидности дается в «Словаре терминов
валеологии» - степень отражения тестом того, что он должен оценивать,
как корреляция результатов данного теста с другими критериями
измеряемого свойства [6; с.14]. В отечественной литературе
вместо термина валидность нередко используются понятия
«обоснованность», «достоверность», «информативность», «действенность»,
«адекватность», «согласованность». Мерой валидности служит коэффициент
корреляции теста с каким-либо критерием. Е.А.Михайлычев [1; с.29]
определяет валидность как соответствие того, что измеряется на самом
деле, тому, что должно быть измерено по замыслу. По мнению одного из
известных исследователей-психодиагностов Л.Ф.Бурлачука, «валидность
– комплексная характеристика методики (теста), включающая сведения
об области исследуемых явлений и репрезентативности диагностической
процедуры по отношению к ним» [4; с.34], «тест называется валидным, если
он измеряет то, для чего он предназначен» [4; с.166]. А. Анастази замечает, что «в тестах достижений основной интерес сосредоточен на том, что индивид может делать к настоящему времени. Эти тесты, в отличие от тестов интеллекта и способностей, в основном оцениваются в терминах валидности по содержанию» [5; с.81]. А.Н.Майоров [2; с.212] отмечая условность классификации валидности, подчеркивает обязательность для тестов школьных достижений содержательной и желательность критериальной валидности. По Т.Н.Тягуновой [7; с.51] вероятность справедливой оценки степени обученности тестируемого равна вероятности валидности теста, умноженной на вероятность верности оценки. И.А.Караваева [8; с.7] представляет валидность как комплекс, состоящий из четырех основных характеристик (теоретической, содержательной, эмпирической и характеристики формы). Таким образом, к числу терминов, однозначно определяемых сегодня педагогической диагностикой и важных с точки зрения тестологии, можно отнести:
Литература 1. Михайлычев Е.А. Дидактическая тестология. – М.: Народное образование, 2001. – 432 с. 2. Майоров А.Н. Теория и практика создания тестов для системы образования. – М., 2000. – 352 с.
3.
Краткий психологический словарь/ Сост. Л. А. Карпенко; Под общ. Ред.
А.В. Петровского, М.Г. Ярошевского. – М.: Политиздат, 1985.–431с.
Рекомендовано к публикации:
| |||
| |||
Copyright (C) 2007, Письма в
Emissia.Offline При перепечатке и цитировании просим ссылаться на "Письма в Emissia.Offline". E-mail: emissia@mail.ru, emissia@al.ru Internet: http://www.emissia.50g.com/ , http://www.emissia.org/ , http://www.emissia.spb.su/ , http://www.emissia.al.ru/ 191186, Санкт-Петербург, наб. р. Мойки, 48, РГПУ им. А.И.Герцена. Phone: +7-911-9504477, +7-904-5169922 |