Письма в

emissia.offline

2007

Электронный научно-педагогический журнал. Издается с 7 ноября 1995 года.

Электронное научное издание. Зарегистрировано в Федеральном депозитарии электронных изданий ФГУП НТЦ "Информрегистр" Министерства связи и информатизации РФ.
Государственная регистрация  #
0420700031 от 27.11.2006

ART  1160  

Март 2007 г.


Саенко Николай Михайлович
соискатель кафедры общей педагогики Таганрогского государственного педагогического института, г.Таганрог

litfak_tgpi@rambler.ru
 

Терминология, связанная с разработкой тестовых заданий

В рамках настоящей статьи проводится попытка на основе анализа дифференциальных признаков отдельно взятого тестового задания  определить наиболее операциональные термины, которые могут быть использованы методологами-тестологами при создании тестовых заданий, отвечающих важнейшему признаку их качества – нормативности [1; с.79].

Начнем с относящихся к процедуре создания задания терминов «конструктирование тестового задания» и «композиция тестового задания». 

Термин «конструирование тестового задания» связан с учебной целью, поставленной учителем: хочет ли он определить уровень достижений учащихся, или выявить слабых (отстающих) учеников по определённым темам, или диагностировать общий уровень знаний в классе.

Термин «композиция тестового задания» обозначает формулировку тестового задания и дистракторы, дополнительный материал (если это тестовое задание с несвободно конструируемым ответом), либо формулировку тестового задания с предложенным к нему материалом или без него (если это задание со свободно конструируемым ответом, т.е. творческое).  Заметим, что термин «композиция тестового задания» логично применять по отношению лишь к определенному тестовому заданию.  В отношении  теста в целом (состоящем из ряда заданий) следует применять термин «композиция теста».

Отдельно взятое тестовое задание можно охарактеризовать рядом показателей:

  • адекватность восприятия формулировки задания,

  • практичность задания,

  • сбалансированность задания  (дистракторы должны релевантно отражать формулировку задания),

  • трудность задания (задание должно обладать определённой степенью трудности).  

Приведем в качестве примера тестовое задание по русскому языку: «В каком слове произносится звук [с]: 1) сбросить; 2) счёт; 3) извлечь; 4) близко». Это задание адекватно воспринимается учащимися, т.к. в школьном курсе «Фонетика» они знакомятся с понятиями «звук», «буква» и с тем, как они соотносятся в потоке речи. Задание обладает доступностью, так как учащиеся знают, что произношение и написание в русском языке – разные явления; задание и приведенные дистракторы сбалансированы, так как приведенные варианты слов содержат буквы «с», «з», и учащиеся должны подумать, всегда ли эти буквы соответствуют произнесению звука [с]. Задание обладает определенной степени трудности, потому что необходимо вспомнить о таких явлениях, как влияние звуков друг на друга в потоке речи.

Другой пример - тестовое задание по биологии: «Структуру двойной спирали имеет молекула: 1) белка; 2) ДНК; 3) тРНК; 4) рРНК».  Данное тестовое задание обладает признаком адекватности восприятия, так как формулировка тестового задания учащимся понятна. В тестовом задании максимально сбалансированы и внутренне согласованны формулировка задания с дистракторами. Задание обладает определенной степенью трудности, так как вторичная структура белка имеет форму одинарной спирали, а ДНК, тРНК и рРНК относятся к одному классу – нуклеиновые кислоты.

Заметим, что тестовое задание существует не само по себе, но как элемент системы теста.  В рамках этой системы задания должны отвечать ряду требований:

  • селективности (т.е. взаимосвязи решения задания с решением других задач);

  • надежности (ответы должны отличаться устойчивостью);

  • внутренней согласованности, отражающей системность знаний и  демонстрирующей прочность внутрисистемных взаимосвязей заданий теста;

  • экономичности (т. е. целесообразности наличия дублирующих заданий);

  •  разнотипности формулировок и приведенных дистракторов.

Только в этом случае можно говорить о релевантности системы тестовых заданий. Вышеназванные требования  (дифференциальные признаки) отдельно взятого тестового задания должны характеризовать и систему тестовых заданий в целом.  

 

Дифференциальные признаки должны сопровождаться расшифровкой того, что должен отражать  и за счет чего работает данный признак.  Скажем, признак «трудность тестового задания» должен отражать степень трудности тестового задания (другими словами,  в его расшифровке должен содержаться ответ на вопрос: «Сколько тестируемых может ответить правильно?»), а работает этот признак за счет выявления процента правильных ответов. Все вышеназванное является важнейшей характеристикой качества теста благодаря качеству составляющих его элементов и их сбалансированности.

 

Конструирование тестовых заданий – достаточно трудоемкое занятие, оно должно осуществляться преимущественно концептуальным путем и обеспечивать валидность методики. Концептуальный путь предусматривает предварительную разработку программно-валидного конструкта – модели диагностируемого явления, обоснованной данными соответствующей концепции, оперирующей однозначно определяемыми терминами.

Наиболее распространенными терминами, отражающими качество  теста и процесс обработки результатов, являются термины «валидность» и «надежность». Вопрос о валидности тестов был поставлен впервые  в 1890 году. В послесловии к статье Дж. Кеттела  основоположник тестологии Ф. Гальтон «критиковал Кетелла за то, что тот не посчитал нужным упомянуть о важности сравнения результатов тестов с независимым измерением  тех же самых переменных» [2; с.18].  Позднее понятие «валидность» интенсивно разрабатывается психологами, когда ставится задача установить соответствие между степенью выраженности интересующего свойства личности и методом его измерения.   

«Краткий психологический словарь» даёт следующее определение валидности – один из важнейших критериев качества теста, означающий пригодность теста для измерения того, что он по замыслу должен измерять [3; 38].  Аналогичное определение валидности дается в «Словаре терминов валеологии»  - степень отражения тестом того, что он должен оценивать,  как корреляция результатов данного теста с другими критериями измеряемого свойства [6; с.14] В отечественной литературе вместо термина валидность нередко используются  понятия «обоснованность», «достоверность», «информативность», «действенность», «адекватность», «согласованность». Мерой валидности служит коэффициент корреляции теста с каким-либо критерием. Е.А.Михайлычев [1; с.29] определяет валидность как соответствие того, что измеряется на самом деле, тому, что должно быть измерено по замыслу. По мнению одного из известных исследователей-психодиагностов Л.Ф.Бурлачука, «валидность  – комплексная характеристика методики (теста), включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним» [4; с.34], «тест называется валидным, если он измеряет то, для чего он предназначен» [4; с.166].
 

А. Анастази замечает, что «в тестах достижений основной интерес сосредоточен на том, что индивид может делать к настоящему времени. Эти тесты, в отличие от тестов интеллекта и способностей, в основном оцениваются в терминах валидности по содержанию» [5; с.81].

А.Н.Майоров [2; с.212] отмечая условность классификации валидности, подчеркивает обязательность для тестов школьных достижений содержательной и желательность критериальной валидности. По Т.Н.Тягуновой [7; с.51] вероятность справедливой оценки степени обученности тестируемого равна вероятности валидности теста, умноженной  на вероятность верности оценки.  И.А.Караваева [8; с.7] представляет валидность как комплекс, состоящий из четырех основных характеристик (теоретической, содержательной, эмпирической и характеристики формы).

Таким образом, к числу терминов, однозначно определяемых сегодня педагогической диагностикой и важных с точки зрения тестологии, можно отнести:

  • термины «валидность» и «надёжность» теста,

  • термины, отражающие дифференциальные признаки тестовых заданий:   «адекватность»,  «практичность», «сбалансированность», «трудность», «селективность», «надежность», «согласованность»,  «экономичность», «разнотипность»,  

  • термины, относящихся к процедуре создания задания: «конструктирование тестового задания» и «композиция тестового задания». 

 

Литература

1. Михайлычев Е.А. Дидактическая тестология. – М.: Народное образование, 2001. – 432 с.

2. Майоров А.Н. Теория и практика создания тестов для системы образования. – М., 2000. – 352 с.

3. Краткий психологический словарь/ Сост. Л. А. Карпенко; Под общ. Ред. А.В. Петровского, М.Г. Ярошевского. – М.: Политиздат, 1985.–431с.
4. Бурлачук Л.Ф. Психодиагностика. – Спб.: Питер, 2003. – 351 с.

5. Анастази А., Урбина С. Психологическое тестирование. – СПб.: Питер, 2002. – 668 с.
6. Кураев Г.А., Войнов В.Б. Валеология. Словарь терминов. Под ред. Чораяна О.Г. – Ростов н/Д: Изд. «ЦВВР», 2000. – 170 с.

7. Тягунова Т.Н. Философия и концепция компьютерного тестирования. – М.: МГУП, 2003. – 246 с.

8. Караваева И.А. Валидность педагогических тестов. – Ижевск: Издательский дом «Удмуртский университет», 2004. – 150 с.

 

Рекомендовано к публикации:
Е.А.Михайлычев, доктор педагогических наук, научный руководитель работы
А.А.Ахаян
, доктор педагогических наук, член Редакционного совета


Copyright (C) 2007, Письма в Emissia.Offline
При перепечатке и цитировании просим ссылаться на "Письма в Emissia.Offline".
E-mail:  emissia@mail.ru, emissia@al.ru   
Internet: http://www.emissia.50g.com/ , http://www.emissia.org/ ,  http://www.emissia.spb.su/ , http://www.emissia.al.ru/
191186, Санкт-Петербург, наб. р. Мойки, 48, РГПУ им. А.И.Герцена.  Phone: +7-911-9504477, +7-904-5169922

 TopList

    Rambler's Top100