Что такое спецификация к тесту. Особенности индустриального тестирования

Прежде чем приступать к созданию теста, необходимо четко знать, для чего он нужен. Ясный ответ на этот вопрос – необходимое условие для работы. Поэтому первым шагом будет формулирование цели будущего теста. После этого следует обратиться к разработке спецификации будущего теста. Наиболее удобно сделать это в виде таблицы, в которой по горизонтали будут располагаться содержательные области, которые предполагается измерять, а по вертикали – их манифестации, или пути, по которым содержательные области могут проявляться.

Например, при конструировании «опросника супружеского статуса» Дж. Руст и С. Голомбок (Rust, Golombok, 1988) основывались на опросе экспертов, в качестве которых выступали семейные терапевты и консультанты, а также на данных, полученных от клиентов этих специалистов. Экспертов просили назвать те области взаимоотношений между мужчиной и женщиной, которые они полагали наиболее важными для гармоничного брака. Информация от клиентов позволила обнаружить те проблемные зоны семейной жизни, в которые супруги хотели бы внести изменения. На этой основе были выделены такие содержательные области, как «совместные интересы и степень зависимости – независимости», «вербальная и невербальная коммуникации», «доверие и уважение» и др. Ясное понимание цели будущего теста, естественно, облегчает построение перечня того, что предстоит измерять. При спецификации манифестаций важно обеспечить выделение различных форм их реализации. Так, при конструировании вышеупомянутого опросника «установки и чувства, проявляющиеся в отношениях» рассматривались как манифестации «вербальных и невербальных коммуникаций» между супругами.

Из практических соображений обычно по каждой оси разрабатывается от 4 до 7 категорий. Меньшее число категорий часто приводит к созданию слишком узкого опросника, а большее может сделать обременительным процесс конструирования опросника. В итоге получается своего рода решетка, количество ячеек в которой будет равно количеству планируемых для изучения параметров, умноженному на количество их поведенческих манифестаций (табл. 3.1).


При разработке опросников обычно считают, что решетка размером от 16 до 25 ячеек (например, 4x4,4x5, 5x4 или 5x5) считается идеальной для той длины теста, который вполне реально сконструировать, предъявить и обработать.

Далее необходимо определить, сколько заданий, например вопросов, должно быть создано для каждой из ячеек. При решении этой задачи следует руководствоваться тем, насколько важным представляется исследователю измерение одного из параметров сравнительно с другим или другими. В решетке, приведенной в табл. 3.2 (Rust, Golombok, 1989), допускается, что содержательным областям, обозначенным как Аи В, следует приписать 40 %-ный вес, а С и D – 10 %-ный. В то же время каждой манифестации А, В, C и D приписывается 25 %-ный вес. Необходимо обратить внимание на то, что в целом процентный вес всех содержательных областей (по горизонтали) и всех манифестаций (по вертикали) должен составлять 100 %. Такое расположение процентных весов подскажет, какую часть от всех заданий следует создать для каждой ячейки. Следующий шаг состоит в том, чтобы решить, какое количество заданий должно быть включено в тест. При этом необходимо учитывать такие факторы, как размер решетки и время, предполагаемое для выполнения заданий. Хорошо известно, что в определении количества заданий перед исследователем возникает дилемма: обеспечение, с одной стороны, надежности теста, что требует увеличения заданий, а с другой – минимизация количества заданий для обеспечения эффективной работы испытуемого с ними, подразумевающей прежде всего поддержание концентрации внимания в ходе обследования. Так, для достижения удовлетворительной надежности опросника требуется не менее 20 заданий, выполнение которых обычно занимает не более 10 минут. Наконец, важную роль в определении количества заданий теста играют особенности того контингента, который предполагается обследовать. Обычно при проводимом разработчиками пилотажном исследовании количество заданий предварительного варианта теста должно быть по крайней мере на 50 % больше числа тех, которые будут включены в окончательную версию.

После того как определен процентный вес каждой из ячеек решетки и установлено общее количество заданий для пилотажной версии теста, нетрудно подсчитать, сколько заданий должно быть разработано для каждой ячейки. Нижеприведенная решетка (Rust, Golombok, 1989) содержит то количество заданий для каждой ячейки, которое необходимо для пилотажного исследования с помощью опросника, состоявшего из 80 вопросов (табл. 3.2).

При создании теста внимание разработчика, прежде всего, привлекают вопросы отбора его содержания, которое можно определить как оптимальное отображение учебной содержания дисциплины в системе тестовых знаний.

Требование оптимальности предполагает использование определеннойметодики отбора, которая должна включатьвопросы

  • целеполагания,
  • планирования и
  • оценки качества содержания теста.

Целеполагание на этапе планирования содержания теста

Этап целеполагания является самым трудным и вместе с тем самым важным. От его результата зависит качество содержания теста. На этом этапе преподавателю необходимо решить вопрос, какие результаты студентов он хочет оценить с помощью теста.

Проблема сегодняшнего дня состоит в том, что представления о наиболее общих целях контроля не позволяют непосредственно перейти к разработке средств измерения. Оказывается необходима промежуточная ступень, которую педагоги назвали предварительной операционализацией целей (этому закрученному выражению проще и лучше соответствует термин«конкретизация»).

Процесс конкретизации характеризуется рядом этапов, которые можно отобразить схематично на рисунке:

Состав требований к планируемым результатам обучения

В состав требований к планируемым результатам обучения обычно включают систему объектов изучения, описание видов учебной деятельности и качество усвоения учебного материала. Все это входит в систему научных знаний.



Первым компонентом требований системы научных знаний является характеристика объектов изучения с учетом глубины их освещения преподавателем и планируемого уровня усвоения студентами.

К элементам системы научных знаний исследователи отнесли понятия и факты, законы, теории, идеи, знания о способах деятельности, методологические и оценочные знания.

Представляет интерес структура умений предложенная проф. И.И.Кулибабой:

· Специальные, формирующиеся в процессе изучения отдельных дисциплин;

· Рационального учебного труда, включающие умения пользоваться различными источниками знаний для решения познавательных задач, умения планировать и организовывать свою учебную деятельность, контролировать и корректировать результаты учебной деятельности, умение управлять последней в процессе учения;

· Интеллектуальные, представляющие собой ядро учебной деятельности и объединяющие все учебные дисциплины вуза.

За рубежом популярна следующая классификация целей обучения (или таксономия – по B.S. Bloom), которая представляет интерес для технологии разработки тестов:

1. Знание названий, имен, фактов.

2. Фактуальные знания.

3. Знание определений и понимание их смысла.

4. Сравнительные и сопоставительные знания.

5. Классификационные знания.

6. Знание противоположностей и противоречий, синомичных и антонимичных объектов.

7. Ассоциативные знания.

8. Причинные знания.

9. Алгоритмические, процедурные знания.

10. Обобщенные системные знания.

11. Оценочные знания.

12. Процессуальные знания.

13. Абстрактные знания.

14. Структурные знания.

15. Методологические знания.

Конкретизация учебных целей четко отражена в стандартах каждой специальности вуза. Профессор Кларин М.В. предлагает категории учебных целей в несколько измененном виде, в удобном для задач педагогического измерения (табл.1).

Обобщенные учебные цели (планирует преподаватель) Конкретизируемые учебные цели (достигаются студентом)
Знания на уровне запоминания и воспроизведения Знает смысл употребляемых терминов, Знает основные понятия и определения, Знает формулы, законы, принципы
Знания на уровне понимания Понимает и интерпретирует термины, Интерпретирует понятия и определения, Преобразует словесный материал в математические выражения, Интерпретирует словесный материал на схемах и графиках
Умения по применению знаний в известной ситуации Умеет применять термины, понятия и определения в знакомой ситуации по образцу, Умеет применять формулы, законы и принципы
Умения по применению знаний в незнакомой ситуации Использует законы и принципы в новых ситуациях, Осуществляет перенос известных принципов на незнакомые ситуации
Анализ Видит ошибки и упущения в логике рассуждений, корректирует неполные или избыточные постановки задач, Выделяет скрытые предположения, Проводит различия между фактами и следствиями
Синтез Пишет рефераты, проекты и т.п. Предлагает план проведения эксперимента, Решает проблемы на междисциплинарном уровне путем переноса знаний из одной дисциплины в другую
Оценка Сопоставляет факты, Приводит оценочные суждения, Выбирает оптимальный вариант из предложенных к рассмотрению

После определения целей тестирования и их конкретизации разрабатывается план теста и его спецификация. При разработке плана определяется раскладка процентного содержания разделов дисциплины и число заданий по каждому разделу.

Раскладку начинают с подсчета планируемого числа заданий в тесте, которое затем будет меняться в процессе работы над тестом в сторону увеличения или уменьшения. Предельное число заданий в тесте не должно превышать 60-80, поскольку на тестирование отводится время не более 2-х часов. На выполнение одного задания теста отводится примерно 2 минуты. План теста можно свести в табл. 2.

Табл.2 – Пример плана теста

Спецификация теста

После выполнения планирования содержания теста разрабатывается спецификация теста, в которой фиксируется структура, содержание проверки и процентное соотношение заданий в тесте. Иногда спецификацию делают в развернутом виде. Спецификация теста в развернутом виде включает:

1. Цель создания теста. Обоснование выбора подхода к его созданию. Описание возможных сфер применения.

2. Перечень нормативных документов (стандарты специальности, базисные программ, требования к уровню подготовки выпускников.

3. Описание общей структуры теста, включающее перечень субтестов (если они имеются) с указанием подходов их разработки.

4. Количество заданий различной формы с указанием числа ответов к закрытым заданиям. Общее число заданий в тесте.

5. Число параллельных вариантов в тесте, либо ссылка на кластер, содержащая номера и количество заданий кластера.

8. Соотношение заданий по различным разделам и видам учебной деятельности.

10. Охват требований стандартов (для аттестационных тестов).

11. Перечень требований, не вошедших в тест (для аттестационных тестов).

12. Стратегия расположения заданий в тесте, рекомендуемая разработчиком.

Предположительно, эта спецификация – набор документов для регистрации теста МО РФ.

Создание краткой спецификации основано на сопряжении знаний и умений с процентным соотношением заданий по различным разделам (содержательным линиям дисциплины), см. п.8. Пример реализации подобного сопряжения показан в табл.3. Перечень знаний и умений условно включены:

А-знание понятий, определений, терминов;

Б-знание законов и формул;

В-умение применять законы и формулы для решения задач;

Г- умение интерпретировать результаты на графиках и схемах;

Д-умение проводить оценочные суждения.

Табл.3 – Гипотетическая спецификация теста

Планируемые к проверке знания и умения Содержательные линии (разделы) дисциплины Σ-заданий по каждому пункту
I 20% II 10% III 30% IV 40%
А – 10%
Б – 20%
В – 30%
Г – 30%
Д – 10% -
Итого (строка и рассчитывается и заполняется первой

При заполнении ячеек таблицы в распределении заданий числа ставятся приближенно, и в процессе «обкатки» теста первоначальная раскладка может существенно измениться.

Спецификация, предлагаемая сотрудниками ИОСО РАН, основана на процентном соотношении заданий планируемых сообразно разделам дисциплины и видам предполагаемой деятельности испытуемого в процессе выполнения теста (табл.4).

Табл.4 – Спецификация итого теста по физике (1 семестр)

Содержание предмета Предполагаемая деятельность тестируемого
Репродуктивный уровень Продуктивный уровень
Знание определений, фактологического материала и др. Применение знаний основных законов в знакомой ситуации по образцу, на основе обобщаемого алгоритма Применение знаний в незнакомой ситуации
Общеобразовательная часть теста – 40 заданий 8 заданий –20% 24 задания –60% 8 заданий –20%
Механика 10 заданий – 25% 2 задания 6 заданий 2 задания
Молекулярная физика и термод-ка 8 заданий – 20% 1 задание 5 заданий 2 задания
Электродинамика и СТО 16 заданий – 40% 3 задания 10 заданий 3 задания
Геометрическая оптика 2 задания – 5% 1 задание 1 задание ___
Квантовая физика 4 задания – 10% 1 задание 2 задания 1 задание
Углубленная часть теста – 20 заданий __ 4 задания –20% 16 заданий –80%

После отбора содержания теста для разработчика наступает этап создания тестовых заданий. Грамотно их может сделать опытный преподаватель,

-умеющий правильно выбрать форму тестового задания для проверяемого учебного материала,

-имеющий дополнительные знания по теории и методике создания педагогических тестов.


I. Основные понятия и определения

Валидностъ теста - комплексная характеристика теста, отражающая обоснованность, значимость его результатов, а также адекватность теста целям измерения.

Генерация теста - процесс формирования теста из тестовых заданий в соответствии с задаваемыми параметрами, определяющими количественные и качественные характеристики теста (состав теста, оценочная шкала, алгоритм тестирования, время тестирования и т.д.).

Дидактическая единица (ДЕ) - логически самостоятельная часть учебной дисциплины, по своему объему и структуре соответствующая таким компонентам, как понятия, теория, закон, явление, факт, объект и т.п.

Дистрактор - вариант ответа в тестовом задании с элементом выбора, не являющийся правильным решением, но внешне близкий к правильному решению.

Длина теста - количество тестовых заданий в тесте.

Качество теста - степень соответствия теста определенным характеристикам, таким, как надежность, валидность, технологичность, корректность и т.д.

Компетенция - способность применять знания, умения, навыки и личностные качества для успешной деятельности в определенной профессиональной области.

Надежность теста - характеристика качества теста, отражающая точность оценки уровня подготовленности обучающихся с помощью данных теста, степень постоянства, стабильности, устойчивости результатов тестирования.

Спецификация теста - система характеристик теста, отражающая его содержание и структуру.

Тест - инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, процедуры проверки и заранее спроектированной технологии обработки и анализа полученных результатов. Тесты относятся к современным оценочным средствам. Электронные тесты хранятся, обрабатываются и предъявляются тестируемому с помощью компьютерной и телекоммуникационной техники.

Тестирование - метод диагностического контроля знаний, умений, навыков и/или компетенций обучаемых с использованием тестов, который завершается количественной оценкой, основанной на статистических обоснованных шкалах и нормах. Тестирование является одной из современных технологий оценивания знаний. Основным средством тестового контроля является тест, включающий два основных элемента: задание и эталон-образец правильного и качественного выполнения этого задания, с которым сравниваются ход и результаты деятельности обучаемых, чем и обеспечивается диагностичность контроля. Оценка проставляется по сумме набранных баллов за правильные ответы.

Тестирование компьютерное - метод проверки знаний на базе средств информационно-коммуникационных технологий, являющийся аналогом традиционного тестирования. В случае компьютерного тестирования осуществляется предъявление теста, фиксация результата, реализуются те или иные связанные с этим алгоритмы (например, возможность или невозможность возврата к уже выполненному или пропущенному заданию, ограничение времени, отведенного на один тест и.т.п.).

Тестовый контроль – процесс определения соответствия уровня знаний, умений, навыков и/или компетенций обучаемого регламентированным требованиям и формирования оценки на основе применения тестовых технологий.

Тестовое задание (ТЗ ) - минимальная составляющая единица теста, которая состоит из условия (вопроса) и, в зависимости от типа задания, может содержать или не содержать набор ответов для выбора. Варианты представления тестовых вопросов: выбрать правильный ответ, расположить в нужной последовательности, заполнить пропуски и т.д.

Трудность ТЗ - количество мыслительных операций и характер логических связей между ними, характеризующих сложность и продолжительность поиска и нахождения верного решения.

Фонд тестовых заданий (ФТЗ ) – логически упорядоченный набор тестовых заданий, позволяющих генерировать множество тестов.

функциональной спецификации продукта, требования к продукту являются основным источником, определяющим, какие тесты будут разработаны. Для каждого требования пишется один или более тестов, которые в совокупности должны проверить выполнение данного требования в продукте.

Пусть задан следующий фрагмент набора требований для модели обмена транзакциями:

  1. Функция DoTransaction должна принимать адрес и данные в соответствии с параметрами, создавать в очереди новый элемент, заполнять его адресную часть и часть полей данных переданной информацией и инициировать транзакцию
  2. Функция DoAddressTenure должна принимать адрес в соответствии с параметрами, создавать в очереди новый элемент и заполнять его адресную часть
  3. Функция DoDataTenure должна принимать данные в соответствии с параметрами, находить в очереди первый элемент с частично незаполненными полями данных, дополнять его переданной информацией и инициировать транзакцию

Концептуальное описание набора тестов, проверяющего спецификацию, может выглядеть следующим образом:

  1. Вызвать DoTransaction с адресом и данными. Проверить появление в очереди еще одного элемента. Проверить появление на шине транзакции с правильными адресом и данными.
  2. Вызвать DoAddressTenure с адресом. Проверить появление в очереди еще одного элемента. Проверить отсутствие новой транзакции на шине.
  3. Вызвать DoDataTenure с данными. Проверить заполнение полей данных. Проверить появление на шине транзакции с правильными адресом и данными

Тестирование сценариев

Разработка тестов, основанных на использовании сценариев, осуществляется по следующей методике:

  1. Определяется модель использования, включающая операционное окружение продукта и "актеров". Актером может быть пользователь, другой продукт, аппаратная часть и тому подобное, то есть все, с чем продукт обменивается информацией. Разделение на окружение и актеров условно и служит для описания оптимальных способов использования продукта.
  2. Разрабатываются сценарии использования продукта. Описание сценария в зависимости от продукта и выбранного подхода может быть строго определенным, параметризованным или разрешать некоторую степень неопределенности. Например, описание сценария на языке MSC допускает задание параметризованных сценариев с возможностью переупорядочивания событий.
  3. Разрабатывается набор тестов, покрывающих заданные сценарии. С учетом степени неопределенности, заложенной в сценарии, каждый тест может покрывать один сценарий, несколько сценариев, или, наоборот, часть сценария.

Использование сценариев не требует наличия полной формальной спецификации требований, но зато может потребовать больше времени на разработку и анализ.

Еще одна особенность тестирования сценариев заключается в том, что этот метод направляет тестирование на проверку конкретных режимов использования продукта, что позволяет находить дефекты, которые метод тестирования по требованиям может пропустить.

Пример использования спецификации требований для разработки тестов.

Так, для рассмотренного выше примера возможно создание следующего сценария и тестов.

  1. Сценарий: пользователь имеет две независимые нити управления, одна из которых отвечает за генерацию полных транзакций посредством DoTransaction , а другая – за сбор транзакций из адресной части и части данных, когда эта информация приходит из разных источников. Таким образом, вторая нитка использует вызовы к DoAddressTenure и DoDataTenure .
  2. Описание тестов: Вызвать DoAddressTenure c адресом А1 , вызвать DoTransaction с адресом А2 и данными D2 , вызвать DoDataTenure с данными D1 . Проверить последовательное появление на шине двух транзакций: {А1, D1} и {А2, D2}

При выполнении этого теста было, в частности, обнаружено, что функция DoTransaction была реализована через вызовы к DoAddressTenure и DoDataTenure , что приводило к появлению на шине транзакций вида {А1, D2} и {А2, D1} . Подобный дефект может быть обнаружен с большим трудом, если разрабатывать тесты, основываясь только на спецификации требований.

Ручная разработка тестов

Наиболее распространенным способом разработки тестов является создание тестового кода вручную. Это наиболее гибкий способ разработки тестов, однако характерная для него производительность труда инженеров-тестировщиков в создании тестового кода не намного выше скорости создания кода продукта, а объемы тестового кода на практике зачастую превышают объем кода продукта в 10 раз. Учитывая этот факт, в современной индустрии все больше склоняются к более интеллектуальным способам получения тестового кода, таким как использование специальных тестовых языков (скриптов ) и генерации тестов.

Генерация тестов

В настоящее время некоторые языки спецификаций, используемые для описания алгоритмов тестирования, могут быть использованы для генерации тестового кода. Рассмотрим генерацию кода из языка MSC. Тест, описанный выше, формализован на языке MSC (Рис. 9.3). Здесь каждая стрелка с пометкой DoTransaction , DoAddressTenure или DoDataTenure представлет собой вызов соответствующей функции продукта с передачей параметров. Стрелка checkTr соответствует проверке прохождения по шине транзакции с соответствующими параметрами. Каждая из стрелок диаграммы генератором тестов преобразуется в исполнимый код, при этом стрелкам, представляющим собой вызовы функций может соответствовать достаточно простой и маленький участок кода, вызывающий соответствующую функцию и проверяющий ее выходное значение на наличие ошибок.


Рис. 9.3.

Следует отметить, что стрелки, соответствующие проверке транзакций, могут после генерации преобразоваться в достаточно сложный код, который будет выполнять ожидание появления транзакции на шине в течение заданного при генерации времени - тайм-аута, проверять фазы транзакции и сверять вычисленные значения параметров с заданными эталонными значениями.Par – формальную конструкцию, применяемую для изображения параллелизма в языке MSC. При генерации тестов по диаграмме Рис. 9.4 тестовый генератор перебирает все возможные и неповторяющиеся варианты вызова тестируемых функций, сохраняя при этом корректность порядка проверок, что в данном примере дает три сгенерированных теста. Несложно видеть, что затраты на создание диаграммы Рис. 9.4 не сильно отличаются от затрат на диаграмму Рис. 9.3 , в то время как количество тестов увеличивается в три раза.

Таким образом, использование методики генерации тестового кода по формализованным MSC диаграммам позволяет значительно поднять производительность тестирования, а также преобразовать формализацию (кодировку) сценариев в достаточно интеллектуальную деятельность.

В процессе обучения учащимся в качестве проверки знаний могут быть представлены задания как в форме тестов, так и не в тестовой форме (вопросы, задачи, упражнения и т.д.).

С точки зрения разработчика, тестовое задание представлено как совокупность формы и содержания.

Форма - способ существования и выражения содержания, главной функцией которой является донесение до тестируемого содержания задания как можно понятнее, нагляднее.

Идеальное сочетание формы и содержания рождает высококачественное тестовое задание, способное адекватно оценить знание испытуемого.

Для такого задания характерны:

  • логическая форма высказывания;
  • краткость формулировки;
  • оптимальность формы представления;
  • наличие определенного места для ответов;
  • адекватность расположения элементов задания;
  • общность правил оценки ответов;
  • адекватность инструкции форме и содержанию задания.

По форме все известные в практике тестовые задания можно разделить на четыре основные группы: закрытые, открытые, на последовательность, на соответствие.

Закрытая форма

Задания такой формы еще называют заданиями с выбором одного или нескольких правильных заключений.

Состоит из неполного тестового утверждения и множества допустимых заключений, одно или несколько из которых являются правильными. Тестируемый определяет правильные заключения из данного множества. При подстановке этих (или этого) заключений в тестовое суждение, оно приобретает полноту и становится истинным утверждением.

В закрытой форме ответы не могут быть все верными или все неверными.

Примеры:

Новая страница 1

Открытая форма

Имеет вид неполного утверждения, в котором отсутствует один или несколько ключевых элементов (число, буква, слово). Ответ формулируется самим тестируемым.

Примеры:

Новая страница 1

Форма на соответствие

Состоит из двух групп элементов и четкой формулировки критерия выбора соответствия между ними. Соответствие может быть «один к одному» или «один ко многим». Это определяется количеством связей, которые сопоставляются одному элементу из первой группы элементам второй. С целью усложнения выбора ответа, в задании на соответствие могут присутствовать лишние (альтернативные) элементы, не имеющие соответствующей связи.

Примеры:

Новая страница 1

1) Соответствие между авторами и их произведениями 2) Соответствие между авторами и их произведениями
У. Эко Имя Розы Б. Акунин Алмазная колесница
Ф. Ницше Так говорил Заратустра Любовник смерти
Ф. Достоевский Идиот Ошо Близость
Сознание Осознание
Война и мир Ф. Ницше Так говорил Заратустра
Отверженные

Обратим внимание, что в данном примере задание 1 является заданием на соответствие «один к одному» с двумя альтернативными элементами («Сознание», «Война и мир»), а задание 2 - «соответствие один ко многим» с одним альтернативным элементом - «Отверженные».

  • название теста;
  • алгоритмы тестирования (способ выбора заданий из банка);
  • временные ограничения (отсутствуют, присутствуют, устанавливаются тестируемым);
  • специальная информация (отображение времени, заданий ответов);
  • способы оценивания ответа на задание;
  • шкала оценок;
  • тематический состав теста (проверяемые дидактические единицы).

Планирование содержания теста

Конкретизированные цели обучения

Обобщенные учебные цели, планируемые преподавателем Примеры конкретизированных учебных целей, достигнутых учеником
Знания на уровне запоминания и воспроизведения Знает смысл употребляемых терминов, основные понятия и определения, формулы, законы, принципы
Знания на уровне понимания Понимает и интерпретирует термины, интерпретирует понятия и определения, преобразует словесный материал в математические выражения, интерпретирует словесный материал на схемах и графиках
Умения по применению знаний в известной ситуации Умеет применять термины, понятия и определения в знакомой ситуации по образцу, а также формулы, законы и принципы в знакомой ситуации
Умения по применению знаний в незнакомой ситуации Использует законы и принципы в новых ситуациях, осуществляет перенос известных методов на незнакомые ситуации
Анализ Видит ошибки и упущения в логике рассуждений, корректирует неполные или избыточные постановки задач, выделяет скрытые предположения, проводит различия между фактами и следствиями.

После того, как определены цели тестирования, выбран вид теста и уточнены подходы создания теста разработчики приступают к следующему этапу - отбору содержания теста.

Так как основная функция теста – это контроль за уровнем учебных достижений по определенным областям знаний, предметам и дисциплинам, то тест как измерительный инструмент должен быть адекватен по отношению к проверяемому материалу. Содержание теста должно оптимально соответствовать содержанию учебной дисциплины. Чтобы достичь этого соответствия, необходимо проанализировать содержание проверяемого предмета, раздела, темы и т.д., выделить самые важные элементы, которые требуют проверки, определить, какие знания и умения в этой области содержания будут проверяться с помощью тестовых заданий.

Опираясь на анализ содержания дисциплины, далее разрабатывается план теста. Разработчик должен определить, из скольких частей (субтестов) будет состоять тест, планируемое количество заданий, какие формы тестовых заданий будут использоваться.

Планирование теста предполагает определение соотношения элементов содержания и необходимого количества заданий для их проверки, которое определяется значимостью и количеством времени, отведенном на изучение.

Более эффективный способ планирования теста - когда учитываются не только элементы содержания, но и виды деятельности, которые подвергаются проверке. При этом виды деятельности в зависимости от уровня усвоения учебного материала подразделяются на репродуктивный (знание определений, формул, фактов и использование знаний по образцу) и продуктивный (применение знаний в незнакомой ситуации).



Каждый тест должен сопровождаться спецификацией, т.е. его описанием, где указываются цели тестирования, для кого этот тест предназначен, содержание проверки, процентное соотношение заданий по различным разделам и видам деятельности, используемые формы заданий, рекомендуемое время выполнения. Спецификация теста разрабатывается с учетом нормативных документов и образовательных стандартов, которые используются при планировании содержания теста. Структура теста в спецификации представлена в виде таблицы.

Примечание. Рассмотреть примеры спецификаций по конкретным дисциплинам: истории, математике, информатике и др.



Поделитесь с друзьями или сохраните для себя:

Загрузка...