Словарь терминов

А

Анализ заданий – процесс определения статистических характеристик заданий на основе обработки, анализа и интерпретации эмпирических результатов выполнения теста репрезентативной выборкой испытуемых.

Апробация – пробное тестирование, предшествующее основному и предпринимаемое в целях коррекции и доработки теста.

Б

Балл истинный – гипотетическая оценка переменной измерения, не зависящая от средств измерения, являющаяся константой испытуемого в момент измерения, но меняющаяся в процессе обучения.

Балл критериальный (пороговый) – тестовый балл, определяемый экспертными и статистическими методами и делящий группу испытуемых на подгруппы по результатам выполнения теста согласно выбранному критерию.

Балл наблюдаемый – количественный показатель выраженности измеряемого свойства, полученный непосредственным суммированием (с весовыми коэффициентами или без них) результатов испытуемого по отдельным заданиям теста.

Балл стандартизованный (шкалированный) – переведенный в одну из стандартных шкал наблюдаемый балл. Обычно он выражает отклонение результата испытуемого от среднего значения баллов, выраженное в единицах стандартного отклонения.

Банк тестовых материалов – структурированная совокупность накопленных тестовых заданий или тестов с устойчивыми статистическими характеристиками, представленная, как правило, в компьютерной форме с помощью соответствующих программно-инструментальных средств.

Батарея тестов – совокупность специальным образом подобранных тестов, системообразующие свойства и совместимость которых обоснована статистическим путем.

В

Валидность – многомерная характеристика теста, включающая сведения об области исследуемых явлений и репрезентативности тестовой методики по отношению к ней. В более простой формулировке валидность можно определить как совокупность характеристик, определяющих способность теста служить поставленной цели его создания.

Валидность задания – количественная характеристика способности задания служить целям дифференциации испытуемых по значениям измеряемой переменной при выполнении теста. Валидность задания оценивается путем подсчета индекса дискриминативности, бисериального коэффициента корреляции, дифференцирующей способности задания теста.

Валидность прогностическая – количественная характеристика теста, предназначенная для выявления точности и обоснованности ближайшего и отдаленного прогноза, экстраполяции результатов измерения на будущее, производимых на основе результатов тестирования.

Валидность содержательная – качественная характеристика теста, фиксирующая репрезентативность представленного в тесте содержания дисциплины.

Вес задания – числовой коэффициент, выбранный экспертным или статистическим методами и используемый при подсчете итоговых баллов испытуемых по тесту.

Внутренняя согласованность – характеристика гомогенности теста, указывающая на степень дисциплинарной общности (однородности) содержания заданий теста.

Выборка репрезентативная – формируемое специальным образом подмножество генеральной совокупности, пропорции которого отражают в том или ином масштабе пропорции всех наиболее значимых страт, реально существующих в генеральной совокупности. Репрезентативная выборка используется для стандартизации теста.

Выборка случайная – формируемое случайным образом подмножество исследуемого множества (генеральной совокупности) элементов.

Выборка стандартизации – формируемое специальным образом для достижения репрезентативности подмножество генеральной совокупности, используемое для определения норм теста.

Выборки объем – число элементов, извлеченных из генеральной совокупности в соответствии с задачами исследования, степенью однородности генеральной совокупности, заданной величиной доверительной вероятности и требуемой точностью результатов измерения.

д

Дискриминативность задания (синоним – дифференцирующая способность задания) – числовая характеристика способности задания дифференцировать испытуемых по величине измеряемой переменной относительно наибольшего и наименьшего результатов. Оценивается с помощью бисериальной корреляции в рамках классической теории тестов.

Дисперсия – показатель разброса некоторого множества результатов измерений вокруг среднего арифметического, подсчитываемый как усредненное значение возведенных в квадрат отклонений от арифметического среднего, квадрат стандартного отклонения.

Дистрактор – разрабатываемые в заданиях с выбором варианты неправильных, но правдоподобных ответов, отвлекающие внимание испытуемого при выборе правильного ответа.

Дистракторный анализ – статистический метод изучения правдоподобности дистракторов, строящийся на анализе частоты выбора неправильных ответов испытуемыми группы.

Длина теста – количество заданий в тесте, оптимизируемое в соответствии с другими параметрами (цели тестирования, время тестирования, возраст учащихся и т.д.) статистическим путем.

3

Задание на дополнение (конструирование) ответа – тестовое задание, требующее от испытуемого самостоятельного получения краткого (регламентированного) или развернутого (свободно конструируемого) ответа.

Задание на установление правильной последовательности – тестовое задание, требующее от испытуемого установления правильной последовательности в ряду предлагаемых педагогом элементов.

Задание на установление соответствия – тестовое задание, требующее от испытуемого установления соответствия между элементами двух множеств, одно из которых содержит задающие элементы, а другое элементы для выбора.

Задание с выбором – тестовое задание, требующее от испытуемого выбора правильного ответа из числа предлагаемых в задании.

Задание тестовое – контрольное задание, содержание, форма и статистические свойства которого удовлетворяют набору тестологических требований.

И

Измерение педагогическое – научно обоснованный процесс отображения измеряемых объектов (свойств, учебных достижений и т.д.) на некоторое множество точек числовой оси, представляющей из себя шкалу.

Инструкция – указания в письменной или устной форме для участников тестирования (в том числе для педагогов и организаторов) по подготовке к тестированию, о порядке его проведения, правилах поведения на нем.

Интервал доверительный – интервал на оси переменной измерения, относительно которого с заранее выбранной вероятностью близкой к единице (меньшей единицы на величину выбранного уровня значимости критерия) можно утверждать, что он содержит истинное значение оцениваемого параметра.

к

Ключи ответов – набор правильных пронумерованных ответов к каждому заданию теста.

Конфиденциальность результатов тестирования – неразглашение результатов тестирования без согласия участвовавших испытуемых и педагогов.

Корреляционный анализ – совокупность методов статистического исследования взаимозависимости между переменными, находящимися во взаимодействии.

Коэффициент корреляции – числовой показатель степени взаимозависимости двух переменных, который, как правило, изменяется от – 1 до +1.

Коэффициент корреляции бисериальный – числовой показатель степени взаимозависимости двух переменных, одна из которых измерена в дихотомической шкале наименований, а другая в континуальной порядковой или интервальной шкале. При нарушении нормального характера распределения значений переменных может выходить за пределы интервала [– 1; +1].

Коэффициент корреляции Пирсона – числовой показатель степени взаимозависимости двух переменных, измеренных в континуальной шкале.

Коэффициент корреляции точечно-бисериальный – числовой показатель степени взаимозависимости двух переменных, одна из которых измерена в дихотомической шкале наименований, а другая в континуальной порядковой или интервальной шкале. По сравнению с бисериальным коэффициентом корреляции имеет заниженные значения и не может выходить за пределы интервала [– 1; +1].

Коэффициент надежности – количественная мера надежности теста, определяемая как доля дисперсии истинных баллов от общей дисперсии баллов по тесту. Квадрат коэффициента корреляции между наблюдаемыми результатами тестирования и истинными баллами по тесту.

Коэффициент ранговой корреляции Спирмена – числовой показатель степени взаимозависимости качественных признаков, измеренных в дихотомической шкале наименований или в порядковой шкале.

Коэффициент ? – числовой показатель степени взаимозависимости переменных, измеренных в номинальной шкале.

M

Матрица корреляционная – прямоугольная таблица, содержащая набор значений коэффициента корреляции между переменными, как правило, между результатами по различным заданиям теста.

Матрица ответов – прямоугольная таблица, содержащая результаты ответов испытуемых на задания теста в виде баллов за каждое задание теста или в виде номера (буквы), выбранной испытуемым при ответе (только для заданий с выбором ответов).

Меры изменчивости – статистические показатели разброса значений измеряемой переменной относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения.

Меры центральной тенденции – характеристики совокупности значений измеряемой переменной, указывающие на наиболее типичный репрезентативный для исследуемой выборки результат.

Модераторы – характеристики контингента испытуемых, значимые для оценки прогностической валидности теста.

H

Надежность параллельных форм – оценка надежности теста, полученная путем корреляции результатов по двум параллельным формам теста, которые предъявляют одной и той же группе испытуемых.

Надежность ретестовая – оценка надежности теста, полученная путем корреляции результатов по двукратному предъявлению одного и того теста одной и той же группе испытуемых.

Надежность теста – числовая характеристика теста, отражающая точность тестовых измерений и их устойчивость по отношению к действию случайных факторов.

Надежность частей теста – оценка надежности теста, полученная путем расщепления теста на части (задания) и анализа устойчивости результатов по отдельным частям (заданиям) теста.

Нормальное распределение – наиболее часто встречающийся вид теоретического распределения переменных, график плотности которого представляет из себя симметричную унимодальную колоколообразную кривую.

Нормы теста – совокупность статистических показателей, описывающих результаты выполнения теста репрезентативной выборкой испытуемых.

О

Область применения теста – характеристика теста, указывающая на особенности контингента испытуемых, для которых предназначен тест. Специфичность выборки стандартизации определяется по возрастным, половым, профессиональным, территориальным и другим критериям.

Оценка интервальная – оценка параметра генеральной совокупности с помощью числового интервала, относительно которого с заранее выбранной вероятностью можно сказать, что внутри него находится оцениваемый параметр.

Оценка параметра – однозначно определенная функция результатов наблюдений над случайной величиной, с помощью которой судят об истинном значении оцениваемого параметра.

Оценка точечная – оценка параметра генеральной совокупности, представленная не интервалом, а одним числом.

Ошибка измерения – статистический показатель, характеризующий степень точности отдельных измерений, погрешность измерений.

?

Распределение частотное – совокупность всех значений случайной величины и соответствующие частоты наблюдения этих значений.

Репрезентативность – свойство выборочной совокупности представлять генеральную совокупность.

с

Сертификация теста – процедура установления и подтверждения степени соответствия характеристик теста действующим на момент сертификации требованиям к его качеству.

Совокупность генеральная – все подлежащее исследованию множество однородных элементов, объединенных принадлежностью к одной и той же системе.

Спецификация теста – форма представления запланированной содержательной структуры и других планируемых автором характеристик теста.

Среднее арифметическое – один из наиболее распространенных видов средних величин в статистике. Среднее арифметическое получается путем суммирования всех величин и деления на их количество.

Стандартизация теста – процедура получения норм теста.

Стандартное отклонение – характеристика разброса значений переменной, определяемая как корень квадратный из дисперсии.

Стратификация выборки – процесс расслоения выборки на страты (слои), необходимый для достижения репрезентативности выборки стандартизации.

?

Теория классическая конструирования тестов – теория конструирования и применения тестов, построенная на системе постулатов, непараметрических методах оценивания и предположении о существовании параллельного измерения, осуществляемого с помощью параллельных и эквивалентных тестов.

Теория современная конструирования тестов (Item Response Theory – IRT) – теория конструирования и применения тестов, основанная на методах математического моделирования и оценивании латентных параметров испытуемых и заданий теста.

Тест (в широком понимании) – стандартизованная процедура и совокупность методик, предназначенных для получения количественных характеристик об уровне и качестве учебных достижений тестируемых.

Тест входной – система тестовых заданий, предназначенная для оценивания подготовки испытуемого с целью его дальнейшего обучения или проведения развернутого контроля его знаний и умений.

Тест гетерогенный – система междисциплинарных заданий или набор гомогенных субтестов по различным дисциплинам, требующих при разработке и применении использования методов многомерного шкалирования и факторного анализа.

Тест гомогенный – система стандартизованных однородных по содержанию тестовых заданий, связанных дисциплинарной общностью и позволяющих ввести предположение об одномерности измерений.

Тест диагностический – система тестовых заданий, выдаваемая после формирующего теста и предназначенная для выявления причин ошибок испытуемого в процессе текущего контроля за счет пошагового отслеживания этапов выполнения заданий.

Тест итоговый критериально-ориентированный – система стандартизованных тестовых заданий, ранжированных по нарастанию трудности, предназначенных для итогового контроля и позволяющих оценить процент освоенных знаний и умений испытуемыми по отношению к полному объему, запланированному педагогом к усвоению и заложенному в тесте.

Тест итоговый нормативно-ориентированный – система стандартизованных тестовых заданий, ранжированных в рамках определенной стратегии предъявления и позволяющих эффективно дифференцировать испытуемых по уровню и качеству подготовки на основе анализа результатов выполнения теста.

Тест тематический – система тестовых заданий, содержание которой предназначено для контроля по одной теме дисциплины. Обычно не нуждается в серьезном статистическом обосновании качества.

Тест формирующий – система тестовых заданий, предназначенных для формирования представлений педагога о пробелах в подготовке испытуемых. Обычно используется при рубежном контроле в сочетании с диагностическими тестами и в компьютерной форме предъявления.

Тест якорный – блок заданий в количестве от 5 до 10, помещаемый во все варианты теста и используемый для выравнивания шкал по различным вариантам теста.

Тестирование – процедура предъявления теста, проведения тестирования, оценки и интерпретации результатов его выполнения.

Тестолог (специалист в области педагогических измерений) – специалист, занимающийся теоретико-методологическим и методическим обоснованием процессов разработки и применения педагогических тестов.

Трудность задания – характеристика задания, отражающая статистический уровень его выполнения на выборке стандартизации.

У

Уровень значимости – понятие математической статистики, отражающее величину вероятности ошибочного вывода относительно анализируемой статистической гипотезы, проверяемой на основе выборочных данных.

?

Форма задания – способ организации и упорядочения элементов задания, расположенных на строго фиксированных в рамках каждой формы местах.

Формы параллельные – варианты теста, разработанные на основе общей спецификации и имеющие сходные статистические характеристики.

Ш

Шкала – форма фиксации результатов измерений путем упорядочения их в определенную числовую систему.

Шкала интервальная – тип шкалы континуального характера с единицей измерения, разбивающей интервал измерения делениями шкалы, но без абсолютного нуля.

Шкала номинальная – тип шкалы, используемый для простейшей классификации при установлении соответствия измеряемого признака определенному классу по дихотомическому принципу.

Шкала порядковая – тип шкалы, используемый для упорядочения (ранжирования) элементов без учета расстояния между ними.

Шкалирование – процесс упорядочения результатов измерения путем отображения их в ту или иную шкалу.

Оглавление

Главная | Контакты | Нашёл ошибку | Прислать материал | Добавить в избранное

Все материалы представлены для ознакомления и принадлежат их авторам.