Современные средства оценивания результатов обучения
Покупка
Тематика:
Высшее образование
Издательство:
Лаборатория знаний
Автор:
Самылкина Надежда Николаевна
Год издания: 2020
Кол-во страниц: 174
Дополнительно
Вид издания:
Курс лекций
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-00101-801-8
Артикул: 620377.02.99
Книга представляет собой курс лекций для новой общепрофессиональной дисциплины «Современные средства оценивания результатов обучения» для подготовки будущих учителей информатики в области теории и практики педагогических измерений с использованием компьютерных технологий. Она также может быть полезна при изучении раздела «Использование современных информационных и коммуникационных технологий в учебном процессе» и курса «Психолого-педагогическая диагностика на основе компьютерного тестирования» для учителей информатики.
Для студентов педагогических вузов, учителей, методистов и администрации образовательных учреждений, а также для аспирантов и соискателей при подготовке ими диссертаций (при обработке результатов педагогического эксперимента).
Тематика:
ББК:
УДК:
- 004: Информационные технологии. Вычислительная техника...
- 372: Содержание и форма деятельности в дошк. восп. и нач. образов-ии. Метод. препод. отд. учеб. предметов
ОКСО:
- ВО - Бакалавриат
- 44.03.01: Педагогическое образование
- 44.03.04: Профессиональное обучение (по отраслям)
- ВО - Магистратура
- 44.04.01: Педагогическое образование
- 44.04.04: Профессиональное обучение (по отраслям)
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Москва Лаборатория знаний 2020 ПЕДАГОГИЧЕСКОЕ ОБРАЗОВАНИЕ СОВРЕМЕННЫЕ СРЕДСТВА ОЦЕНИВАНИЯ РЕЗУЛЬТАТОВ ОБУЧЕНИЯ 4е издание, электронное Н. САМЫЛКИНА
УДК 004.9 ББК 32.97 С17 С е р и я о с н о в а н а в 2007 г. Самылкина Н. Н. С17 Современные средства оценивания результатов обучения / Н. Н. Самылкина. — 4-е изд., электрон. — М. : Лаборатория знаний, 2020. — 175 с. — (Педагогическое образование). — Систем. требования: Adobe Reader XI ; экран 10".— Загл. с титул. экрана. — Текст : электронный. ISBN 978-5-00101-801-8 Книга представляет собой курс лекций для новой общепрофессиональной дисциплины «Современные средства оценивания результатов обучения» для подготовки будущих учителей информатики в области теории и практики педагогических измерений с использованием компьютерных технологий. Она также может быть полезна при изучении раздела «Использование современных информационных и коммуникационных технологий в учебном процессе» и курса «Психолого-педагогическая диагностика на основе компьютерного тестирования» для учителей информатики. Для студентов педагогических вузов, учителей, методистов и администрации образовательных учреждений, а также для аспирантов и соискателей при подготовке ими диссертаций (при обработке результатов педагогического эксперимента). УДК 004.9 ББК 32.97 Деривативное издание на основе печатного аналога: Современные средства оценивания результатов обучения / Н. Н. Самылкина. — М. : БИНОМ. Лаборатория знаний, 2007. — 172 с. : ил. — (Педагогическое образование). ISBN 978-5-94774-459-0 В соответствии со ст. 1299 и 1301 ГК РФ при устранении ограничений, установленных техническими средствами защиты авторских прав, правообладатель вправе требовать от нарушителя возмещения убытков или выплаты компенсации ISBN 978-5-00101-801-8 c○ Лаборатория знаний, 2015 2
Введение в проблему педагогических измерений . . . . . . . . . 5 Актуальные вопросы оценки качества образования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Таксономия образовательных целей и результаты обучения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Педагогический тест как объективный способ оценивания . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Основные этапы конструирования педагогического теста . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Общие подходы к оценке достижения требований к уровню подготовки выпускников основной и средней школы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Классическая теория тестов. Достоинства и недостатки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 Немного о современной теории создания тестов. . . . . . . . . 79 Методы шкалирования и интерпретации результатов тестирования . . . . . . . . . . . . . . . . . . . . . . . . 88 Использование программных средств автоматизации хода выполнения и обработки результатов тестирования . . . . . . . . . . . . . . . . . . . . . . . . 94 Инструментальные программные системы для разработки и использования тестовых заданий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Литература. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Приложение 1. Кодификатор элементов содержания по информатике для составления контрольных измерительных материалов (КИМ) единого государственного экзамена . . . . . . . . . . . . . . . . . . . . . . . 116 Приложение 2. Спецификация экзаменационной работы по информатике для выпускников XI (XII) классов общеобразовательных учреждений 2005 г. . . . . . . . . . . . . . 122 СОДЕРЖАНИЕ 2794633475-11
Приложение 3. Единый государственный экзамен по информатике. Демонстрационный вариант 2005 г. . . . . 138 Приложение 4. Система оценивания заданий с развернутым ответом. . . . . . . . . . . . . . . . . . . . . . . . . . 158 4 Содержание 2794633475-11
Основы теории педагогических измерений Переменные измерения и их взаимосвязь Систематические и случайные ошибки измерений, истинный балл Доверительный интервал Точечные и доверительные оценки Начиная разговор о педагогических измерениях в образовании, необходимо познакомиться с некоторыми понятиями, которые будут использоваться в дальнейшем. Контроль — важнейший компонент практической деятельности педагога, позволяющий выявить достоинства и недостатки новых методов обучения, установить взаимосвязи между планируемыми, реализуемыми и достигнутыми уровнями образования, оценить достижения ученика, выявить пробелы в его знаниях и умениях, определить эффективность работы педагогического коллектива в целом (для принятия управленческих решений) и многое другое. С другой стороны, контроль — это объект теоретических исследований, в настоящее время тесно связанный с изменениями подходов к определению и оценке качества образования. Понятие «педагогический контроль» можно рассматривать как единую дидактическую и методическую систему проверочной деятельности. Применительно к повседневному учебному процессу, проверочная деятельность направлена на выявление и оценку результатов учебной деятельности школьников или студентов. В действительности, несмотря на существующие общие критерии выставления, оценка остается субъективным мерилом учебных достижений. Возникает проблема объективного измерения результатов учебной деятельности: «Измерение предполагает проведение объективного количественного сопоставления оцениваемого свойства ученика с некоторым эталоном, принятым в качестве единицы измерения. При педагогическом измерении роль оце ВВЕДЕНИЕ В ПРОБЛЕМУ ПЕДАГОГИЧЕСКИХ ИЗМЕРЕНИЙ 2794633475-11
ниваемого свойства отводится знаниям, умениям и навыкам ученика, так традиционно сложилось в отечественной практике, — а вместо единицы измерения используются контрольные задания или части заданий по проверяемому содержанию предмета» [20]. Существует и общее определение: «Измерение — процесс сопоставления оцениваемых характеристик объекта на числовую ось» [13] — настолько общее, что оно не отражает процедуру измерения и характеристики используемой шкалы. «Измерение — оценка (как процедура), проводимая с использованием понятия шкалы вполне определенных способностей для количественной оценки поведения или характеристики, например, математических способностей» — таково современное понимание измерения в международном сообществе специалистов [5]. Итак, проблема педагогических измерений ставит перед нами три вопроса: Для чего измерять? Что измерять? Чем измерять? Проще всего ответить на первый вопрос, связанный с постановкой целей контроля. Для определения степени владения базовыми знаниями, умениями и навыками, необходимыми для начала обучения, служит входной контроль. Для выявления пробелов в знаниях в процессе изучения нового материала предназначен текущий, или тематический, контроль. Для оценки качества знаний после прохождения всего предметного курса или итоговой аттестации выпускников основной или средней (полной) школы служит итоговый контроль. Второй же и третий вопросы взаимосвязаны и более сложны. В педагогическом контроле нет выделенного объекта измерения, нет точки отсчета («абсолютного нуля»), нет единиц измерения. Все это создает определенные трудности, которые специалисты пытаются решать, опираясь на математическую теорию измерений. Понятие «измерения» специалистами трактуется следующим образом. Измерения — это конструирование числовой функции, осуществляющей изоморфное отображение эмпирической структуры в некую числовую шкалу, где изоморфизм определяет условия взаимно-однозначных соответствий при отображении. Отсюда главная задача измерения: поиск такой числовой структуры, которая будет изоморфна эмпирическим референтам (измеряемым характеристикам) [20]. 6 Современные средства оценивания результатов обучения 2794633475-11
Для педагогических измерений необходимо определить следующие параметры: объект измерения (переменные измерения), измерительная процедура, средства измерения и шкала. Главная проблема при этом — выделить переменные измерения, которые в педагогике не носят явного характера. Такие переменные называют латентными (неявными), т. е. скрытыми от возможности непосредственного измерения. Такая переменная может быть выражена в виде совокупности заданий и проявляться только в эмпирических результатах выполнения теста, путем анализа; точность такого измерения, разумеется, ниже, чем в точных науках. В качестве переменной измерения могут выступать дискретные и непрерывные характеристики: из них дискретные не имеют промежуточных значений между двумя точками, тогда как непрерывные могут принимать любые значения на всем заданном интервале. При измерениях используют следующие обозначения (рис. 1). На некоторой числовой оси выделяют интервал, называемый доверительным, в котором находятся наблюдаемый балл (Х) и истинный балл (Т). Доверительным интервалом специалисты называют такие пределы выборочного распределения, в которых можно с заранее определенной вероятностью ожидать нахождения значения генеральной совокупности (т. е. результатов работы всех возможных тестируемых). Следовательно, все точки, лежащие в доверительном интервале, можно считать доверительными оценками. Интервальное исследование — это получение некоторого интервала вокруг наблюдаемого балла (Х), границы которого определяются ошибкой измерения и внутри которого лежит истинный балл (Т). Постепенно сужая интервал, мы приближаемся к истинному баллу. Математические способы позволяют от Х Введение в проблему педагогических измерений 7 Рис. 1 2794633475-11
максимально близко подойти к Т, но в классической и современной теории тестирования это реализуется по-разному. Процедура измерения — совокупность операций, позволяющая перейти от эмпирических референтов (заданий) к числовым оценкам измеряемых характеристик. Измерительный инструмент состоит из двух компонентов: теста и шкалы для фиксации результатов измерения. Педагогический тест — это инструмент, состоящий из квалиметрически (с использованием различных методов определения качества) выверенной системы тестовых заданий, стандартизованной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качеств и свойств личности, измерение которых возможно в процессе систематического обучения [9]. Оставим пока понятие «педагогический тест» для отдельного обсуждения и рассмотрим понятие шкалы. «Шкала — числовая система, в которой отношения между различными свойствами изучаемых явлений, процессов переведены в свойства того или иного множества, как правило — множества чисел» [13]. Существуют шкалы отношений, интервальные шкалы, порядковые (ранговые) и номинальные (шкалы наименований). Здесь шкалы были перечислены в порядке убывания их мощности; в тестологии же, описывая использование тех или иных шкал, говорят об «уровнях измерений»: 1. Шкала наименований представляет собой номинальный уровень, не связана с понятием «величина» (т. е. является неметрической) и используется для того, чтобы отличать один объект от другого (фамилии учеников, номера телефонов и пр.). Над элементами такой шкалы не допускается никаких арифметических действий, — возможен лишь подсчет количества объектов с совпадающими признаками. Для школьной практики это означает возможность подсчета количества отличников, «хорошистов» или двоечников и сравнение этих групп по количеству учащихся. 2. Порядковая шкала (ранговая, шкала упорядоченной классификации) представляет собой ординальный уровень, когда объекты измерения разбиваются на группы, соответствующие определенной точке шкалы. Такая шкала только упорядочивает объекты, приписывая им те или 8 Современные средства оценивания результатов обучения 2794633475-11
иные ранги. Относительно же значений этой шкалы нельзя говорить ни о том, во сколько раз измеряемая величина больше или меньше другой, ни о том, на сколько она меньше или больше; не допускается никаких арифметических действий со значениями, — допустима лишь замена чисел, характеризующих величину того или иного признака, другими, не нарушающими ранговый порядок объектов. Для корректного использования этой шкалы в школе также следует помнить, что с ее помощью можно подсчитать лишь количество учащихся, получивших различные оценки. Сравнивать же качество их подготовки путем вычисления среднего балла недопустимо! 3. Интервальная шкала (интервальный уровень измерения) основана на сравнении различий между объектами по величинам измеряемых признаков или свойств и характеризуется тем, что не имеет естественного начала отсчета и единиц измерения. Начало отсчета и интервалы здесь выбираются по договоренности относительно выбранного параметра, т. е. шкалу можно растягивать и сжимать. Интервальная шкала позволяет рассчитать среднее арифметическое и среднее квадратичное отклонение и коэффициенты корреляции. Современная теория тестов позволяет преобразовать результаты тестирования в интервальную шкалу. Для школьной практики это новый формат оценивания, который может прижиться при активном внедрении тестовых форм контроля качества подготовки выпускников. 4. Шкала отношений — самая мощная шкала. Она позволяет оценивать, во сколько раз один измеряемый объект больше (меньше) другого объекта, принимаемого за эталон. Шкала отношений имеет естественное начало отсчета, но в ней нет естественной единицы измерений. Шкалами отношений измеряют почти все физические величины, но ею нельзя пользоваться в социальных измерениях. Говоря о качестве педагогических измерений, прежде всего подразумевают их объективность. Существует несколько градаций объективности. Процедурная объективность отождествляется с объективностью процедуры тестирования (отсутствует педагог, одинаковые условия для всех, единые критерии проверки и пр.). Классическая объективность описывается формулой: Х (наблюдаемый балл) = Т (истинный балл) + Е (ошибка измерения). Введение в проблему педагогических измерений 9 2794633475-11
Здесь Т (истинный балл) — это оценка параметра испытуемого, не зависящего от средств и способа измерения, но меняющегося в процессе обучения. Т постоянно в момент измерения. Чем меньше ошибка измерения, тем измерение объективнее, где Т — абсолютно объективная оценка. Таким образом, классическая объективность связана с величиной ошибки измерения, с содержанием и процедурными проблемами. При этом совокупность заданий должна работать на оценивание переменной измерения, которая должна быть доминирующей. 10 Современные средства оценивания результатов обучения 2794633475-11