Образовательная оценка - Educational assessment

Образовательная оценка или образовательная оценка - это систематический процесс документирования и использования эмпирических данных о знаниях , навыках , отношениях и убеждениях для уточнения программ и улучшения обучения учащихся. Данные оценки могут быть получены путем непосредственного изучения работы учащихся для оценки достижения результатов обучения или могут быть основаны на данных, из которых можно сделать выводы об обучении. Оценка часто используется как синоним теста, но не ограничивается тестами. Оценка может быть сосредоточена на отдельном учащемся, учебном сообществе (классе, семинаре или другой организованной группе учащихся), курсе, академической программе, учреждении или образовательной системе в целом (также известной как гранулярность). Слово «оценка» стало использоваться в образовательном контексте после Второй мировой войны.

Как непрерывный процесс, оценка устанавливает измеримые и четкие результаты обучения учащихся для обучения, обеспечивая достаточное количество возможностей обучения для достижения этих результатов, реализуя систематический способ сбора, анализа и интерпретации данных, чтобы определить, насколько хорошо обучение учащихся соответствует ожиданиям, и используя собранная информация для улучшения обучения студентов.

Конечная цель оценочных практик в образовании зависит от теоретической основы практикующих специалистов и исследователей, их предположений и убеждений о природе человеческого разума, происхождения знаний и процесса обучения.

Типы

Термин « оценка» обычно используется для обозначения всех действий, которые учителя используют для помощи ученикам в учебе и для оценки успеваемости учеников. Оценку для удобства можно разделить на следующие категории:

  1. Размещение, формирующая, итоговая и диагностическая оценка
  2. Объективно и субъективно
  3. Ссылка (ссылка на критерий, ссылка на норму и ипсативный (принудительный выбор) )
  4. Неформальный и формальный
  5. Внутренний и наружный

Размещение, формирующее, суммативное и диагностическое

Оценивание часто делится на начальную, формирующую и итоговую категории с целью рассмотрения различных целей практики оценивания.

  • Оценка размещения - оценка размещения используется для размещения учащихся в соответствии с предыдущими достижениями или личными характеристиками, в наиболее подходящий момент в учебной последовательности, в уникальной учебной стратегии или с подходящим учителем, проводимым посредством тестирования размещения , то есть тестов, которые колледжи и университеты используют его для оценки готовности к поступлению в колледж и размещения студентов в начальных классах. Оценка размещения, также называемая предварительной оценкой или первоначальной оценкой, проводится перед инструктажем или вмешательством, чтобы установить исходный уровень, по которому можно измерить индивидуальный рост учащегося. Этот тип оценки используется, чтобы узнать, каков уровень знаний учащегося по предмету. Это помогает учителю более эффективно объяснять материал. Эти оценки не выставляются на оценку.
  • Формирующее оценивание - Формирующее оценивание обычно проводится на протяжении всего курса или проекта. Формирующая оценка, также называемая «образовательной оценкой», используется для помощи в обучении. В образовательной среде формирующая оценка может осуществляться учителем (или сверстником ) или учащимся, обеспечивая обратную связь о работе учащегося, и не обязательно будет использоваться для целей выставления оценок. Формирующие оценки могут принимать форму диагностических, стандартных тестов, викторин, устных вопросов или черновиков. Формирующие оценки проводятся одновременно с инструкциями. Результат можно засчитать. Формирующее оценивание направлено на то, чтобы увидеть, понимают ли учащиеся инструкции, прежде чем проводить итоговое оценивание.
  • Суммативная оценка - Суммативная оценка обычно проводится в конце курса или проекта. В образовательной среде итоговые оценки обычно используются для выставления студентам оценок за курс. Суммативные оценки носят оценочный характер. Итоговые оценки предназначены для обобщения того, что студенты узнали, чтобы определить, хорошо ли они понимают предмет. Этот тип оценивания обычно выставляется по шкале (например, сдан / не пройден, 0–100) и может принимать форму тестов, экзаменов или проектов. Суммативное оценивание часто используется для определения того, сдал ли учащийся урок или нет. Итоговые оценки критикуют за то, что они редуктивны, и учащиеся обнаруживают, насколько хорошо они приобрели знания, слишком поздно, чтобы их можно было использовать.
  • Диагностическая оценка - Диагностическая оценка касается всех трудностей, возникающих в конце процесса обучения.

Джей МакТиг и Кен О'Коннор предложили семь практик эффективного обучения. Один из них - показать критерии оценки перед тестом. Другой - о важности предварительной оценки, чтобы узнать, каков уровень навыков учащегося, прежде чем давать инструкции. Еще одна практика - давать много отзывов и поощрять.

Исследователь в области образования Роберт Стейк объясняет разницу между формативным и итоговым оцениванием следующей аналогией:

Когда повар пробует суп, это формирует. Когда гости пробуют суп, это итог.

Итоговое и формирующее оценивание часто упоминается в контексте обучения как оценка обучения и оценка обучения соответственно. Оценка обучения, как правило, носит итоговый характер и предназначена для измерения результатов обучения и сообщения об этих результатах учащимся, родителям и администраторам. Оценка успеваемости обычно проводится по завершении класса, курса, семестра или учебного года. Оценка для обучения обычно носит формирующий характер и используется учителями для рассмотрения подходов к обучению и следующих шагов для отдельных учащихся и класса.

Распространенной формой формирующей оценки является диагностическая оценка . Диагностическая оценка измеряет текущие знания и навыки учащегося с целью определения подходящей программы обучения. Самооценка - это форма диагностической оценки, при которой учащиеся оценивают себя. Перспективная оценка просит оцениваемых считать себя в гипотетических будущих ситуациях.

Оценка, основанная на успеваемости, аналогична итоговой оценке, поскольку в ней основное внимание уделяется достижениям. Его часто увязывают с реформой образования, основанного на стандартах, и движением в области образования, основанного на результатах . Хотя в идеале они значительно отличаются от традиционного теста с несколькими вариантами ответов , они чаще всего связаны со стандартным оцениванием, в котором используются ответы в свободной форме на стандартные вопросы, выставляемые людьми, оценивающими по стандартной шкале, отвечающие, падающие ниже или превышающие стандарт производительности, а не ранжирование по кривой. Определяется четко определенная задача, и учащихся просят что-то создать, произвести или сделать, часто в условиях, требующих реального применения знаний и навыков. Профессионализм демонстрируется предоставлением расширенного ответа. Форматы исполнения дополнительно подразделяются на продукты и выступления. Результатом выступления может стать произведение, например картина, портфолио, бумага или выставка, или оно может состоять из выступления, например выступления, спортивных навыков, музыкального выступления или чтения.

Объективно и субъективно

Оценка (итоговая или формирующая) часто подразделяется на объективную или субъективную. Объективная оценка - это форма вопросов, на которые есть один правильный ответ. Субъективная оценка - это форма вопросов, на которые может быть указано более одного правильного ответа (или более одного способа выражения правильного ответа). Есть разные типы объективных и субъективных вопросов. Типы объективных вопросов включают истинные / ложные ответы, вопросы с множественным выбором , множественные ответы и вопросы на соответствие. Субъективные вопросы включают вопросы с расширенным ответом и эссе. Объективное оценивание хорошо подходит для все более популярного компьютеризированного или онлайн- формата оценивания .

Некоторые утверждали, что различие между объективными и субъективными оценками не является ни полезным, ни точным, потому что в действительности не существует такой вещи, как «объективная» оценка. Фактически, все оценки создаются с присущими им предубеждениями, встроенными в решения о соответствующем предмете и содержании, а также с культурными (классовыми, этническими и гендерными) предубеждениями.

Основа сравнения

Результаты теста можно сравнить с установленным критерием, или с успеваемостью других учащихся, или с предыдущими показателями:

  • Оценка , основанная на критериях , обычно с использованием критериальной проверки , как следует из названия, происходит, когда кандидаты оцениваются по определенным (и объективным) критериям. Критериальная оценка часто, но не всегда, используется для определения компетентности человека (может ли он / она что-то делать). Самым известным примером оценки, основанной на критериях, является экзамен по вождению, когда учащиеся водители оцениваются по ряду явных критериев (например, «Не подвергать опасности других участников дорожного движения»).
  • Оценка, основанная на нормах (в просторечии известная как « оценка по кривой »), обычно использующая тест , основанный на нормах , не измеряется по определенным критериям. Этот тип оценки относится к студенческому сообществу, проводящему оценку. Это эффективный способ сравнения студентов. Тест IQ - самый известный пример оценки, основанной на нормах. Многие вступительные испытания (в престижные школы или университеты) основаны на нормах, что позволяет пройти фиксированную часть учащихся («сдача» в данном контексте означает принятие в школу или университет, а не явный уровень способностей). Это означает, что стандарты могут меняться из года в год, в зависимости от качества когорты; оценка, основанная на критериях, не меняется из года в год (если только критерии не меняются).
  • Ипсативная оценка - это самостоятельное сравнение либо в одной и той же области с течением времени, либо в сравнении с другими областями в рамках одного и того же студента.

Неформальный и формальный

Оценка может быть формальной или неформальной . Формальная оценка обычно подразумевает письменный документ, такой как тест, викторина или работа. Формальной оценке присваивается числовой балл или оценка, основанная на успеваемости учащегося, тогда как неформальная оценка не влияет на итоговую оценку учащегося. Неформальная оценка обычно проводится в более непринужденной манере и может включать наблюдение, инвентаризацию, контрольные списки, шкалы оценок, рубрики , оценки эффективности и портфолио, участие, коллегиальную и самооценку, а также обсуждение.

Внутренний и наружный

Внутреннее оценивание устанавливается и отмечается школой (т.е. учителями). Студенты получают оценку и отзывы об оценке. Внешняя оценка устанавливается руководящим органом и проводится непредвзятым персоналом. Некоторые внешние оценки дают гораздо более ограниченную обратную связь при выставлении оценок. Однако в тестах, таких как Австралийский NAPLAN, критерий, к которому обращаются учащиеся, получает подробную обратную связь, чтобы их учителя могли рассмотреть и сравнить учебные достижения учащихся, а также составить планы на будущее.

Стандарты качества

Как правило, качественные оценки считаются оценками с высоким уровнем надежности и достоверности . Однако подходы к надежности и достоверности различаются.

Надежность

Надежность относится к последовательности оценки. Надежная оценка - это оценка, которая неизменно дает одни и те же результаты с одной и той же (или аналогичной) группой студентов. На надежность влияют различные факторы, включая неоднозначные вопросы, слишком много вариантов в вопроснике, расплывчатые инструкции по выставлению оценок и плохо обученные маркеры. Традиционно надежность оценки основана на следующем:

  1. Временная стабильность: результаты теста сопоставимы в двух или более отдельных случаях.
  2. Эквивалентность форм: результаты экзаменов одинаковы по разным формам теста, основанным на одинаковом содержании.
  3. Внутренняя согласованность: ответы на вопросы теста единообразны. Например: в опросе, в котором респондентов просят оценить отношение к технологиям, можно ожидать единообразия в ответах на следующие вопросы:
    • «Я очень негативно отношусь к компьютерам в целом».
    • «Мне нравится пользоваться компьютерами».

Надежность измерения x также может быть определена количественно как: где - надежность наблюдаемого (тестового) балла x; и - вариативность в «истинных» (т. е. врожденных способностях кандидата) и измеренных результатах тестов, соответственно. может варьироваться от 0 (совершенно ненадежно) до 1 (полностью надежно).

Срок действия

Достоверная оценка - это оценка, измеряющая то, что она предназначена для измерения. Например, нельзя оценивать навыки вождения только с помощью письменного теста. Более действенным способом оценки навыков вождения была бы комбинация тестов, которые помогают определить, что водитель знает, например, с помощью письменного теста на знание вождения, и того, что водитель может делать, например, с помощью оценки фактических результатов. вождение. Учителя часто жалуются, что некоторые экзамены неправильно оценивают программу, на которой основан экзамен; они, по сути, ставят под сомнение достоверность экзамена.

Достоверность оценки обычно оценивается путем изучения доказательств по следующим категориям:

  1. Содержание - соответствует ли содержание теста заявленным целям?
  2. Критерий - Коррелируют ли баллы с внешней ссылкой? (например: Точно ли высокие баллы на тесте по чтению в 4-м классе предсказывают умение читать в будущих классах?)
  3. Построить - Соответствует ли оценка другим значимым переменным? (например: учащиеся ESL постоянно показывают разные результаты на письменном экзамене по сравнению с носителями английского языка?)

Хорошая оценка имеет как достоверность, так и надежность, а также другие атрибуты качества, указанные выше для конкретного контекста и цели. На практике оценка редко бывает полностью достоверной или абсолютно надежной. Линейка с неправильной маркировкой всегда будет давать одинаковые (неправильные) измерения. Это очень надежно, но не очень актуально. Просьба случайных людей назвать время, не глядя на часы или часы, иногда используется как пример оценки, которая является действительной, но ненадежной. Ответы будут разными у разных людей, но средний ответ, вероятно, близок к фактическому времени. Во многих областях, таких как медицинские исследования, образовательное тестирование и психология, часто приходится искать компромисс между надежностью и обоснованностью. В тесте по истории, написанном для высокой степени достоверности, будет много вопросов для сочинений и ответов на вопросы. Это будет хорошая мера владения предметом, но трудно дать точную оценку. Исторический тест, написанный для высокой надежности, будет иметь несколько вариантов выбора. Он не так хорош для измерения знаний по истории, но может быть легко оценен с большой точностью. Мы можем сделать из этого обобщения. Чем надежнее наша оценка того, что мы хотим измерить, тем меньше мы уверены в том, что действительно измеряем этот аспект достижения.

Хорошо различать достоверность «предметной» и «предсказательной». Первый, широко используемый в образовании, позволяет определить, какой балл получит учащийся за аналогичный тест, но с другими вопросами. Последний, широко используемый на рабочем месте, позволяет прогнозировать производительность. Таким образом, уместен предметный тест на знание правил вождения, в то время как прогнозируемый тест позволит оценить, может ли потенциальный водитель следовать этим правилам.

Стандарты оценки

В области оценки , и в частности оценки образования , Объединенный комитет по стандартам оценки образования опубликовал три набора стандартов оценки. В Стандартах оценки персонала были опубликованы в 1988 г. Стандарты оценки программы (второе издание) были опубликованы в 1994 году, и Студенческие стандарты оценки были опубликованы в 2003 году.

Каждая публикация представляет и разрабатывает набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат рекомендации по разработке, внедрению, оценке и совершенствованию установленной формы оценки. Каждый из стандартов был отнесен к одной из четырех основных категорий, чтобы способствовать правильности, полезности, выполнимости и точности образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в разделе «Точность». Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.

В Великобритании присуждается награда в области обучения, оценки и обеспечения качества (TAQA), которая помогает сотрудникам изучать и развивать передовую практику в отношении оценки образования в контексте обучения взрослых, дальнейшего и производственного образования и обучения.

Сводная таблица основных теоретических основ

В следующей таблице приведены основные теоретические основы, лежащие в основе почти всей теоретической и исследовательской работы, а также методики обучения в образовании (одна из которых, конечно же, практика оценивания). Эти различные подходы вызвали интересные дискуссии среди ученых.

Темы Эмпиризм Рационализм Социокультурность
Философская ориентация Юм : британский эмпиризм Кант , Декарт : континентальный рационализм Гегель , Маркс : культурная диалектика
Метафорическая ориентация Механика / Работа машины или компьютера Организм / рост растения Контекстуалист / Исследование исторического события
Ведущие теоретики Б. Ф. Скиннер ( бихевиоризм ) / Херб Саймон , Джон Андерсон , Роберт Гагне : ( когнитивизм ) Жан Пиаже / Робби Кейс Лев Выготский , Лурия , Брунер / Алан Коллинз, Джим Грино, Энн Браун , Джон Брансфорд
Природа разума Изначально пустое устройство, которое обнаруживает закономерности в мире и оперирует ими. Качественно идентичен низшим животным, но количественно превосходит его. Орган, который эволюционировал, чтобы приобретать знания, осмысливая мир. Уникально человек, качественно отличный от низших животных. Уникальный среди видов для развития языка, инструментов и образования.
Природа знания (эпистемология) Иерархически организованные ассоциации, которые представляют точное, но неполное представление о мире. Предполагается, что сумма компонентов знания такая же, как и целое. Поскольку знания точно представлены компонентами, предполагается, что тот, кто демонстрирует эти компоненты, знает Общие и / или конкретные когнитивные и концептуальные структуры, построенные разумом и в соответствии с рациональными критериями. По сути, это структуры более высокого уровня, которые созданы для ассимиляции новой информации с существующей структурой и по мере того, как структуры вмещают больше новой информации. Знания представляют собой способность решать новые проблемы. Распространяется среди людей, сообществ и физического окружения. Представляет культуру сообщества, которое продолжает ее создавать. Знать - значит быть настроенным на ограничения и возможности систем, в которых происходит деятельность. Знания представлены в закономерностях успешной деятельности.
Характер обучения (процесс увеличения или изменения знаний) Формирование и укрепление когнитивных или SR-ассоциаций. Генерация знаний посредством (1) воздействия на образец, (2) эффективного распознавания и реагирования на образец (3) распознавания образов в других контекстах. Участие в активном процессе осмысления («рационализации») окружающей среды. Разум применяет существующую структуру к новому опыту, чтобы рационализировать его. На самом деле вы не изучаете компоненты, а только структуры, необходимые для работы с этими компонентами позже. Повышение способности участвовать в конкретном сообществе практикующих. Посвящение в жизнь группы, усиление способности к участию за счет адаптации к ограничениям и возможностям.
Особенности достоверной оценки Оцените компоненты знаний. Сосредоточьтесь на овладении многими компонентами и беглости. Используйте психометрию для стандартизации. Оцените расширенную производительность при решении новых задач. Признание разновидностей передового опыта. Оцените участие в опросе и социальные практики обучения (например, портфолио, наблюдения). Студенты должны участвовать в процессе оценивания. Оценки должны быть интегрированы в более крупную среду.

Полемика

Обеспокоенность по поводу того, как лучше всего применять методы оценивания в системах государственных школ, в основном сосредоточена на вопросах об использовании тестов с высокими ставками и стандартизированных тестов, которые часто используются для оценки успеваемости учащихся, качества учителей и успеваемости в школе, округе или штате. .

Ни один ребенок не остался позади

Для большинства исследователей и практиков вопрос не в том, следует ли вообще проводить тесты - существует общее мнение, что при правильном проведении тестов можно получить полезную информацию об успеваемости учащихся и реализации учебной программы, а также предложить формирующее использование для учащиеся. Таким образом, реальный вопрос заключается в том, могут ли методы тестирования, применяемые в настоящее время, предоставить эти услуги преподавателям и студентам.

Президент Буш подписал Закон «Не оставлять детей без присмотра» (NCLB) 8 января 2002 года. Закон NCLB повторно санкционировал Закон о начальном и среднем образовании (ESEA) 1965 года. Президент Джонсон подписал ESEA, чтобы помочь в борьбе с войной с бедностью и финансировать начальную школу. и средние школы. Целью президента Джонсона было подчеркнуть равный доступ к образованию и установить высокие стандарты и подотчетность. Закон NCLB требует, чтобы государства разрабатывали оценки базовых навыков. Чтобы получить федеральное финансирование школы, штаты должны были дать эти оценки всем учащимся на выбранном уровне обучения.

В США Закон « Ни одного отстающего ребенка» предусматривает проведение стандартизированного тестирования по всей стране. Эти тесты согласуются с государственной учебной программой и связывают ответственность учителя, ученика, округа и штата с результатами этих тестов. Сторонники NCLB утверждают, что он предлагает ощутимый метод оценки успеваемости, привлечения учителей и школ к ответственности за плохие оценки и сокращения разрыва в успеваемости по классам и этническим группам.

Противники стандартизированного тестирования оспаривают эти утверждения, утверждая, что привлечение преподавателей к ответственности за результаты тестов ведет к практике « обучения до теста ». Кроме того, многие утверждают, что акцент на стандартизированном тестировании побуждает учителей вооружать учащихся узким набором навыков, которые повышают эффективность тестирования, не способствуя на самом деле более глубокому пониманию предмета или ключевых принципов в предметной области.

Тестирование с высокими ставками

Оценки, которые вызвали наибольшие разногласия в США, - это использование выпускных экзаменов средней школы , которые используются для отказа в выдаче дипломов учащимся, которые посещали среднюю школу в течение четырех лет, но не могут продемонстрировать, что они усвоили необходимый материал при написании экзаменов. . Противники утверждают, что ни одному ученику, отработавшему четыре года места, не следует отказывать в аттестате о среднем образовании только из-за того, что он неоднократно не сдал экзамен, или даже за незнание необходимого материала.

Тесты с высокими ставками обвиняются в том, что они вызывают болезнь и тревогу при тестировании у учащихся и учителей, а также в том, что учителя решают сузить учебную программу до того, что, по мнению учителя, будет проверяться. В упражнении разработано , чтобы дети комфортно тестирование, в Спокан, Вашингтон газета опубликовала картину монстра , который питается страхом. Опубликованное изображение якобы является ответом ученицы, которую попросили нарисовать картину того, что она думает о государственной оценке.

Другие критики, такие как Дон Орлич из Университета штата Вашингтон , ставят под сомнение использование тестовых заданий, выходящих далеко за рамки стандартных когнитивных уровней для возраста учащихся.

По сравнению с оценкой портфолио, простые тесты с несколькими вариантами ответов намного дешевле, менее подвержены разногласиям между участниками и могут быть выставлены достаточно быстро, чтобы их можно было сдать до конца учебного года. По этим причинам в стандартизированных тестах (все учащиеся проходят один и тот же тест в одинаковых условиях) часто используются тесты с несколькими вариантами ответов. Орлич критикует использование дорогих, целостных тестов вместо недорогих «пузырьковых тестов» с множественным выбором для измерения качества как системы, так и отдельных лиц для очень большого числа студентов. Среди других известных критиков тестирования с высокими ставками - Fairtest и Алфи Кон .

Использование тестов IQ было запрещено в некоторых штатах для принятия образовательных решений, а тесты , основанные на нормах , которые ранжируют учащихся от «лучших» до «худших», подвергались критике за предвзятость по отношению к меньшинствам. Большинство должностных лиц системы образования поддерживают критерии критериев (оценка каждого отдельного учащегося зависит исключительно от того, правильно ли он ответил на вопросы, независимо от того, справились ли его соседи лучше или хуже) для принятия решений с высокими ставками.

Оценка 21 века

Широко отмечалось, что с появлением социальных сетей и технологий и мировоззрений Web 2.0 обучение становится все более совместным, а знания все чаще распределяются между многими членами обучающегося сообщества. Однако традиционные методы оценки сосредоточены в основном на отдельном человеке и не учитывают накопление знаний и обучение в контексте. По мере того как исследователи в области оценивания рассматривают культурные сдвиги, которые возникают в результате появления культуры большего участия , им необходимо будет найти новые методы применения оценок к учащимся.

Масштабная оценка обучения

Масштабные оценки обучения (LSLA) - это оценки на уровне системы, которые предоставляют моментальный снимок успеваемости для группы учащихся за данный год и в ограниченном количестве областей. Они часто классифицируются как национальные или межнациональные оценки и привлекают внимание к вопросам, связанным с уровнями обучения и детерминантами обучения, включая квалификацию учителя ; качество школьной среды; родительская поддержка и руководство; социальное и эмоциональное здоровье в школе и за ее пределами.

Оценка в демократической школе

Модель Садбери школы демократического образования не работает и не предлагает оценок, оценок, стенограмм или рекомендаций. Они утверждают, что не оценивают людей и что школа не является судьей; сравнение учащихся друг с другом или с некоторыми установленными стандартами является для них нарушением права учащегося на неприкосновенность частной жизни и самоопределение. Учащиеся сами решают, как измерить свой прогресс в качестве самостоятельных учеников, в процессе самооценки: по их словам, реальное обучение на протяжении всей жизни и надлежащая образовательная оценка для 21 века.

Согласно школам Садбери, эта политика не причиняет вреда их ученикам, поскольку они переходят к жизни вне школы. Однако они признают, что это усложняет процесс, но что такие трудности являются частью учащихся, которые учатся делать свой собственный путь, устанавливать свои собственные стандарты и достигать своих целей.

Политика отсутствия оценок и оценок помогает создать атмосферу, свободную от конкуренции между учащимися или борьбы за одобрение взрослых, и способствует созданию благоприятной атмосферы сотрудничества среди учащихся.

Заключительным этапом обучения в Садбери, если студент решит его пройти, является выпускная диссертация. Каждый ученик пишет о том, как он подготовился к взрослой жизни и вступил в сообщество в целом. Этот тезис передается в Собрание, которое его рассматривает. Заключительный этап процесса диссертации - это устная защита, которую дает студент, во время которой они открывают слово для вопросов, возражений и комментариев от всех членов Ассамблеи. В конце Ассамблея тайным голосованием выносит решение о присуждении диплома.

Оценка студентов ELL

Основной проблемой при использовании образовательных оценок является общая достоверность, точность и справедливость, когда речь идет об оценке изучающих английский язык (ELL). Большинство оценок в Соединенных Штатах имеют нормативные стандарты, основанные на англоязычной культуре, которая неадекватно отражает популяции ELL. Следовательно, во многих случаях было бы неточно и неуместно делать выводы из нормативных баллов студентов ELL. Исследования показывают, что большинство школ не модифицируют экзамены должным образом, чтобы приспособить учеников с уникальным культурным происхождением. Это привело к чрезмерному направлению студентов ELL на специальное образование, в результате чего они были непропорционально представлены в программах специального образования. Хотя некоторые могут рассматривать это несоответствующее размещение в системе специального образования как поддерживающее и полезное, исследования показали, что учащиеся, размещенные неправильно, фактически регрессировали в процессе обучения.

Часто бывает необходимо воспользоваться услугами переводчика, чтобы провести экзамен на родном языке учащегося ELL; однако при переводе заданий оценки возникает несколько проблем. Одна из проблем заключается в том, что переводы часто могут предлагать правильный или ожидаемый ответ, изменяя сложность экзаменационного задания. Кроме того, перевод заданий оценки иногда может исказить исходное значение задания. Наконец, многие переводчики не имеют квалификации или должной подготовки для работы со студентами ELL в условиях оценивания. Все эти факторы ставят под угрозу достоверность и справедливость оценок, делая результаты ненадежными. Невербальные оценки оказались менее дискриминирующими для учащихся ELL, однако некоторые по-прежнему содержат культурные предубеждения в тестовых заданиях.

При выборе студента ELL для получения специального образования группа оценки должна интегрировать и интерпретировать всю собранную информацию, чтобы обеспечить непредвзятый вывод. Решение должно основываться на многомерных источниках данных, включая интервью учителей и родителей, а также наблюдения в классе. Решения должны учитывать уникальные культурные, языковые и практические особенности учащихся и не должны строго основываться на результатах оценки.

Универсальный скрининг

Оценка может быть связана с неравенством, когда студенты из традиционно недопредставленных групп исключаются из тестирования, необходимого для доступа к определенным программам или возможностям, как в случае с программами для одаренных . Одним из способов борьбы с этим неравенством является универсальный скрининг, который включает тестирование всех учащихся (например, на одаренность) вместо тестирования только некоторых учащихся на основе рекомендаций учителей или родителей. Универсальный скрининг приводит к значительному увеличению числа традиционно недостаточно обслуживаемых групп (таких как темнокожие, латиноамериканцы, бедные, женщины и ELL), выбранных для одаренных программ, без какого-либо изменения стандартов идентификации.

Смотрите также

Источники

Определение логотипа бесплатных произведений культуры notext.svg Эта статья включает текст из бесплатного контента . Лицензировано CC BY-SA 3.0 IGO Текст взят из Обещание крупномасштабных оценок обучения: признание ограничений для раскрытия возможностей , ЮНЕСКО, ЮНЕСКО. ЮНЕСКО. Чтобы узнать, как добавить открытый текст лицензии в статьи Википедии, см. Эту страницу с инструкциями . Информацию о повторном использовании текста из Википедии см. В условиях использования .

использованная литература

дальнейшее чтение

  • Американская ассоциация исследований в области образования, Американская психологическая ассоциация и Национальный совет по измерениям в образовании. (2014). Стандарты педагогического и психологического тестирования. Вашингтон, округ Колумбия: Американская ассоциация исследований в области образования.
  • Беннетт, Рэнди Эллиот (март 2015 г.). «Меняющийся характер оценки образования». Обзор исследований в области образования . 39 (1): 370–407. DOI : 10.3102 / 0091732x14554179 . S2CID  145592665 .
  • Браун, GTL (2018). Оценка успеваемости студентов. Нью-Йорк: Рутледж.
  • Карлесс, Дэвид. Превосходство в оценке университетов: уроки отмеченной наградами практики . Лондон: Рутледж, 2015.
  • Клингер Д., МакДивитт П., Ховард Б., Роджерс Т., Муньос М. и Уайли К. (2015). Стандарты оценки в классе для учителей PreK-12: Объединенный комитет по стандартам оценки образования.
  • Кубишин, Т., и Борич, Г.Д. (2012). Образовательное тестирование и измерение: применение и практика в классе (10-е изд.). Нью-Йорк: Джон Вили и сыновья.
  • Миллер, Д.М., Линн, Р.Л., и Гронлунд, NE (2013). Измерение и оценка в обучении (11-е изд.). Бостон, Массачусетс: Пирсон.
  • Национальный исследовательский совет. (2001). Зная, что знают студенты: наука и дизайн образовательной оценки. Вашингтон, округ Колумбия: Национальная академия прессы.
  • Нитко, AJ (2001). Образовательная оценка студентов (3-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Меррилл.
  • Фелпс, Ричард П., изд. Исправление заблуждений об образовательном и психологическом тестировании . Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008 г.
  • Фелпс, Ричард П., Учебник по стандартизированному тестированию . Нью-Йорк: Питер Лэнг, 2007.
  • Рассел, М.К., и Айрасиан, П.В. (2012). Классная оценка: концепции и приложения (7-е изд.). Нью-Йорк: Макгроу Хилл.
  • Шепард, Лос-Анджелес (2006). Классная оценка. В RL Brennan (Ed.), Educational Measurement (4-е изд., Стр. 623-646). Вестпорт, Коннектикут: Praeger.