Два монолога о едином госэкзамене

М. Вербицкая, докт. филол. наук, А. Подлазов, канд. физ.-мат. наук. Материал подготовила Е. Вешняковская.

ЕГЭ — это воплощённое противоречие. С одной стороны, единый экзамен — это социальная справедливость в действии, с другой — «правила игры», то есть методики подсчёта его результатов то и дело меняются достаточно произвольным образом. С одной стороны, он спрямляет выпускникам дорогу в высшую школу, с другой — высшая школа при этом совсем не выглядит счастливой. С одной стороны, во всём мире уже накоплена могучая научная база в области педагогических измерений (тестологии). С другой — задания по ЕГЭ так и не сумели вписаться в рамки научной корректности и стать пригодными для применения тестологического научного аппарата, так что в наступившем году никаких математических моделей для интерпретации их результатов применяться уже не будет. С одной стороны, очевидно, что успешные ученики и ЕГЭ сдают успешно, с другой — педагоги «штучных», выдающихся школ, традиционно поставляющие абитуриентскую элиту в лучшие вузы, утверждают, что «там, где начинается подготовка к ЕГЭ, учёба заканчивается». Прокомментировать эти острые вопросы мы попросили специалистов: доктора филологических наук, профессора, заместителя декана факультета иностранных языков и регионоведения МГУ им. М. В. Ломоносова Марию Валерьевну Вербицкую, председателя федеральной комиссии разработчиков ЕГЭ по иностранным языкам, и кандидата физико-математических наук, старшего научного сотрудника отдела математического моделирования нелинейных процессов Института прикладной математики им. М. В. Келдыша РАН Андрея Викторовича Подлазова.

Мария Вербицкая: На ЕГЭ по английскому «натаскать» нельзя

Тех, кто говорит о деградации современного образования по сравнению с 1960—1970-ми годами, я бы спросила: какое образование нам нужно сейчас? Нужно ли нам, чтобы, как в те годы, высокообразованный печник или дворник сам себе декламировал стихи поэтов Серебряного века, подметая двор? Или всё-таки образование нужно человеку, чтобы как-то его применить далее?

У языка есть функционал. Знать язык — это слушать, читать, передавать, воспринимать и перерабатывать информацию. Информация, которой люди обмениваются с помощью языка, очень разная: когнитивная, эмотивная, оперативная; есть чистые факты, есть эмоции. «Ночевала тучка золотая...» — это не про географию, и компетентный пользователь языка обязательно сумеет отличить этот текст от прогноза погоды. Мы читаем Лермонтова с одной целью, а к электрическому чайнику — с другой.

ЕГЭ по иностранному, прежде всего по английскому языку, создан в русле мощной мировой традиции: по своей идеологии он стоит в одном ряду с такими известнейшими традиционными экзаменами по английскому, как американский TOEFL (Test Of English as a Foreign Language), английский Cambridge ESOL (English for Speakers of Other Languages) или всё более сегодня популярный IELTS (International English Language Testing System). Разумеется, российский экзамен не копирует их, и цели у него совершенно другие, но он использует всё, что наработано ими за десятилетия их существования, прежде всего коммуникативный, прагматический подход.

Что проверяет ЕГЭ по иностранному языку? Чтение (и слушание) с пониманием основной информации и запрашиваемой или необходимой информации. Проще говоря, надо понять, про что вообще говорится, устно или письменно, и суметь «выцепить» из потока информации нужное. Именно этому умению надо учиться и учить. Тогда у нас не будет случаев, когда человек знает много слов и хорошо делает грамматические упражнения, но не может зайти в англоязычный интернет и найти там нужные сведения. К сожалению, проверка устной речи из экзамена ушла по техническим причинам — её очень трудно организовать, но я надеюсь, что в 2013 году мы её восстановим. Поэтому я все свои встречи с учителями, семинары, выступления начинаю с того, что говорю: успех при сдаче ЕГЭ зависит, прежде всего, от того, насколько хорошо ученик умеет иностранным языком пользоваться.

Распространённой в некоторых кругах формулировки «там, где началась подготовка к ЕГЭ, учёба заканчивается» я не принимаю и не понимаю. Если у ученика на уроке не сформировано реальных языковых навыков, его невозможно «натаскать на ЕГЭ». Конечно, есть моменты, которые надо снова и снова разъяснять. Во-первых, хотя и министерство, и Рособрнадзор, и все руководящие органы федерального уровня повторяют, что нельзя судить о работе учителя по тому, как ученики сдают ЕГЭ, на уровне региональном, муниципальном такой подход по-прежнему имеет место. Это неправильно. За результаты ЕГЭ отвечает не только учитель. Я думаю, что пора отказаться от слогана советских времён «нет плохих учеников». Плохие ученики есть, есть ученики немотивированные. Но такие редко приходят сдавать иностранный язык, потому что это экзамен по выбору.

Кроме немотивированных учеников, у нас есть ещё одна беда. Школе и учителю, всю жизнь проработавшим в традиционном формате, не всегда легко перестроиться психологически. Многие учителя продолжают делать то, чему когда-то давно научились в рамках грамматико-переводного метода, применявшегося в советской школе. Конечно, учебниками, где преобладают грамматические упражнения, пользоваться легко и просто. Но ведь сколько грамматических упражнений ни сделай, от этого не заговоришь сам и не научишься понимать других.

К сожалению, сейчас под флагом подготовки к ЕГЭ многие учителя и даже репетиторы стали делать то, что иначе, чем разбазариванием времени, я не могу назвать. Школьнику дают сборник тестов, и он полтора часа сидит и их делает. Какая же это учёба? Тест ученик должен выполнить дома, с контролем времени, отметить, что было трудно, что легко. А на уроке не имеет права учитель в молчании сидеть, пока он, бедный, ковыряется с заданиями! На уроке надо разбирать, обсуждать, слушать аудиозапись, определять ключевые слова, подбирать синонимы… Если этого не делать, то появляется миф, что можно либо учить языку, либо «натаскивать к ЕГЭ». Когда сейчас учителя жалуются, что им не хватает КИМов (контрольно-измерительные материалы — задания, аналогичные экзаменационным), хочется спросить: а когда вы успеваете их делать, если на уроках учите языку? И всё же в целом мы переломили эту тенденцию. Всё-таки теперь учителя понимают, что СD или кассета в учебник вкладываются не для красоты и не для того, чтобы взять больше денег с бедных родителей, а для работы на уроке.

На ЕГЭ по английскому языку можно получить максимум 100 баллов. К сожалению, на эту цифру — 100 — завязано много психологических барьеров. Сплошь и рядом директор допрашивает преподавателя английского, почему у него мало стобалльников или почему никто не получил больше 80 или 75? На самом деле если ученики общеобразовательной школы сдают ЕГЭ по английскому на 70—75 баллов, то их учителю надо премию давать и памятник ставить. Он взял самую высокую планку, которая предназначена для «непрофильных» выпускников — тех, кто учится по программе базового уровня с двумя-тремя часами английского в неделю в «обычной» школе. Хочешь сдать на 80 и выше, собираешься идти в профильный вуз, — занимайся. Репетитор — не единственный путь. Можно перейти в профильный класс, где другая программа. Есть языковые курсы, есть учебные сайты, работай самостоятельно с литературой, вот наши книжки, они недорогие, и в них абсолютно всё есть: и задания, и инструкции, как их надо выполнять. Читай, тренируйся, учись.

Кто хочет овладеть языком, им овладеет. У нас на факультете иностранных языков и регионоведения МГУ им. М. В. Ломоносова каждый год бывают абитуриенты, которые неизвестно откуда такие прекрасные взялись: приезжают из посёлка, деревни, маленького городка и отлично говорят по-английски. Мы их называем «наши Ломоносовы», холим и лелеем и, конечно, спрашиваем: «Как ты смог так выучить язык?» Кто-то ответит: «У меня был очень хороший учитель», а кто-то: «Я слушал Би-би-си и читал Стейнбека». Какое натаскивание может это заменить?

ЕГЭ упрекают в том, что он не «измеряет» творческий потенциал. Но он и не должен. Когда я, профессор, задаю студенту вопрос, на который сама не знаю ответа, я ожидаю от него импровизации, полёта ума, чего-то необычайного. Но от выпускника школы нам, прежде всего, нужны знания, а не полёт фантазии. Право творить надо заработать. Студент, который ничего не знает, натворит нам такого, что никто не обрадуется. Мне кажется, если бы мы это поняли, то у нас бы меньше падали самолёты и тонули корабли. Беда наша в том, что мы очень не любим инструкции и правила; мы считаем, что во всём разбираемся лучше, чем тот, кто эти правила писал. Сколько раз я слышала от студентов: «Смешные американцы, всё делают по инструкции». Но сами студенты при этом хотят жить в таких же домах и ездить на таких же машинах, как американцы. Может быть, уважаемые, вы тогда задумаетесь: а как у них получаются такие дома и машины? Не надо бояться, что ЕГЭ, с его следованием инструкции, оглупляет нацию. Творческих людей в любой нации 10—15% — они всё равно родятся и пробьются. Для них есть олимпиады, открывающие простор творческой мысли. А вот действовать по инструкции — этому надо учиться. Ты экзамен не сдашь, если ты не прочитал задание, потому что правильно понять задание — это 50% успеха. Прочитать , понять её и выполнить — это важнейший жизненный навык, его нужно формировать и развивать. И ЕГЭ проверяет и его тоже. Часто на апелляции родители говорят: «Ребёнок правильно всё сделал, просто не в те клеточки написал ответ!» Помилуйте, как же он будет учиться в вузе, если после всех тренировок, уже получив и изучив все материалы, по-прежнему не может записать ответ в нужную клеточку? Это ведь тоже своего рода функциональная грамотность.

Меня порадовали итоги 2011 года, когда русский сдали в целом лучше, чем иностранный, потому что два предыдущих года средний балл ЕГЭ по иностранному языку держался выше, чем по русскому. Но иностранному у нас в школах всё-таки учат лучше: больше внимания уделяется рассуждению, аргументированию. Конечно, высокий балл по иностранному объяснялся ещё и тем, что его сдают по выбору, в то время как русский обязателен, но это мало кто понимал, и начали появляться статьи: «Какой ужас, наши дети знают английский язык лучше, чем родной!» А с другой стороны — что такого? Я бы радовалась, что хоть какой-то знают.

Скажу больше, я бы и в экзамен по русскому языку тоже включала аудирование, хотя бы для тех, кто собирается поступать в вузы. Если студент не может извлечь информацию из сказанного на родном языке, не может отделить главную мысль от второстепенной, сделать обобщения и выводы, провести грань между мнением и фактом, — как он сможет учиться?

С иностранными языками ситуация складывается лучше, потому что ещё в 2004 году были приняты хорошие современные стандарты для начальной и основной школы, по которым мы живём. В наибольшей мере стандарты соблюдаются в обучении английскому языку, потому что к нему традиционно больше внимания. Так что «иностранцы» с их коммуникативным подходом к обучению языкам дорабатывают многое из того, что не доделывают русисты. Мы ставим задачи по языку так, что для их решения нужен определённый уровень когнитивного развития, общеучебные умения. Например, чтобы справиться с «особо трудным» заданием С-2 (письменное развёрнутое высказывание с элементами рассуждения), надо уметь рассуждать. Если мы недостаточно учим этому на всех остальных предметах, выпускнику, конечно, трудно. Мы, обучая иностранному языку, стараемся учить школьников рассуждать, но давайте же и все вместе к этому стремиться.

Андрей Подлазов: Измерительный прибор должен сравнивать сравнимое

Когда мы имеем дело с измерительным прибором, главный вопрос — что им можно измерять? Когда вводили ЕГЭ, этим вопросом никто не задавался. Единому экзамену директивно велели измерять одновременно остаточные знания выпускника, потенциал абитуриента, положение дел в системе образования на уровне школы, региона и страны, динамику образования, качество работы учителя и так далее.

Понятно, что такого не бывает. Любой универсальный прибор хуже специализированного, а если универсальный прибор должен делать сразу очень многое, он, скорее всего, не будет работать вовсе.

Измерения в образовании — предмет особой науки — тестологии, лежащей на границе между науками о человеке и математикой. В основе таких измерений лежит некая интеллектуальная модель того, что мы собираемся проверять и как. Она нестрогая, как это часто бывает с моделями в социально-экономических областях, но если, после всех необходимых ограничений, оказывается, что для конкретной задачи она работает, мы её принимаем. Затем начинается чистая математика: как с этим модельным инструментарием следует обращаться. Математическая корректность процедур, с помощью которых мы обрабатываем результаты измерений (шкалируем, пересчитываем в другие баллы), гарантирует, что, применив модель, можно получить более или менее корректный результат.

Зачем нужен письменному экзамену этот пересчёт?

Прежде всего, для компенсации различий в сложности разных вариантов. Как бы мы ни старались, но все варианты одного и того же задания, если только это не простейший арифметический пример, так или иначе различны по сложности. Поэтому результаты теста: сколько заданий сумел сделать испытуемый и в какой степени — подвергаются шкалированию: первичные баллы математическими методами пересчитываются в тестовые, чтобы скорректировать разницу в сложности между вариантами. Существуют разные методики такого пересчёта, например, вначале для пересчёта результатов ЕГЭ применялась так называемая partial credit model — одно из расширений ставшей уже классической модели Георга Раша — датского математика, заложившего основы педагогических измерений. Но важно понимать, что универсального метода шкалирования не существует, любая модель, лежащая в основе шкалы пересчёта, капризна, у неё есть ограничения, связанные с характером самих заданий, и то, что корректно работает на заданиях одного определённого типа, совершенно неприменимо к другим.

Так, модель Раша работает только на гомогенных (однородных) тестах: таких, которые проверяют знания из некоторого неделимого блока. Например, тест на знание дорожных знаков или проверка умения вести машину по отдельности гомогенны, но тест, проверяющий одновременно то и другое, гомогенным уже не будет (ведь можно знать знаки и при этом не уметь водить). Шкалируя его результаты по методу Раша, мы получим искажённую, не соответствующую реальности картину.

В модели Раша отношение вероятностей дать правильный и неправильный ответы на задание равно отношению знаний испытуемого к сложности этого задания. Таким образом, задания с выбором правильного ответа из нескольких (часть A) не удовлетворяют исходным посылкам модели, так как угадать правильный ответ можно и при нулевых знаниях.

Модель Раша изначально применима только к заданиям с дихотомическим исходом (верно или неверно). Попытка расширить её на задания с политомическим исходом (разыгрывается несколько баллов) в рамках partial credit model приводит к множеству сложностей. Во-первых, эта модель внутренне противоречива при наличии в тесте заданий, оцениваемых из разного количества баллов; во-вторых, она в принципе не позволяет содержательно интерпретировать входящие в её формулы величины и, в-третьих, она требует, чтобы выполнение этапов задания было осуществимо только в одной определённой последовательности.

Совершенно очевидно, что пользоваться на практике этой моделью вообще невозможно, а именно это и происходило с ЕГЭ в течение ряда лет, систематически искажая его результаты и снижая доверие к нему экспертов, понимающих, «откуда берутся баллы».

Поскольку смысл шкалирования состоит в том, чтобы уравнять разные по сложности варианты, то для каждого варианта ЕГЭ шкала пересчёта должна быть своя. Однако это может приводить к балльным инверсиям — ситуациям, когда один испытуемый набирает на более сложном варианте меньше первичных баллов, чем другой на более простом, но после пересчёта тестовый балл у первого выше. Балльные инверсии представляли собой огромную психологическую проблему, поскольку организаторы ЕГЭ, сами не понимая используемого ими математического аппарата, были не в состоянии объяснить его особенности общественности.

Поэтому в методику пересчёта баллов, со всеми её уже имеющимися проблемами, внесли дополнительный этап, никакой теорией не предусмотренный. Сначала все получившиеся для разных вариантов шкалы усредняли, а потом пересчитывали все варианты по этой усреднённой шкале. При этом разница заданий по сложности уже никак не корректировалась, и смысл пересчёта утратился.

Наконец, в текущем году систему поменяли радикально: математический аппарат, с которым не справились, попросту выкинули. Математическими методами баллы в этом году пересчитывать не будут. Шкала пересчёта для каждого предмета утверждается директивно. Встаёт вопрос: а зачем тогда вообще пересчитывать первичные баллы в тестовые? И нужен ли в принципе единому экзамену пересчёт баллов?

Для выпускного экзамена — явно не нужен. Здесь можно пользоваться открытым банком заданий, сложность которых заранее определяется в ходе контрольных работ, пробных экзаменов и экзаменов прошлых лет, что обеспечивает равную сложность вариантов. Поэтому баллы могут быть определены сразу: первичные, они же — тестовые. Смысл итоговой аттестации — в сравнении достижений выпускника с некоторым стандартом, неизменным год от года. Какой процент от него испытуемый успешно освоил, таков его балл по стобалльной шкале.

Для вступительного экзамена ситуация существенно иная. Здесь важно сравнивать абитуриентов друг с другом. А стандарта, позволяющего подготовить равносложные варианты, нет, поэтому пересчёт необходим. Идеальный механизм такого пересчёта — рейтинг-балл, когда тестовым баллом испытуемого будет процент его конкурентов, выполнявших тот же самый вариант и набравших первичный балл не выше, чем он.

Такое шкалирование помимо простоты и ясности имеет ряд дополнительных преимуществ.

Во-первых, предъявление каждого варианта экзаменационного задания в рамках ограниченной территории позволит сравнивать между собой абитуриентов, находящихся в сопоставимых условиях. А нынешний вариант ЕГЭ предполагает странное соревнование между столицей и провинцией, между городом и деревней, между регионами с высоким и низким уровнями коррупции.

Второе преимущество — понятный и одинаковый для всех предметов смысл балла, что позволило бы складывать результаты разных экзаменов во вступительный балл. Сейчас же его величина лишена смысла.

Наконец, в-третьих, автоматически обеспечивается равномерность распределения абитуриентов по тестовому баллу, которая даёт одинаково низкую погрешность оценки и одинаково высокую дифференцирующую способность экзамена на всём диапазоне результатов. Процедура пересчёта, которая применяется для обработки результатов ЕГЭ, лишь удаляет распределение от равномерного. Вследствие этого в области самых высоких и низких результатов (то есть там, где идёт самое жёсткое соревнование) максимально увеличивается цена каждого набранного или потерянного первичного балла, а в области промежуточных результатов (то есть там, где и без того сосредоточена основная масса испытуемых) растёт их «скученность».

На точности экзамена следует остановиться особо. Измерений без погрешностей не бывает. Результаты, отличающиеся между собой на величину, меньшую погрешности измерения, следует считать неразличимыми. Покрыв весь диапазон баллов отрезками, внутри которых результаты уже неразличимы, мы получим набор различимых градаций оценки. Их число увеличивается лишь как квадратный корень из числа разыгрываемых баллов и потому невелико. Так, для ЕГЭ по разным предметам имеется всего пять—восемь различимых градаций оценки. На первый взгляд это более тонкая калибровка измерения, чем те четыре различимые градации оценки, которые давал традиционный вступительный экзамен. Но он оценивал только контингент, ориентированный на конкретный вуз, а не всех выпускников. Полный диапазон знаний весьма широк, но в конкурсе реально участвует в 2—3 раза более узкий его участок, что снижает количество удовлетворительных градаций оценки до двух-трёх, то есть калибровка оценки в этой части диапазона оказывается не тоньше, а грубее, чем у традиционного экзамена.

И здесь мы подходим к главному, принципиальному недостатку ЕГЭ как измерительного прибора: он пытается мерить слишком широкий диапазон и за такой охват неизбежно платит потерями в точности.

Если бы к испытуемым в разных диапазонах предъявляли разные требования: одни — к выпускникам, другие — к абитуриентам регионального вуза, третьи — к поступающим в один из ведущих вузов страны, мы могли бы обмерить каждый массив небольшим числом задач с очень высокой точностью (что и делал традиционный экзамен). Но если за один проход нужно обмерить абсолютно всех, то ограниченное число различимых градаций приходится растягивать на очень широкий диапазон. Теряется точность, причём теряется как раз на том конце шкалы, где она нужнее всего: где лучшие абитуриенты должны конкурировать за места в лучших вузах.

Простым увеличением количества заданий эту проблему не решить. Как уже было сказано, количество градаций — это квадратный корень из числа заданий, поэтому, чтобы увеличить точность вдвое, нужно в четыре раза больше заданий, а чтобы втрое — в девять раз больше заданий. Но экзамен физически невозможно растягивать бесконечно. Более того, реально разыгрываемое число баллов, а значит, и точность экзамена дополнительно снижаются из-за заданий с выбором ответа — за них часть баллов можно получить путём угадывания, и из-за того, что задания с политомическим исходом можно решить разными способами, а проверка ЕГЭ по математике не способна этого учесть, выпускник, решивший задание другим способом, не получит за это баллов.

Представьте, что выпускники приезжают поступать из какого-нибудь региона поголовных «стобалльников», где высокие результаты им купили, и конкурируют с массивом выпускников, которые сдавали ЕГЭ честно. Будет ли у вторых шанс занять места, соответствующие их реальной подготовке? А если считать рейтинг-балл внутри каждого региона отдельно, то Дагестан будет соревноваться с Дагестаном, Чечня с Чечнёй, москвичи с москвичами, а воронежцы с воронежцами, и мы скорректируем долю в их результатах не только социально-экономических различий между регионами, но и разницы в региональных уровнях коррупции. Пусть этот метод не поставит абсолютного заслона фиктивным «победителям», но он оставит шанс — настоящим. И пусть на студенческой скамье окажутся первокурсники с разным уровнем подготовки, это не очень страшно, потому что качество ученика как абитуриента определяется не столько тем, что он знает, сколько тем, как хорошо и как быстро он способен знания набирать.

Казалось бы, за специализацию массивов заданий на «выпускной» и «вступительный» отвечает деление ЕГЭ на части А и В — «для всех» и часть С — «олимпиадную». Но ни одна из этих частей не работает полноценно: необходимый минимальный балл по математике может набрать даже семиклассник, есть возможность получить его, вообще не зная материал, который проходят в старших классах, потому что в один экзамен не помещаются и сложные и простые задания на весь спектр тем. Тому же, кто пишет вузовскую часть С, надо сначала долго и утомительно расставлять крестики и заполнять клеточки, а заняться тонкой работой он может лишь после того, как проделал много грубой. Это выматывает: не каждый абитуриент обладает способностями и подготовкой биатлониста, который может сначала долго бегать, а потом без перерыва — успешно отстреляться по мишеням.

В защиту ЕГЭ часто приводят тот довод, что недостатки есть у любой модели, а этот механизм, как бы там ни было, работает, осваивается и худо-бедно, но спрямляет выпускнику дорогу в вуз, что особенно важно сегодня, когда студент институту стал нужнее, чем институт студенту. Но не надо забывать, что качество сегодняшнего абитуриента определяет качество высшей школы на десятилетия вперёд. Высшей школе, конечно, нужно выпускать сотни инженеров и экономистов для решения повседневных задач, но ей также нужно выпускать и специалистов высочайшего уровня, которые будут определять лицо отечественной науки. Без таких не сможет существовать сама система.

Другая беда, что Россия в её нынешнем состоянии не может воспользоваться достижениями специалистов такого уровня. Нет инфраструктуры, нет научной среды, нет производства, которое способно подхватить идею и довести до коммерческого воплощения. Там, где пытаются что-то производить, уже увидели провал на уровне от рабочего до инженера. Но на шкале от инженера до академика тоже уже пусто. И если систему, готовящую квалифицированные кадры для производства, можно восстановить за 10—12 лет, то в системе высшей школы понадобится лет 20—50, смена поколений. В советское время была популярна поговорка о том, что «интеллигентного человека делают три диплома: собственный, отца и деда». Квалифицированный специалист высшей школы — это тоже, в общем, третье поколение, только не биологическое, а научное. Качество учёного складывается из его собственной квалификации, квалификации его учителя и того, кто его учителя учил. Падение качества абитуриентов высшей школы и некорректные процедуры их профессионального распределения чреваты тяжёлыми отложенными последствиями.

Тех, кто говорит о деградации современного образования по сравнению с 1960—1970-ми годами, я бы спросила: какое образование нам нужно сейчас? Нужно ли нам, чтобы, как в те годы, высокообразованный печник или дворник сам себе декламировал стихи поэтов Серебряного века, подметая двор? Или всё-таки образование нужно человеку, чтобы как-то его применить далее?..

Другие статьи из рубрики «Проблемы образования»

Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее