История тестов. XX век

Первые тесты для объективного контроля знаний, умений и навыков появились в начале XX века. Они быстро завоевали популярность среди преподавателей вузов и школ в Англии и США, а позже в России и СССР. Примерно с этого времени их стали в США называть педагогическими. Именно эти тесты вызывали настороженное к себе отношение у сторонников традиционной, «чистой», без тестов, педагогической науки и практики. Такая же настороженность проявлялась и по отношению к педологии, широко опиравшейся на тесты. Появление в это время нового прикладного направления, педологии, не было исторической случайностью. Это было неизбежно, как появление других прикладных наук. Хотя педология претендовала на статус фундаментальной науки о комплексном развитии ребенка она, если судить по ее методам и результатам, была все-таки прикладной педагогикой, необходимо дополнявшей тогдашнюю отечественную педагогику в ее самом слабом месте — в связи науки с практикой образования и обучения. Однако вместо сотрудничества педагогики и педологии началось политическое избиение последней, окончившееся не научной, а политической же «победой» сторонников «чистой» педагогики.
Первые тесты для объективного контроля знаний, умений и навыков появились в начале XX века. Они быстро завоевали популярность среди преподавателей вузов и школ в Англии и США, а позже в России и СССР. Примерно с этого времени их стали в США называть педагогическими. Именно эти тесты вызывали настороженное к себе отношение у сторонников традиционной, «чистой», без тестов, педагогической науки и практики. Такая же настороженность проявлялась и по отношению к педологии, широко опиравшейся на тесты. Появление в это время нового прикладного направления, педологии, не было исторической случайностью. Это было неизбежно, как появление других прикладных наук. Хотя педология претендовала на статус фундаментальной науки о комплексном развитии ребенка она, если судить по ее методам и результатам, была все-таки прикладной педагогикой, необходимо дополнявшей тогдашнюю отечественную педагогику в ее самом слабом месте — в связи науки с практикой образования и обучения. Однако вместо сотрудничества педагогики и педологии началось политическое избиение последней, окончившееся не научной, а политической же «победой» сторонников «чистой» педагогики.

На волне революционных преобразований «победили» сторонники изгнания из школы тестов, любого контроля знаний и, вместе с этим, педологии. Педология стала первой в списке наук, которые позже назовут репрессированными (Петровский А.В. Запрет на коллективное исследование детства // Репрессированная наука / Под общ. ред. М.Г. Ярошевского. Л.: Наука, 1991. 559 с.).

В те годы были, однако, и другие выступления — в пользу тестов. Так, известный психолог М.Я.Басов говорил: «Я думаю все же, что эта долгая, подчас острая критика тестовой методики … в конце концов приведет не к ниспровержению, не к упразднению этой методики, а напротив, к ее упрочнению и к ее утверждению в определенных границах, в которых она, очевидно, имеет полное право на применение и существование» (Басов М.Я. Тесты: теория и практика. N 1. М.: Работник просвещения, 1928. 79 с.). Поскольку в то время тесты получили признание и развитие только в рамках прикладных направлений — педологии и психотехники, размежевание этих направлений с педагогикой и психологией проходило, в первую очередь, по отношению к тестам. Помимо этого, обе стороны вели затяжные дискуссии со взаимными обвинениями. Педагогика и психология обвинялись в схоластике, узком академизме, в неспособности воспринять новое и в отрыве от практики. Прикладники, в свою очередь, осуждались за узкий практицизм, противоречащий духу науки, за отрыв от педагогики, психологии; они обвинялись также в голом эмпиризме, подражании западным образцам и в чрезмерном увлечении тестами.

Разрыв между фундаментальным и прикладным направлениями был до недавнего времени характерен для многих других наук, но не везде он протекал столь болезненно, как в педагогике. Для представителей «чистой науки» прикладность не имела заметной ценности. В 30-х годах ученые Кембриджа, как вспоминает Ч. Сноу, больше всего гордились тем, что их научная деятельность ни при каких мыслимых обстоятельствах не может иметь практического смысла (Сноу Ч.П. Две культуры. Пер. с англ. М.: Прогресс, 1973. 143 с.). Методы и результаты педологии лежали в сфере прикладной деятельности, в то время как усилия традиционной педагогики были направлены на создание общей теории. Эти же годы характеризуются широким использованием тестов в других странах. Во Франции они стали применяться для дефектологических целей и для профориентации, в США тесты использовались при приеме на работу, в вузы, для оценки знаний школьников и студентов, для проведения социально — психологических исследований. Была сделана первая попытка объективно сравнить знания студентов различных колледжей штата Пенсильвания. Но и критика не успокаивалась. Она начинала приобретать все более широкий размах и выходить за рамки чисто научных дискуссий.

В СССР практика тестирования этого периода характеризовалась серьезными противоречиями: по мере роста числа тестов и тестовых исследований имели место попытки торможения и даже запрета. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, с порога. В 1936 году было принято Постановление Совета Народных Комиссаров под многозначительным названием «О педологических извращениях в системе Наркомпроссов». Что на долгое время помешало попыткам разработки и применения тестовых методов в сфере образования, профотбора и профориентации. Хотя в тридцатых годах практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в нашей стране полностью не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний; и наоборот, различные испытания нередко назывались тестами. Официально запрет на применение тестов так и не был отменен. Его отменила сама жизнь.

В США против использования тестов выступали представители основных групп населения — взрослые и дети, белые и негры, рабочие и управленческий персонал, а также представители национальных меньшинств. Исследования по социальным последствиям тестирования выяснили, что 37% опрошенных возражали против использования тестов при поступлении на работу, 50% — при продвижении по службе, 25% — против использования тестов в школе. Случаи нарушения этики в использовании тестов оказались столь злободневными, что ими вынужден был заняться конгресс, устроивший специальные слушания по этому делу. В результате было принято решение, осуждающее неэтичное использование тестов. В августе 1966 г. в сенате США обсуждалось предложение о полном запрещении тестов, но это предложение не было поддержано большинством.

В зарубежной литературе выделяется несколько источников критики тестов. Первый источник O. Brim усматривает в личностном портрете критиков. В числе последних чаще других оказываются те, кто не склонен к интроспекции, авторитарен в межличностных отношениях, нетерпим к мнению других и возражает против всяких социальных перемен. Как правило, в США эти лица примыкают, как он считает, к правым политическим группам, требующим запрещения тестов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на передовые позиции выдвигаются наиболее талантливые люди. В таком обществе каждый имеет возможность внести свой вклад в соответствии со своими способностями. Последние должны быть оценены, и потому ориентация на этот принцип создает благоприятное отношение к тестам. Третий источник, по мнению R.B. Cattel, является следствием эмоционального и сентиментального отношения людей эстетического и нарцисстического типа ко всякой попытке представить «уникальную, художественную личность», как он пишет, в виде формул и т.п.

В США критика тестов не прекращалась никогда, так же, как работа над их усовершенствованием и применением. По имеющимся данным, в этой стране большинству населения (90%) по меньшей мере один раз в жизни приходится тестироваться. Каждый год знания и способности учащихся проверяются там с помощью 47 миллионов тестовых бланков, выпускаемых примерно 400 тестовыми компаниями. Среди последних имеются как мелкие, так и крупные, причем самая крупная — это ETS ( Educational Testing Service). Ежегодной проверкой интеллектуальных способностей и знаний подвергаются практически все студенты высших и учащиеся средних учебных заведений. От результатов этих проверок зависит как престиж вуза, так и количество денег, отпускаемых заинтересованными фирмами на подготовку специалистов в том или ином вузе. Каждый вуз старается привлечь к себе тех абитуриентов, у кого тестовые показатели оказались сравнительно выше. Приводятся цифры: в течение 1977-1978 гг. тестовый контроль прошли 1.488.300 студентов.

Практика, как это часто бывает, опережала теорию. Массовые тестовые обследования не подкреплялись серьезной проверкой качества инструментария, решения о переводе некоторых учащихся в классы для умственно отсталых детей принимались на основе несовершенных тестов, без учета других факторов, влияющих на результат проверки. В промышленности на основе таких же тестов делались попытки классификации работников по различным профессиям, без внимательного учета личных склонностей и интересов.

В условиях авторитарно управляемого общества любой случай неправильной практики применения тестов легко идентифицировался с ошибочностью самого тестового метода. Положительные примеры их применения во внимание не принимались. Подобная ситуация имела место в период между 1931 и 1938 годами и затем повторялась (не в столь тяжелой форме) и в последующие периоды.

Тесты применялись в двух основных сферах: в образовании и в сфере профотбора-профориентации. Затронутые тестами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений в пользу и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его неправильного использования, породили во многих странах, в том числе и в СССР, письма в правительственные органы и в газеты с требованием запрета тестов.

Застой в разработке тестов и их применении продолжался около сорока лет — с середины 30-х до конца 70-х годов, после чего вновь стали появляться публикации по этой проблеме, направленные как в пользу тестов, так и против них. Типичные аргументы оппонентов тестового метода сводились, в обобщенном виде, к следующим утверждениям:

— тесты используются в капиталистических странах, где с их помощью решаются вопросы расовой и классовой дифференциации;
— применение тестов унижает достоинство личности, особенно в случаях, когда получаемые баллы оказываются ниже среднего уровня;
— никакие методы измерения не могут заменить преподавателя и его личный опыт;
— в педагогике нет и не может быть точной единицы измерения, и потому не следует терять время, силы и средства на разработку неточных методов.

В этих утверждениях много спорного, и даже ошибочного. Что касается применения тестов для целей расовой и классовой дифференциации, то вряд ли здесь надо винить тесты. Как всякое средство, они могут быть использованы в пользу или во вред, в зависимости от идеологии, политики, компетенции, целевых установок и т.п. О возможном унижении достоинства личности, наклеивании ярлыков и т.п. можно сказать, что для предотвращения неприятных последствий такого рода, если это вообще возможно при культурной работе, разработаны специальные правила обращения с тестами и испытуемыми. В этих правилах все возникающие вопросы этического характера предусмотрено решать в пользу личности. Соблюдение этических норм является непременной частью профессиональной подготовки тех, кто работает с тестами. тест онлайн бесплатно не призваны заменять преподавателя и его личный опыт, а наоборот, призваны помогать ему, освободив его от рутинной работы и дать, тем самым, ему возможность сосредоточиться на повышении качества преподавания. Во-вторых, хотя точность педагогических измерений и не может сравниться с точностью физических измерений, преимущества первых, тем не менее, достаточно очевидны, они описаны повсеместно.

В тридцатые годы в СССР началось построение социализма сталинского толка. «Мы хотим, — говорил «отец всех народов», — сделать всех рабочих и всех крестьян культурными и образованными». И ему удалось создать сильное государство, эффективную систему образования, придушить коррупцию и закрыть наглухо каналы широкомасштабного воровства, то, что не может пока сделать власть нынешняя. Успеху способствовала эгалитаристская модель организации общества, основанная на требованиях передела частной собственности в пользу всех граждан, признания равных прав и равных возможностей в получении образования.

В соответствии с этой моделью стране в те годы навязывались суждения уравнительного характера: о возможности каждым человеком овладеть любой профессией, о равенстве способностей и одинаковой обучаемости, о равенстве в получении различных благ. В песнях пели: «Нам все пути открыты». Делались реальные попытки обеспечить все население посильной медицинской помощью, приемлемым уровнем зарплаты и т.п. Но при этом для укрепления властных структур вводились и различные льготы. Постепенно возрастал и уровень всеобщего обязательного образования, с 7 до 10 классов средней школы, т.е., решалась задача народного образования. Под влиянием эгалитаристских установок в педагогической среде актуализировалось множество расхожих афоризмов типа «незаменимых людей нет», «нет плохих учеников, есть плохие учителя», «не высовываться» и т.п. В стране, устроенной по эгалитарному принципу, люди рассматривались как взаимозаменяемые «винтики» общественной машины, управляемой Вождем. С начала тридцатых годов созрела идея тотального контроля, в рамках которой в системе образования вновь начала использоваться экзамены.

В середине тридцатых годов обнаружилась неадекватность системы оценки знаний задачам, поставленным партией перед советской школой. В Постановлении Совета народных Комиссаров и ЦК ВКП(б) от 3 сентября 1935 г. утверждалось, что «установленная наркомпроссами система оценки успеваемости не дает представления о фактических знаниях учащихся и ведет, на практике, к понижению уровня учебы». Там же поручалось отделу ЦК ВКП(б) «разработать, обязательно для всех школ СССР, нормы оценки успеваемости учащихся, с тем, чтобы один и тот же уровень знаний одинаково оценивался во всех школах». Ввиду неспособности учебного отдела ЦК партии решить эту методическую задачу, поручение так и осталось невыполненным. Не решили её и все последующие поколения руководящих деятелей союзного и российского образования.

Надвигалась вторая мировая война, для победы в которой требовались миллионы технически подготовленных специалистов. По всей стране открывались новые учебные и научно-исследовательские институты, военные училища. Промышленность постепенно переводилась на военные рельсы. Для отбора курсантов в летные училища создавались медицинские комиссии, которые и должны были заниматься вопросами если не подобия профессионального отбора, то хотя бы отбраковкой тех, кто не годился для исполнения летной работы по показателям здоровья. Тестов как системы заданий возрастающей трудности в этих комиссиях еще не было. В основном там использовались различные пробы, измерения уровня давления крови, пульса, проверялись способности различать цвета, реакция на звук, нервная проводимость, устойчивость к головокружению. Посредством контрольных нормативов проверялась и физическая подготовленность.

В то время как в нашей стране обсуждался вопрос — быть тестам или не быть — в США ставились другие вопросы — как повысить качество тестов, как сделать результаты тестирования независимыми от группы испытуемых и от того или иного набора заданий? К началу второй мировой войны там уже был накоплен большой опыт разработки тестов. Война дала сильный толчок авиастроению. Соответственно, понадобились сотни тысяч пилотов, штурманов, механиков, стрелков-радистов, специалистов по наладке навигационного оборудования. Каждая из перечисленных профессий требовала наличия определенных способностей — интеллектуальных, физических, психомоторных, и все эти способности надо было быстро и эффективно оценить.

Для участия в этой работе были мобилизованы ученые, занимавшиеся вопросами измерения в психологии и в социологии. По начальному образованию это были, в основном, математики, занимавшиеся вопросами соответствующих психологических или социологических измерений. С началом войны почти все кадры так называемых психометриков были направлены в специально созданную воинскую часть на авиабазе Рандольфильд, для проведения там, на основе многостороннего тестирования, профессионального отбора и классификации готовящегося по всей стране персонала из числа летчиков, штурманов, мотористов и т. д. Поскольку война диктовала короткие сроки проведения исследования, а тестов не хватало, вся работа по профотбору, созданию и по проверке качества тестов велась параллельно. Например, из 550000 тысяч человек, подвергнутых тестовому контролю в одном, 1942 году, примерно только половина была допущена к обучению отмеченным профессиям.

Между тем, общественность продолжала высказывать сомнения в качестве используемых тестов. Поэтому было решено провести эксперимент. Хотя в рядах самих экспериментаторов не было единодушия, поскольку предстояло проверить эффективность их собственной работы. Среди аргументов, выдвигавшихся против эксперимента, были: нужен ли он в трудное военное время; а вдруг вскроются недостатки тестов, кажущихся сейчас вполне работоспособными, а главное, уже утвержденных руководством…» (US Army Air Forces Aviation Psychology Program // The Aviation Psychology Program in the Army Air Force. Ed by J.C. Flanagan. Washington: Goverment Printing Office, 1947. V.1. P.79.).

Экспериментальная группа состояла из 1143 человек, отобранном в случайном порядке из числа лиц, прошедших тестирование по полной программе и зачисленных на курсы подготовки военных летчиков, независимо от показанных ими результатов в тестировании. Контрольную группу составили свыше 230000 человек, допущенных к обучению в 1943 году в зависимости от полученных ими тестовых баллов. Результаты сравнения оказались следующими: в экспериментальной группе только 23 процента смогли закончить курс обучения, в то время как среди отобранных с помощью тестов процент успешно окончивших летные школы оказался более 60% (McFarland, R.A. Human Factors in Air Transportation. N.Y. McGraw-Hill, 1953. P. 43.). Различия, как говорят статистики, оказались весьма достоверными. Поскольку обучение военного летчика стоит дороже подготовки профессора, а отчисление неудачников проводилось, как правило, не ранее того, как курсанты проходили примерно третью часть срока подготовки, нетрудно было представить себе масштабы экономии средств за счет использования тестов. Один из активных участников процесса отбора военных специалистов посчитал, на каждый доллар, затраченный на эту программу, бюджет сэкономил тысячу долларов (Guilford, J.P. Is Personnel Testing Worth the Money? Gen. Mgmt. Ser. 1950. № 176. P. 52-64.).

Другой проект использования тестов в США был направлен на изучение и совершенствование методов адаптации призывников к военной службе. В частности, он преследовал цель поднять боеспособность американских солдат за счет снижения у них чувство страха. В соответствии с учением З. Фрейда, это чувство относилось к скрытым, или иначе, латентным свойствам личности. Отсюда и название общей методологии исследования таких свойств — Латентно-Структурный анализ (от англ. Latent Structure Analyses, или сокращенно, LSA). Эта методология нацелена на выявление латентных качеств и факторов поведения посредством математико-статистических моделей измерения. Было проведено широкомасштабное социально — психологическое исследование «American Soldier», призванное повысить боеспособность солдат за счет выявления и устранения тех скрытых факторов, которые влияют на поведение солдат в боевой обстановке (Stouffer S. A. Measurement and Prediction / Stouffer S. A. et al. N-Y.: Science Editions, Wiley and Sons, 1966.).

Понятие «латентная», или как иногда пишут в нашей литературе, «скрытая» переменная, невольно вызывает ассоциацию с метафизическим учением о неких скрытых, от непосредственного восприятия, «сверхфизических» сущностях каждой вещи или явления, взятых вне их связей и отношений в окружающем их мире (Суворов Л.Н. Материалистическая диалектика. М.: Мысль, 1980. С. 11-12.). Основываясь на этой ложной ассоциации, можно было бы, как делалось раньше, вообще не рассматривать идею латентно-структурного анализа, считая ее очередным проявлением антидиалектизма в науке. Однако такой ход мышления привел бы к ошибке, ибо научное мышление опирается не столько на ассоциации, сколько на рациональность. А это, прежде всего, есть сфера принципов, допущений и процедур, обеспечивающих объективность, логическую принудительность и результативность в процессе познания (Кураев В.И. Точность, истина и рост знания / Кураев В.И., Лазарев Ф.В. М.: Наука, 1988. С. 233.).

Смысл введения латентной переменной требует краткого разъяснения. Она представляет собой простейшую форму реализации идеи существования скрытого фактора, влияющего на результаты испытуемых. Результаты теста всегда содержат в себе ошибки измерения, затрудняющие оценку истинного значения тестового балла на латентной переменной. Поскольку латентная переменная появляется в результате концептуализации, она всегда остается гипотетической переменной, на которой с большей или меньшей точностью оцениваются истинные результаты испытуемых. Латентная переменная представляет собой концептуальную модель интересующего исследователя качества испытуемых.

Попытки судить о невидимых вещах по видимым проявлениям имели место еще в глубокой древности. Так, например, Платон утверждал, что истинная астрономия занимается не изучением движения наблюдаемых небесных тел, а изучением законов движения звезд по математическому небу; несовершенным изображением последнего является видимое небо (Клайн Б.Л. В поисках физики и квантовая теория / Пер. с англ. М.: Атомиздат, 1971. С. 13.). В эпоху возрождения скрытые качества рассматривались как некие силы, присущие всем вещам, причем каждая вещь представлялась как нечто двойственное: чувственно воспринимаемый предмет и внутреннее «скрытое качество», которое вызывало изменение наблюдаемых свойств. Эта идея вновь пробила себе дорогу в науке середины ХХ века.

Добавить комментарий

(*) Required, Your email will not be published