Построение формальной модели (формализация, связка С схемы П3.1). Измерение в широком смысле
Такого рода «широкую» математическую систему мы, в соответствии с нашим взглядом на социологическое исследование, считаем ре зультатом измерения. Конечно, можно было бы результаты анализа данных (совокупность коэффициентов корреляции, полученную систему регрессионных уравнений, результаты кластерного анализа) не включать в понятие измерения. Не будем спорить на эту тему. Отметим, однако, что дело здесь не в словах, не в выборе термина. Нам представляется, что наше понимание измерения способствует более тщательному отслеживанию модельных предположений социолога и, как следствие, более серьезному пониманию смысла и надежности получаемых выводов. В частности, такому повышению качества исследования может способствовать «перевод» модельных рассмотрений на «язык», связанный с анализом соотношения между эмпирической и математической системами (что, собственно, и требуется, если мы принимаем теоретико-измеренческую «парадигму»). Покажем это на примере.
Предположим, что, проводя описанное выше исследование по социальной напряженности, мы приняли содержательные аксиомы, заложенные в схеме на рис. П3.2, и хотим проанализировать, например, влияние историко-биографического типа респондента на степень утраты им социальной самоидентичности под воздействием какого- то события. Конечно, мы можем считать, что конечным результатом измерения будет служить совокупность полученных для каждого человека значений соответствующих переменных: как-то оцененного типа (скажем, номера класса, полученного на основе кластеризации биографических интервью) и степени утраты самоидентичности (оцененной, например, с помощью специального психологического теста). В соответствии с таким взглядом, совокупность этих значений будем считать окончательным отображением нашей эмпирической системы в математическую. А дальнейший анализ — к примеру, расчет какого- либо коэффициента связи между названными признаками — не будем считать относящимся к процессу измерения.
Но... вдумаемся, каким образом мы измеряли наши переменные. Любое ли измерение годится нам для обеспечения содержательной значимости упомянутого коэффициента связи? Наверное, нет.
Рассмотрим процесс измерения типа респондента. Вероятно, мы заранее знали, что нас интересует в биографическом интервью именно то, что определяет возможную протестую реакцию на «будоражащие» общество события. Так, выделяя в соответствующем тексте смысловые единицы, мы обратим внимание на те фрагменты, где идет речь, скажем, о политических спорах родителей респондента, но, весьма вероятно, посч итаем ненужным учесть то, что в детстве он часто болел ангиной (разве что свяжем этот аспекте явившейся следствием ангины повышенной нервозностью респондента).
В свою очередь, утрата самоидентичности нас тоже интересует лишь в том случае, если она вызвана не абы какими причинами, а только теми, которые связаны с отсутствием солидарности между социальными группами в современной России (об этом говорит та же схема на рис. ГІ3.2). И не всякий результат психологического теста нас удовлетворит. Для примера заметим, что, наверное, к ощущению жизни, связанному с утратой самоидентичности, можно прийти в результате сложных, противоречивых воздействий многонационального семейного окружения. Но если это — следствие того, что у изучаемого респондента мама — русская, атеистка, а папа — мусульманин из Алжира, то такая потеря самоидентичности нас вряд ли будет интересовать. А вот если изучаемое состояние респондента возникло из-за того, что его родственники по материнской линии — русская педагогическая интеллигенция в третьем поколении, а по отцовской — полуспившиеся представители современной русской деревни, то изучение такой ситуации будет иметь непосредственное отношение к теме исследования. Чтобы учесть подобные ситуации, мы, наверное, должны при измерении самоидентичности к психологическому тесту добавить какие-то характеристики тех событий, которые привели к ее потере.
Другими словами, можно сказать, что включение нами в расширенно понимаемую ЭС (в блок-схему аналогичную той, что изображена на рис. П3.2) связи между историко-биографическим типом и утратой самоидентичности и желание отобразить эту связь в строящуюся математическую модель (т. е. в математическую систему, МС) обусловило определенный подход к операционализации обоих признаков (и биографического типа, и утраты самоидентичности). При изучении связи того же биографического типа с другим понятием (скажем, отношением человека к старшему поколению), может быть, этот тип надо было бы измерять по-другому Получается, что метод измерения признака определяется тем, какую задачу мы решаем. На самом деле ситуация сложнее.
Предлагаемая нами корректировка исходной информации определялась не только характером задачи (сводящейся к поиску связи между двумя понятиями), но и выбором метода ее решения16, в рассматриваемом случае — тем, что это решение мы намеревались осуществлять на основе расчета некоторого коэффициента связи между двумя скорректированными признаками. Но что было бы, если бы в приведенных рассуждениях вместо коэффициента связи (любого, подходящего для используемых шкал: коэффициента корреляции, критерия «Хи-квадрат» и т.д.) фигурировали, скажем, регрессионный, дисперсионный анализ и другие отличные от парных коэффициентов методы, позволяющие измерять связь между двумя переменными? Ясно, что любой метод, направленный на анализ значений названных признаков, потребует описанной выше переделки данных. Но, оказывается, что каждый метод сопряжен и с другими корректировками способов измерения исходных признаков.
Покажем, что вид исходных данных должен быть тесно связан с тем, какой из названных (или неназванных) методов мы выбираем. Для того чтобы это сделать, будем интерпретировать анализ данных как обобщенное измерение и рассмотрим весь процесс получения содержательного вывода с точки зрения отображения эмпирической системы в математическую.
Для определенности предположим, что, измеряя тип респондента с точки зрения специфики его биографии, мы используем нечто вроде шкалы Гуттмана. Скажем, мы превращаем интересующую нас часть интервью в набор ответов «да» или «нет» на вопрос о согласии или несогласии с утверждениями типа: «Моя бабушка по матери с презрением относится к братьям отца за их нежелание учиться», «Мой отец всегда смущается в присутствии тестя» и т. д. Пусть в результате суммирования таких оценок каждому респонденту приписывается число, скажем, от 10 до 100 в зависимости от его оценки уровня сим патии между родственниками со стороны матери и со стороны отца. Назовем рассматриваемый признак признаком X. На первый взгляд, ясно, какая эмпирическая система отражается в значениях этого признака: ее носитель — совокупность опрошенных, отношения между ее элементами определяются тем, как респонденты видят взаимоотношения между двумя группами своих родственников. Будем считать эту шкалу интервальной.
Оценки степени потери самоидентичности тоже будем считать полученными но интервальной шкале. Соответствующий признак обозначим через Y. Будем считать, что он изменяется от 0 до 1.
Сравним два способа анализа таких данных: расчет коэффициента корреляции и дисперсионный анализ. Оставаясь в парадигме теории измерений, немного изменим взгляд на используемые приемы сбора и анализа данных и введем новые термины.
Во-первых, ясно, что, не отвергая описанного представления о нашей обобщенной ЭС, можно внутри нее рассматривать подсистемы, связанные с измерением каждого признака.
Во-вторых, заметим следующее. Совокупность результатов измерений рассматриваемых признаков, служащих исходными данными для какого-либо метода, можно считать своеобразной эмпирической системой, которая с помощью этого метода переводится в математическую. Назовем такие ЭС и МС вторичными (подчеркнем, что вторичные ЭС — это не те вторичные содержательные модели, о которых шла речь в начале п. 2, на с. 254).
Говоря о таких системах, мы учитываем, что в результате применения любого метода анализа данных получается некоторый набор чисел (говоря строго — это выборочные оценки некоторых параметров генерального распределения, но этот аспект исследования нас здесь не интересует), на основании которого мы судим о каких-то свойствах реальности (в нашем случае — о том, можем ли мы считать рассматриваемые признаки связанными). Каждый такой набор мы считаем результатом измерения, отвечающего своим эмпирической и математической системам. Они и являются вторичными.
Рассмотрение первичных и вторичных систем отнюдь не выводит нас за рамки всего сказанного выше. Просто с помощью введения этих поиятий мы имеем возможность более конструктивно говорить об отображении нашей обобщенной ЭС в числовую, разбивая этот сложный процесс на отдельные шаги.
Покажем, какой вид вторичные системы имеют в интересующем нас случае.
Предположим, что мы используем коэффициент корреляции. В табл. 113.1 приведен гипотетический пример исходных данных (N — объем выборки).
Таблица П3.1
Исходные данные (результаты первичного измерения) для расчета коэффициента корреляции (гипотетический пример; N объем выборки) Номер
респондента 1 2 3 4 ... N Значение X 28 35 47 13 91 Значение Y 0,3 0,8 од 0,9 од Вторичная эмпирическая система здесь состоит из подобных пар последовательностей чисел, вычисленных для любых двух рассматриваемых признаков. В результате вторичного измерения каждой такой паре ставится в соответствие число — коэффициент корреляции. Это — результат вторичного измерения. Как известно, упомянутый коэффициент измеряет линейную связь. Другими словами, он будет близким к единице (минус единице), если (и только если), изобразив каждого респондента из табл. П3.1 в виде точки двумерного пространства с осями, отвечающими признакам X и Y, мы получим почти прямую линию. Это и будет означать наличие связи. Высокий коэффициент корреляции будет говорить о том, что учтенные нами моменты биографии респондентов действительно связаны с потерей последними самоидентичности.
Обсудим теперь, что происходит при дисперсионном анализе (с этим методом можно ознакомиться, например, по книге [Кремер, 2001J). С содержательной точки зрения задача здесь ставится по- другому.
Вторичной эмпирической системой здесь является разбиение исходной совокупности респондентов на несколько (2, 3, 5) групп по значениям признака X и заданных для вошедших в каждую группу респондентов значений признаков Y. По определенным правилам мы ставим в соответствие этому разбиению некоторое число (значение F-критерия), по величине которого судим, можно ли говорить о том, что вычисленные для упомянутых групп средние значения признака Y в генеральной совокупности (т. е. математические ожидании) равны друг другу. Если имеются основания отрицать это обстоятельство (т. е. если генеральные средние не равны), то мы говорим, что наши признаки (степень присутствия интересующих нас аспектов в биографии респондента и степень утраты им самоидентичности) связаны друг с другом, биография определяет самоидентичность.
Для применения дисперсионного анализа требуется изменить вид первичной эмпирической системы, связанной с признаком X. Мае уже не удовлетворяет точное измерение этого признака. Диапазон изменения его значений надо разделить на небольшое количество интервалов и перекодировать все значения. Примеры такой перекодировки отражены в табл. П3.2а, б, в.
Таблица П3.2а Интервал значении признака X 10-20 20-30 90-100 Результат перекодировки 1 2 9
Таблица П3.26 Интервал значений признака X 10-25 25-40 85-100 Результат перекодировки 1 2 6
Таблица П3.2в Интервал значений признака X 10-15 15-40 40-100 Результат перекодировки 1 2 3
Естественно, можно предложить бесконечное количество вариантов разбиения диапазона изменения признака X на интервалы. Какой вариант выбрать? При одном разбиении может быть дан утвердительный ответ на вопрос о существовании интересующей нас связи, при другом — отрицательный. Очевидно, неплохо было бы перебрать возможные варианты разбиения и либо прийти к выводу, что как ни осуществляй требующееся разбиение, интересующей нас связи не будет, либо найти такие варианты разбиения, при которых будут основания говорить о наличии связи. Существуют математические методы, позволяющие это делать. Разным разбиениям фактически отвечают разные номинальные (порядковые) признаки. Поэтому последнее слово — за исследователем. См. также [Толстова, 2000].
Вторичной эмпирической системой в случае использования дисперсионного анализа будет служить совокупность всевозможных разбиений вместе с заданными в каждой группе, отвечающей любому из них, значениями признака Y для попавших в нее объектов (т. е. совокупность всевозможных наборов ячеек). Ведь числа (значения критерия), как было сказано выше, приписываются именно разбиениям. Мы видим, что это — не та система, которую мы имели при использовании коэффициента корреляции. И это не просто схоластика, за этим стоит весьма существенный момент: рассчитывая коэффициент корреляции, мы пользовались значениями признаков, непосредственно полученными от респондентов; применяя же дисперсионный анализ, мы перешли от признака X к другому признаку, получающемуся за счет группировки значений X.
Все сказанное, на наш взгляд, подтверждает целесообразность практического использования предлагаемого нами расширения понятия измерения: рассуждая в терминах эмпирической и математической систем, мы глубже анализируем суть задачи, более эффективно ее решаем. См. также [Толстова, 20006, в, 2004а; Толстова, Масленников, 2000].
Заметим, что для получения вторичной ЭС из результатов первичного измерения могут использоваться достаточно сложные методы анализа данных (а не просто группировка значений признака, как было выше), выбор которых тоже определяется тем, что мы дальше с нашей информацией собираемся делать, какой метод использовать. Скажем, мы хотим осуществить типологию респондентов с помощью каких-то алгоритмов классификации. Априорное осмысление иско мой типологии может нас. навести на мысль о том, что более «чистые» (в статистическом смысле) типы мы получим, если будем применять методы классификации не к результатам первичного измерения, а к значениям латентных факторов, которые найдем, применив к этим результатам факторный анализ.
Кроме того, необходимо учитывать, что в качестве результатов первичного измерения могут выступать отнюдь не значения каких- либо признаков, описывающих изучаемые объекты. Скажем, методы многомерного шкалирования рассчитаны на анализ матриц близостей. Однако мы полагаем, что в любом случае использование парадигмы теории измерений в любом случае может способствовать более адекватному решению социологической задачи.
Ясно, что описываемые процессы первичного и вторич ного измерения могут быть многоступенчатыми, содержать множество обратных связей. Более того, зги процессы неразрывно связаны с рассмотренным выше процессом операционализации понятий. Надеемся, что мы сумели донести до читателя главное: любое применение математического метода должно оцениваться как обобщенное измерение, то есть анализироваться как процесс моделирования; такая позиция требует четких рассмотрений того, что мы моделируем (какова ЭС), из чего мы строим модель (какова МС) и как мы осуществляем соответствующее отображение (какова наша обобщенная шкала). Без четких формулировок этих понятий вряд ли может быть эффективно решена социологическая задача. 5.
Еще по теме Построение формальной модели (формализация, связка С схемы П3.1). Измерение в широком смысле:
- Построение концептуальной модели (концептуализация, связка В схемы П3.1)
- Построение вторичной содержательной модели (интерпретация, связка D схемы П3.1)
- Построение содержательной модели (абстрагирование, связка А схемы П3.1)
- Приложение 3. Социологическое исследование как измерение в широком смысле 1.
- Широкое определение социологического измерения
- РЕЛИГИЯ В УЗКОМ И В ШИРОКОМ СМЫСЛЕ
- Глава 13. Формализация понятия социологического измерения
- Возможности и границы формализации (философский смысл теорем Гёделя, Тарского)
- ИСПОЛЬЗОВАНИЕ ФОРМАЛЬНО-ЭМПИРИЧЕСКОГО ОБОБЩЕНИЯ И ТЕОРИИ ЭМПИРИЧЕСКОГО МЫШЛЕНИЯ ПРИ ПОСТРОЕНИИ УЧЕБНЫХ ПРЕДМЕТОВ
- Космогоническая модель построения города
- СМЫСЛ ОРАНЖЕВОЙ РЕВОЛЮЦИИ В КОНТЕКСТЕ ПОСТРОЕНИЯ НОВОГО МИРОВОГО ПОРЯДКА
- Опыт построения модели инновационной деятельности учителя
- Акмеологический подход к построению модели инновационной деятельности учителя
- 73. Социологические индексы. Проблемы их построения 7.3.1. Расчет индекса — способ измерения латентной
- Ю.Ш. СТРЕЛЕЦ. Смысл жизни человека в философско - антропологическом измерении: Учебное пособие. Оренбург: ГОУ ОГУ.- 139 с., 2003
- СВЯЗКИ
- Особенности формализации современной науки