Одномерная базовая таблица: быстро ли вы обычно засыпаете?
Одной из предпосылок современных исследований методом опроса является создание машин, которые в час сортируют около 60 000 перфокарт и могут при этом подсчитывать все отверстия в одной колонке1, а также изобретение специальных счетных сортировочных машин, которые за один прием обрабатывают 60 колонок и больше, за одну операцию выполняют программы счета, сортировки [и вычислений и автоматически записывают результаты.
Стало технически просто подготовить тома g сотнями таблиц по результатам опроса, но составление содержательных и четких таблиц осталось трудным делом. Эту работу человеческого ума нельзя передать машине.
Прежде чем приступить к составлению таблиц, необходимо составить себе представление о распределении величин в целом. Для этого один раз просчитывают комплект перфокарт и у каждой позиции в схеме кодирования указывают найденную величину в абсолютных цифрах и процентах. Одновременно проверяют статистическую представительность данных, чтобы еще перед началом дальнейших вычислений произвести возможную корректировку результатов путем взвешивания 2. О величине ошибок кодирования судят по соответствующим контрольным пробам: сколько людей моложе 20 лет отмечены на перфокартах как пенсионеры, сколько жителей Гамбурга отме чены как члены сельской общины,скольконекурящих охотнокурят сигареты маркиX?
После однократного просчета всего комплекта перфокарт мы уже можем составить первые таблицы. Возьмем, например, вопрос[138]:
Легко....................
Довольно хорошо С трудом....
Простые одномерные таблицы этого типа с общим результатом образуют базу всякого отчета. Их ценность состоит в описании обстоятельств, они еще не содержат результатованализа.
Эту таблицу можно записать и так:
ВОПРОС: «Как выобычно засыпаете — легко или с трудом?»
Общий результат
Легко............................................................................................. 56,2%
Довольно хорошо......................................................................... 20,7%
С трудом....................................................................................... 23,1%
100%
Или так:
ВОПРОС:«Как Вы обычно засыпаете — легко или с трудом?»
Общий Кол-во
результат
Легко.......................................................................... 56% 1134
Довольно хорошо..................................................... 21% 418
С трудом 23% 466
Илитак:
ВОПРОС:«Как Вы обычнозасыпаете — Легкоили с трудом?»
Проекция на
39,5 млн. жителей ФРГ (включая Западный Берлин) в возрасте старше 18 лет*
Засыпают легко................................................................. 22,2 млн.
Засыпают довольно хорошо......................................... 8,2 млн.
Засыпают с трудом.......................................................... 9,1 млн.
39,5 млн.
В последней таблице мы, как говорят, «проецировали» на все население ФРГ результаты, полученные для представительной выборки в 2018 человек. Расчет был произведен на основании 3 групп известной величины.
Из 2018 опрошенных 1134 ответили, что они засыпают легко; на основании этого был сделан вывод, что из из 39,5 млн. лиц в возрасте от 18 лет в ФРГ засыпают легко 22 200 000 человек.К процентам переходят прежде всего тогда, когда необходимо сравнить друг с другом два или несколько рядов чисел. В нижеследующем примере сравнивают количество муки различных сортов, проданной в двух областях:
количество четырех сортов муки, проданное в двух различных областях (в фунтах).
СортаОбласть IОбласть II
А 5,836 2,888
Б 1,7101,728
В 13,723 3,736
Г 7,4500,224
Всего продано (в фунтах) 28,719 8,576
Пересчет в процентах яснее показывает положение дела. Проценты помогают нам определить различия в пропорциях проданной муки:
Количество четырех сортов муки, проданное в двух различных областях (в процентах)
Область I Область II
Сорта
34% 20% 43% 3% 100% |
20% 6% 48% 26% |
А
Б
В
100% |
Г Всего
Почему результатыопросов
в большинстве случаев выражены
впроцентах?
Почему чаще всего результаты опросов выражают в процентах? Ганс Цайзель объясняет это в своей книге «Say it with Figures»[139], впервые опубликованной в 1947 году, следующим образом:
«Для чего обычно применяют проценты — известно: они дают возможность выявить относительную величину двух или более чисел. Это осуществляется двумя способами. Во-первых, выраженные в процентах числа можно легко умножать и делить (проценты — это, как правило, числа меньше ста); во-вторых, при этом одно из чисел, базовое, превращается в 100 — число, которое легко делится само и на которое легко делить другие числа. Благодаря этому нетрудно представить относительную величину различных чисел.
Отношения между двумя числами
Часто в исследованиях мы получаем количественные результаты, которые, если их рассматривать как таковые, не имеют смысла. Лишь если эти результаты сравнить друг с другом, они дают желаемую информацию.
Предположим, что во время предвыборной кампании к президентским выборам 1948 года мы провели опрос представительной выборочной совокупности из 15 000 избирателей в штате Нью-Йорк. Нас интересовали их намерения во время выборов. Мы установили, что 7650 опрошенных заявляют, что они выберут Трумэна, 7350 опрошенных говорят, что они проголосуют за Дьюи. Если мы хотим оценить перспективы Трумэна на выборах (то же самое можно сделать и с данными о Дьюи), то мы имеем для этого два числа:
а) 7650 — числоопрошенныхизбирателей,которые хотятголосовать за Трумэна;
б) 15 000 — величина всей выборки, которая была опрошена.
Число (а), взятое отдельно, не говорит вообще ни о чем. Число (б) не является результатом исследования, это более или менее произвольно взятое число. Однако отношение между обоими числами (а) и (б) дает нам некоторую информацию.
Оно означает, что 51 процент избирателей выразил желание избрать Трумэна. Ни одно из обоих чисел в отдельности не представляет интереса. Представляет интерес лишь отношение между обоими числами а/б.
При использовании процентов мы не можем забывать об их главной функции: они должны по возможности упростить выражение отношений между двумя или несколькими числами. Из этого следуют практические выводы относительно способов процентного выражения.
Одна из проблем, возникающих в этой связи,— это, например, вычисление десятичных долей процентов.
Как известно, проценты можно вычислять с любой степенью точности: 170, например, составляет37,778... процентаот450.
На первый взгляд может показаться, что процентное выражение тем лучше выполняет свою цель, чем точнее оно вычислено. Приведенный пример показывает, однако, что процентное выражение по мере уточнения теряет какую-то долю своей простоты. Если мы вычислим слишком много знаков после запятой, то это может привести к тому, что процентное выражение труднее будет прочесть, чем первоначальное абсолютное число. Десятичные знаки могут свести на нет важное преимущество процентов, и поэтому следует подумать, прежде чем вычислять десятичные знаки в процентах.
В эмпирических социальных исследованиях и в исследованиях сбыта и потребления проценты рассчитывают, как правило, с точностью максимум до одной десятой; один десятичный знак рассматривают, так сказать, как допустимый компромисс между простотой и точностью. Однако мы не должны забывать, что даже один десятичный знак затрудняет ясность таблицы.
Предположим, что Вы находите в таблице следующие три процентных числа:
Проценты 27,6 42,2 84,8
Всего (базовое число) (352) (306) (344)
Нет никакого сомнения в том, что было бы намного легче сравнивать эти три числа, если бы проценты были изображены без десятичных: 28—42—85. При таком распределении ошибка, получающаяся при округлении, является незначительной. Различия между числами выступают гораздо нагляднее, если проценты представлены без десятичных знаков. С другой стороны, практически нет никакой разницы, сравнивают ли 27,6 и 42,2 или 28 и 42.
Напротив, следующая таблица показывает случай, при котором имеет значение, отбрасывают ли десятичные знаки или нет:
Проценты 11,5 11,9 12,4
Всего (базовое число) (9,367) (10,072) (10,031)
В этой таблице оставлены десятичные знаки по двум причинам. Во-первых, чтобы не стереть различие между тремя столбцами (тогда все три числа превратились бы в 12%). Кроме того, при выборке с таким количеством случаев различие в десятые доли процента еще может быть значимым. При выборке в несколько сотен случаев такое же различие между 11,5; 11,9 и 12,4 процентами уже не было бы значимым и нельзя было бы с достаточной уверенностью делать вывод о действительном различии между группами. В математической статистике никогда не может считаться ошибочным точное вычисление процентов с десятичными знаками, однако десятичные знаки психологически могут ввести в заблуждение, так как они создают видимость большей точности, чем та, которую выражают числа в абсолютном выражении. Если проценты 11,5; 11,9 и 12,4 вычислены на основе 300 случаев, а не на основе 10 000 случаев, то намного лучше указать на незначительность таких различий и, отбросив десятичные знаки, округлить: 12,12,12. Если мы оставим десятичные знаки, то даже при небольшой выборке наивный читатель, увидев такую таблицу, может сказать: «Здесь видно небольшое постепенное развитие от 11,5 через 11,9 к 12,4». В действительности такое впечатление вообще не оправданно.
Десятичные знаки должны сохраняться в тех случаях, когда запланировано повторение исследования и результаты будут сравниваться. Мы не можем знать наперед, как велико или как мало
будет найденное различие *. Однако в принципе можно утверждать, что таблица при отбрасывании десятичных знаков всегда выигрывает в ясности и наглядности. Одновременно мы избегаем впечатления несуществующей точности, которая является точностью расчета процентов,а не точностью самого результата».
Абсолютные числа мешают и необходимы
По вопросу о том, следует ли в таблице наряду с процентами указывать абсолютные числа, Г. Цайзель пишет[140]:
«Каждая таблица, даже простая, выигрывает в наглядности, если опустить абсолютные числа. Благодаря этому таблица становится также привлекательной для неспециалиста, который всегда немного испытывает страх перед большим количеством чисел. Во всех случаях, когда можно обойтись без абсолютных чисел в таблицах, необходимо от них освобождаться. Однако, если по каким-либо причинам нужно сохранить проценты и абсолютные числа, не перегружая таблицу, есть элегантное решение: свести абсолютные числа в отдельную таблицу и расположить эту таблицу рядом, ниже или поместить в приложении».
Как справедливо замечает Г. Цайзель, при решении вопроса о том, включать или не включать в таблицу абсолютные числа, возникает конфликт между облегчением анализа и ясностью таблицы. Для удобства анализа хотелось бы все нужные числа иметь рядом друг с другом, однако ясность таблицы сильно ухудшается, если удваивается количество содержащихся в ней чисел. При простых общих результатах, которые мы рассмотрели, это еще не имеет значения. Другое дело, если таблица содержит четыре, шесть или более столбцов. Практическое решение конфликта между удобством и ясностью, если речь идет не об отдельных таблицах, а о целых отчетах по исследованиям, состоит в том, чтобы составить перечень всех встречающихся в отчете базисных групп в абсолютном выражении и так поместить его в отчете, чтобы им можно было легко пользоваться.
Абсолютное число случаев, на основании которого получены проценты, как правило, необходимо для оценки статистических отклонений в результатах или для проверки значимости различий между двумя найденными величинами.
Однако имеется много случаев, когда должны быть приняты во внимание абсолютные величины — внутри выборочной совокупности или в проекции на генеральную совокупность,— чтобы избежать неправильных выводов. Так, например, в одной из газет была помещена заметка о соотношении мужчин и женщин среди слушателей гессенской и баварской радиопередач, делающих объявления о найме на работу: «При сравнении с результатами по сфере действия гессенской радиопередачи можно утверждать, что доля женщин среди «слушателей за день» в Баварии значительно меньше, чем в Гессене— 61% против 68% в Гессене». После этого сообщения Баварская радиостанция потребовала исправлений или пояснений в абсолютных числах.
На основании этой заметки можно сделать вывод, что гессенскую радиопередачу слушает больше женщин. Посмотрим, однако, таблицу, дополненную числами в абсолютномвыражении:
Слушатели радиопередачо найме рабочей силывГессене 68%= 735 000 32%= 345 000 |
Слушатели радиопередач о найме рабочей силы в Баварии
Женщины................................. 61% = 1430 000
Мужчины................................. 39%= 920 000
100 % = 2 350 000 100 % = 1 080 000
При анализах сбыта и потребления, анализах объявлений о приглашении на работу, а также при анализах политических вопросов всегда приходится проверять, указано ли наряду с числом процентов абсолютное число случаев, на основе которых рассчитаны проценты, а также не производят ли большее и правильное впечатление результаты опроса в абсолютных числах.
Приятное, все упрощающее сглаживание различающихся абсолютных величин при пересчете в проценты, без сомнения, таит в себе опасность ошибок, когда абсолютные величины легко исчезают из поля зрения или вообще не сообщаются. Один иллюстрированный журнал опубликовал однажды пародию на такие сообщения под заголовком: «50 процентов немецких врачей, которые в прошлом году уехали в Индию, умерли в первые 12 месяцев работы». Через несколько строк читатель узнал, что за весь прошлый год в Индию уехало лишь два врача.
Не является ли вообще расчет процентов при числе случаев меньше 100 намеренным коварным обманом?
В принципе никто пе возражает против того, чтобы рассчитывать проценты для небольших групп — это облегчает сравнениеразличных групп менаду собой, увеличивая общий базис до 100; наоборот, в больших группах его снижают до 100. Однако в выборочных исследованиях проценты, которые вычисляются на малой статистической базе (менее 100 случаев), должны обозначаться в принципе особым образом вследствие приблизительности результатов, значительного диапазона ошибок. Например, в таблицах их можно брать в скобки как простые «показательные» величины.
Когда сложение процентов дает число больше 100
Из исследования «Социологические данные по вопросам здравоохранения» (глава «Домашние средства и медицинское суеверие»)[141] заимствована следующая таблица, содержащая общий результат:
ВОПРОС: «Иногда достаточно воспользоваться каким-либо домашним средством, и можно не ходить к врачу. Здесь перечислены различные домашние средства. Сначала вопрос: «Какие из них Вы знаете, о каких Вы уже слышали?»
И «какие из них Вы считаете хорошими —я имею в виду: на какие можно в большинстве случаев положиться и быть уверенным, что они помогут?»
Взрослое население
(старте 17 лет) в
Гессене
Знают следующие домашние средства:
Чай из липового цвета как потогонное средство 74%
Мех кошки при ревматизме или ишиасе... 60%
Крапива или укусы муравьев при ревматизме 38%
Уксусный компресс при температуре.... 36%
Собачий жир от туберкулеза.................................... 22%
Носить в карманах каштаны от ревматизма
При кровотечении из носа приложить к за- 19%
тылку связку ключей.................................................. 15%
Не знают ни одного из этих средств....... 17%
281%
Сумма процентов при сложении получается более 100, если на один вопрос можно одновременно дать несколько ответов (если по смыслу на вопрос возможен лишь один ответ, сумма процентов всегда составляет 100). Второй пример мы видим в схеме кодирования с указанным общим результатом вопроса: «Давайте подумаем о ближайшем будущем, я имею в виду наступающий год, исполнения какого желания Вы хотели бы больше всего?» Благодаря таким ответам, как: «Здоровье моей дочери, а также ника-
кого застоя в делах», сумма процентов по всем желаниям в личной сфере увеличилась не на 51%, а на 60%.
Часто наблюдаются отчаянные попытки устранить в таблицах эти «некрасивые» ошибки; при этом сумма всех ответов берется за 100 и служит в качестве базы процентного исчисления.
При такой процедуре последовательность и соотношения величин остаются очевидными, но числа теряют свою конкретную наглядность, так как они уже относятся не к людям (60 из 100 гессенцев слышали о том, что мех кошки помогает от ревматизма), а относятся к сумме ответов («Среди псех ответов 23 касаются меха кошки как средства от ревматизма»).
Это возражение существенно; ведь статистике необходимо искусство, чтобы быть понятой. Многие люди встречают сообщения из мира науки о признаках и переменных, как было сказано ранее, с невольным сопротивлением. Поэтому доступ к таким сведениям не следует и дальше осложнять статистическими операциями, которых можно избежать. Наоборот, необходимо при составлении таблиц искать средства, чтобы сделать их наглядными, понятными.
Другой способ получить таблицу о домашних средствах со 100%-ным итогом — каждую строку дополнить пока отсутствующими данными о том, сколько процентов опрошенных не знают этого домашнего средства. Это дополнение, правда, удваивает количество чисел в таблице. Получают следующую таблицу:
Взрослое население
земли Гессен (старше
18 лет)
Чай из липового цвета как потогонное —
74% 26% |
знают как домашнее средство....не знают..
100% 60% 40% 100% |
Мех кошки при ревматизме или ишиасе —
знают как домашнее средство....не знают
Такой способ составления таблиц демонстрирует комбинацию знаний — эту модель можно использовать для вопросов с тремя или четырьмя категориями ответов — и уменьшает наглядность. Это хорошая форма таблицы, если мы хотим знать что-либо о комбинациях. Если нас не интересуют комбинации, то не следует их отражать. В то время как из таблицы комбинаций можно самостоятельно рассчитать общий результат для отдельных категорий и таким образом получить как бы два различных вида информации, по простому общему результату нельзя определить частоту комбинаций. Таблицы комбинаций менее ясны, менее наглядны, и это в достаточной степени говорит против такого способа. Представительные исследования приносят, как правило, огромное количество данных. Их отбор следует проводить, исходя из цели исследования.Можно составить эту таблицу более экономно:
Взрослое население земли Гессен (старше 18 лет)
Знают в качестве домашнего средства 74% 60% |
Средство не известно
26% = 100% 40% = 100% |
Чай из липового цвета какпотогонное
Мех кошки при ревматизмеили ишиасе
И еще одна возможность для вопросов с небольшим количеством вариантов ответов (для целей демонстрации мы соответственно сокращаем наш вопрос о домашних средствах):
Анализируется засыпание
Первые шаги анализа результатов опроса состоят в том, чтобы одномерные таблицы, которые мы рассматривали до сих пор, дополнить разработанными двухмерными или многомерными таблицами. Другими словами, наряду с общим результатом отдельно вычисляют результаты различных подгрупп и сравнивают их между собой. Если эти группы характеризуются единственным признаком (например, различным возрастом), то мы получаем двухмерную таблицу. Ниже приводится двухмерная таблица с 12-ю позициями:
Знают домашние средства:
Чай из липового цвета как потогонное и мехкошки при ревматизме и ишиасе
Чай из липового цвета как потогонное знают,о мехе кошки при ревматизме или ишиасене слышали
Мех кошки при ревматизме или ишиасе знают,о чае из липового цвета как потогонномне слышали
Не знают ни чай из липового цвета как потогонное, ни мех кошки при ревматизме или ишиасе.,.,,.,,,,,.,,,.
Взрослое население
земли Гессен (старше
18 лет)
53%
21%
7%
19% 100%
Оказывает ли возраст человека влияние на то, как он засыпает — легко или с трудом?
ВОПРОС: «Как Выобычнозасыпаете — легкоили струдом?»
18-29-летние 74% 15% 11% | 30-44-летние 62% 21% 17% | 45-59-летние 50% 23% 27% | 6 0-летние и старше 33% 25% 42% | |
довольно хорошо....с трудом............ | ||||
N (= число: итог в абсолютном выражении) = | 100% 570 | 100% 475 | 100% 557 | 100%, 416 |
Мы используем здесь возможность объяснить два распространенных термина: группировка, которая является базисной для процентов (в данном случае это возраст), обозначается как независимая переменная. Легкое или трудное засыпание в этом примере — зависимая переменная.
«Распределение» (обычное английское выражение «breakdown»), или — если говорить по аналогии с техническим процессом в машине — «сортировка» по возрастным группам и сравнение результатов, оказывается полезным. Кроме простого знания факта — сколько людей засыпают легко или с трудом,— можно определить взаимосвязь явлений и узнать, например, что возраст оказывает определенное влияние на засыпание. Далее приходит в голову, что легкое или трудное засыпание может зависеть также от окружающих условий — живет ли человек в тихой деревне или в шумном большом городе. Готовят новый «счетный шаблон» для работы на машине и получают результат: сколько карточек было найдено в различных группах.
Как обычно, в счетный шаблон заносят также проценты. Их можно включить в следующую таблицу:
ЛЕГКОЕ ИТРУДНОЕ ЗАСЫПАНИЕ В ГОРОДЕ И В ДЕРЕВНЕ
ВОПРОС: «Как Вы обычно засыпаете—легко или с трудом?»
Легко Довольно хорошо С трудом |
Жители
Деревень | Маленьких и | Крупных |
(менее 2000 | средних городов | городов |
жителей) | (2000—100 000 | (100 000 и |
жителей) | более жите- | |
лей) | ||
57% | 55% | 58% |
23% | 20% | 20% |
20% | 25% | 22% |
100% | 100% | 100%. |
Для подтверждения нашего предположения, что жители крупных городов засыпают труднее, нет никаких оснований.
Далеемы хотели бы проверить, одинаково ли хорошо засыпают мужчиныиженщины. Полученыследующие результаты:
Легко Довольно хорошо С трудом |
N = |
Сравнение мужчин и женщин ВОПРОС: «Как Вы обычно засыпаете — легко или с трудом?»
Мужчины | Женщины |
62% | 52% |
20% | 21% |
18% | 27% |
100% | 100% |
На первый взгляд кажется очевидным вывод: женщины труднее засыпают, чем мужчины. Однако известно, что среди женщин больше старых людей: вследствие гибели на войне многих мужчин старше 30 лет, а также благодаря биологически обусловленной большей продолжительности жизни у женщин. А мы уже знаем, что старые люди труднее засыпают. Может быть, данные последней таблицы — женщины в среднем труднее засыпают, чем мужчины,— объясняются более высокой долей людей старшего возраста/ среди женщин?
Переход от двухмерной таблицы к трехмерной — один из важнейших шагов
На вопросы такого рода можно получить ответ, если от двухмерных таблиц, в которых группы в сказуемом различаются только по одному признаку (возраст, или величина населенного пункта, или пол), перейдем к трехмерным таблицам, в которых группировки сказуемого определяются комбинацией двух признаков[142].
ЛЕГКОЕ И ТРУДНОЕ ЗАСЫПАНИЕ МУЖЧИН И ЖЕНЩИН РАЗЛИЧНЫХ ВОЗРАСТНЫХ ГРУПП
ВОПРОС: «Как Вы обычно засыпаете —легко или с трудом?»
Мужчины Женщины
моло- | 6 0 лет | моло- | 6 0 лет | |||||
же | 30-44 | 45-59 | и | же | 30-44 | 45-59 | и | |
30 лет | лет | лет | старше | 30 лет | лет | лет | старше | |
Легко | 71% | 63% | 58% | 50% | 77% | 62% | 43% | 21% |
Доволь- | ||||||||
но хорошо | 17% | 20% | 21% | 23% | 14% | 21% | 25% | 26% |
С трудом | 12% | 17% | 21% | 27% | 9% | 17% | 32% | 53% |
100% | 100% | 100% | 100% | 100% | 100% | 100% | 100% | |
N = |
В этой таблице, кроме независимой переменной (пол) и зависимой переменной (легкое или трудное засыпание), появился еще третий фактор, «контрольная переменная» — возраст.
Прежде всего в этой таблице мы находим подтверждение нашему первому предположению: возраст человека оказывает значительное влияние на то, легко или трудно люди засыпают — как мужчины, так и женщины. Теперь вернемся к вопросу, который мы только что поставили: действительно ли мужчины засыпают легче, чем женщины? Чтобы точно определить это, попробуем несколько изменить вид нашей трехмерной таблицы.
ЛЕГКОЕ И ТРУДНОЕ ЗАСЫПАНИЕ МУЖЧИН И ЖЕНЩИН РАЗЛИЧНОГО ВОЗРАСТА
ВОПРОС: «Как Вы обычно засыпаете — легко или с трудом?»
Моложе 30 | лет | 30-44 | лет | 45—59 | лет | 60 лет и старше | ||
Муж- | Жен- | Муж- | Жен- | Муж- | Жен- | Муж- | Жен- | |
чины | щины | чины | щины | чины | щины | чины | щины | |
Легко | 71% | 77% | 63% | 62% | 58% | 43% | 50% | ! 21% |
Доволь- | ||||||||
но хо- | ||||||||
рошо | 17% | 14% | 20% | 21% | 21% | 25% | 23% | 26% |
С трудом | 12% | 9% | 17% | 17% | 21% | 32% | 27% | 53% |
100% 100%100%100%100%100%100%100%N= 288282 215 260 250 307 177 239
Теперь мы видим: предположение, что мужчины засыпают легче, чем женщины, справедливо лишь в некоторой степени. Оно не подтверждается для мужчин и женщин моложе 45 лет. Оно верно для мужчин и женщин в возрасте от 45 до 59 лет, а для возраста 60 лет и старше эта тенденция выражена более четко, чем это позволяла предположить наша первая простая таблица.
«.Возраст — константа-»
На техническом языке анализа фактор, скрытое влияние которого на результаты хотят исследовать, называют константой. В нашем примере легкого и трудного засыпания мы считаем, что в действительности женщины засыпают не труднее мужчин. Здесь речь идет, видимо, о скрытом влиянии на результаты более высокого среднего возраста женщин в целом. Чтобы добиться ясности, мы составили таблицу, в которой возраст в четырех группах был константой: мы сравнивали мужчин и женщин в возрасте моложе 30 лет и устранили таким образом искажающий фактор «более высокий средний возраст женщин». Затем мы проделали то же самое с другими возрастными группами: мы сравнивали мужчин и женщин в возрасте от 30 до 44 лет, от 45 до 59 лет, а также мужчин и женщин старше 60 лет. Причем в последней группе возраст мужчин и женщин, без сомнения, не был константой, так как средний возраст женщин в этой последней группе был выше среднеговозраста мужчин.