Название журнала | Y, тариф (одна страница цветной рекламы), дол. | X1, планируемая аудитория, тыс. человек | Х2, процент мужчин | Х3, медиана дохода семьи, дол | ||||||
Audubon | 25 315 | 51,1 | 38 787 | |||||||
Better Homes & Gardens | 198 000 | 34 797 | 22,1 | |||||||
Business Week | 68,1 | 63 667 | ||||||||
Cosmopolitan | 15 452 | 17,3 | 44 237 | |||||||
Elle | 55 540 | 12,5 | 47 211 | |||||||
Entrepreneur | 40 355 | 2 476 | 60,4 | 47 579 | ||||||
Esquire | 71,3 | 44 715 | ||||||||
Family Circle | 147 500 | 24 539 | 13,0 | 38 759 | ||||||
first For Women | 28 059 | 3 856 | 3,6 | 43 850 | ||||||
Forbes | 59 340 | 68,8 | 66 606 | |||||||
Fortune | 3 891 | 68,8 | 58 402 | |||||||
Glamour | 85 080 | 7,8 | ||||||||
Goff Digest | 6 250 | 78,9 | ||||||||
Good Housekeeping | 166 080 | 25 306 | 12,6 | 38 335 | ||||||
Gourmet | 49 640 | 29,6 | 57 060 | |||||||
Harper's Bazaar | 52 805 | 2 621 | 11,5 | 44 992 | ||||||
Inc. | 70 825 | 66,9 | ||||||||
Kiplinger's Personal Finance | 65,1 | 63 876 | ||||||||
Ladies' Home Journal | 127 000 | 6,8 | ||||||||
Life | 63 750 | 14 220 | 46,9 | |||||||
Mademoiselle | 55 910 | 8,0 | ||||||||
Martha Stewart's Living | 93 328 | 4 849 | 16,6 | |||||||
McCalls | 7,6 | 33 823 | ||||||||
Money | 98 250 | 60,6 | ||||||||
Motor Trend | 79 800 | 5 281 | 88,5 | 48 739 | ||||||
National Geographic | 53,0 | 44 326 | ||||||||
Natural History | 45,0 | |||||||||
Newsweek | 148 800 | 20 720 | 53,5 | 53 025 | ||||||
Parents Magazine | 72 820 | 18,2 | ||||||||
PC Computing | 40 675 | 67,0 | 57 916 | |||||||
People | 125 000 | 33 668 | 34,0 | |||||||
Popular Mechanics | 86,9 | |||||||||
Reader's Digest | 42,4 | 38 060 | ||||||||
Redbook | 95 785 | 13 212 | 8,9 | 41 156 | ||||||
Rolling Stone | 78 920 | 8 638 | 59,8 | 43 212 | ||||||
Runner's World | 36 850 | 2 078 | 62,9 | 60 222 | ||||||
Scientific American | 37 500 | 2 704 | 70,0 | |||||||
Seventeen | 71 115 | 5 738 | 17,0 | 37 034 | ||||||
Ski | 32 480 | 2 249 | 64,5 | 58 629 | ||||||
Smart Money | 42 900 | 2 224 | 63,4 | |||||||
Smithsonian | 73 075 | 8 253 | 47,9 | |||||||
Soap Opera Digest | 35 070 | 7 227 | 10,3 | |||||||
Sports Illustrated | 162 000 | 78,8 | 45 897 | |||||||
Sunset | 56 000 | 5 276 | 38,7 | 52 524 | ||||||
Teen | 53 250 | 3 057 | 15,4 | |||||||
The New Yorker | 62 435 | 3 223 | 48,9 | |||||||
Time | 162 000 | 22 798 | 52,4 | |||||||
True Story | 12,2 | |||||||||
TV Guide | 42,8 | 37 396 | ||||||||
U.S. News & World Report | 98 644 | 9 825 | 57,5 | 52 018 | ||||||
Vanity Fair | 67 890 | 4 307 | 27,7 | |||||||
Vogue | 63 900 | 12,9 | 44 242 | |||||||
Woman's Day | 137 000 | 22 747 | 6,7 | |||||||
Working Woman | 87 500 | 6,3 | 44 674 | |||||||
YM | 73 270 | 14,4 | 43 696 | |||||||
Среднее значение | 83 534 | 39,7 | 47 710 | |||||||
Среднеквадратичное отклонение | 25,9 | 10 225 | ||||||||
Тарифы на размещение рекламных объявлений в журналах определяются каждым журналом самостоятельно. Чем объясняются различия в тарифах? Возможно, здесь каким-то образом учитывается ценность рекламного объявления для рекламодателя. Журналы, располагающие большей читательской аудиторией (при равных прочих условиях), наверное, вправе устанавливать большие тарифы. Кроме того, журналы, рассчитанные на более состоятельные круги читателей, также вправе устанавливать более высокие тарифы. Несмотря то что наверняка имеются и другие, не менее важные факторы, мы ограничимся лишь указанными двумя, добавив к ним еще один — предпочтения людей разного пола, и выясним, изменяют ли журналы свои тарифы в зависимости от соотношения мужчин и женщин в их читательской аудитории. Ответы на некоторые из этих вопросов можно получить с помощью множественного регрессионного анализа. Такой анализ поможет нам объяснить влияние на тарифы таких факторов, как величина читательской аудитории, структура читательской аудитории по полу и доходы читателей.
В табл. 3 представлена соответствующая многомерная совокупность данных, которую нам предстоит проанализировать. В качестве переменной У (объясняемой) мы будем рассматривать стоимость одной страницы одноразовой полноцветной рекламы. Объясняющими переменными будут Х1, читательская аудитория (планируемая в тысячах человек), Х2, процент мужчин среди планируемой аудитории, и Х3, медиана дохода семьи. Размер выборки n = 55.
В табл. 1 представлена компьютерная распечатка результатов анализа множественной регрессии. Например, с помощью Excel можно выполнить анализ множественной регрессии. Найдите пункт Data Analysis (Анализ данных) в меню Tools (Сервис) и выберите команду Regression (Регрессия). Если в меню Tools (Сервис) отсутствует пункт Data Analysis (Анализ данных), то сначала убедитесь, что вы выбрали ячейку электронной таблицы (а не график, например). Если вы все же не можете найти Data Analysis (Анализ данных), поищите пункт меню Add-Ins (Надстройки) и поставьте отметку возле Analysis ToolPak (Пакет анализа). Если это не поможет, то, видимо, необходимо переустановить Excel.
Таблица 1. Результат множественной регрессионного анализа тарифов на размещение рекламы в журналах (вычисления сделаны в Excel)
ВЫВОД ИТОГОВ | ||||||
Регрессионная статистика | ||||||
Множествен. R | 0,887 | |||||
R-квадрат | 0,787 | |||||
Нормированный R-квадрат | 0,775 | |||||
Стандартная ошибка | 21577,870 | |||||
Наблюдения | ||||||
Дисперсионный анализ | ||||||
df | SS | MS | F | Значимость F | ||
Регрессия | 62,843 | 0,000000 | ||||
Остаток | ||||||
Итого | ||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-значение | Нижние 95% | Верхние 95% | |
Y-пересечение | 4042,799 | 16884,039 | 0,239 | 0,812 | -29853,298 | 37938,895 |
Переменная X 1 | 3,788 | 0,281 | 13,484 | 0,000 | 3,224 | 4,352 |
Переменная X 2 | -123,634 | 137,849 | -0,897 | 0,374 | -400,377 | 153,108 |
Переменная X 3 | 0,903 | 0,370 | 2,442 | 0,018 | 0,161 | 1,645 |
Коэффициенты регрессии и уравнение регрессии
Сдвиг, или постоянный член, а, и коэффициенты регрессии, b1, b2, и b3, вычисляются компьютером с использованием метода наименьших квадратов.
Среди всех возможных вариантов уравнения регрессии с различными значениями этих коэффициентов именно уравнение, найденное таким методом, обеспечивает минимальную сумму квадратов ошибок прогнозирования для рассматриваемой нами выборки журналов. Уравнение регрессии (или уравнение прогнозирования) имеет следующий вид:
(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 =
= $4043 + 3,79(читательская аудитория) – 124(процент мужчин) + 0,903(медиана дохода).
Сдвиг, а = $4 043, интерпретируется следующим образом: типичный тариф на размещение одностраничного цветного рекламного объявления в журнале, у которого нет платных подписчиков, нет мужчин среди читателей и читатели не имеют дохода, составляет $4043. Однако в рассматриваемой нами совокупности данных нет подобных журналов, поэтому сдвиг, а, следует рассматривать лишь как вспомогательную величину, необходимую для получения оптимальных прогнозов, но не интерпретировать это значение так буквально.
Коэффициенты регрессии интерпретируются как влияние каждой из переменных на размер тарифа, если все другие независимые («объясняющие») переменные остаются неизменными. Часто это значение включает «поправку на» другие независимые переменные, или «контролирование» этих других независимых переменных. Поэтому коэффициент регрессии для конкретной X- переменной может изменяться (иногда значительно) в результате включения в анализ или исключения других Х- переменных. В частности, каждый коэффициент регрессии определяет среднее увеличение тарифа на размещение рекламы, приходящееся на единичное увеличение соответствующей ему Х- переменной (в данном случае термин «единичное» означает одну единицу измерения конкретной Х- переменной).
Коэффициент регрессии для размера читательской аудитории, b1 =3,79, указывает, что – при всех прочих равных условиях – журнал с дополнительной тысячью читателей (поскольку у нас X1 измеряется в тысячах человек) берет (в среднем) на $3,79 больше за размещение одностраничного цветного рекламного объявления. Можно также считать, что коэффициент регрессии для размера читательской аудитории означает, что каждый дополнительный читатель увеличивает для этого журнала тариф на размещение рекламных объявлений на $0,00379, т.е. увеличение составляет чуть меньше половины цента на одного человека. Поэтому, если у какого-то другого журнала такой же процент читателей-мужчин и такой же показатель медианы дохода семьи читателей, но читательская аудитория на 3548 человек больше, то можно ожидать, что тариф на размещение рекламных объявлений в этом журнале будет (в среднем) на 3,79 × 3,548 = $13,45 больше благодаря такому отличию размера читательской аудитории.
Коэффициент регрессии для процента мужчин, b2 = -124, указывает, что (при всех прочих равных условиях) тариф на размещение цветных рекламных объявлений в журнале с дополнительным 1% читателей-мужчин окажется (в среднем) на $124 меньше. Это означает, что читательницы представляют для журнала большую ценность, чем читатели-мужчины. Статистический вывод должен подтвердить или опровергнуть эту гипотезу путем сравнения величины влияния процента мужчин (т.е. -$124) с тем, на что можно было бы рассчитывать, если бы при данных обстоятельствах все определялось лишь чистой случайностью.
Коэффициент регрессии для медианы дохода, b3 = 0,903, указывает, что (при всех прочих равных условиях) в журнале с дополнительным долларом медианы дохода его читателей тариф на размещение одностраничного цветного рекламного объявления будет (в среднем) на $0,903 больше. Положительный знак этого коэффициента совершенно оправдан, поскольку люди с более высоким уровнем доходов могут позволить себе тратить больше на покупку рекламируемой продукции. Если у какого-то другого журнала такой же процент читателей-мужчин и такая же величина читательской аудитории, но медиана дохода семей читателей на $4 000 выше, то можно ожидать, что тариф этого журнала на размещение рекламных объявлений будет на 0,903 × 4000 = $3612 выше (в среднем) благодаря более высокому уровню доходов его читателей.
Помните, что коэффициенты регрессии отражают влияние на Y одной X- переменной при условии, что все другие Х- переменные остаются неизменными. Это следует понимать буквально.
Например, коэффициент регрессии b3 отражает влияние медианы дохода читателей на рекламные тарифы; он вычисляется при неизменных величинах читательской аудитории и процента читателей-мужчин. В таком случае более высокие уровни доходов читателей, как правило, ведут к установлению более высоких тарифов на размещение рекламных объявлений (поскольку b3 является положительным числом) – при фиксированных размере читательской аудитории и проценте читателей-мужчин.
Какой была бы эта взаимосвязь, если бы остальные переменные (размер читательской аудитории и процент читателей-мужчин) не фиксировались на постоянном уровне? На этот вопрос можно ответить, проанализировав обычный коэффициент корреляции (или коэффициент регрессии, прогнозирующий Y на основании только одной этой Х- переменной), вычисленный только для двух переменных: тарифа и медианы дохода. В нашем случае более высокое значение медианы дохода фактически ассоциируется с более низким тарифом (корреляция тарифа и медианы дохода является отрицательной: -0,167)! Чем это объяснить? Вполне приемлемое объяснение заключается в том, что журналы, ориентирующиеся на читателей с более высоким средним уровнем доходов, не в состоянии обеспечить себе массовую аудиторию из-за того, что богатых людей среди населения страны в целом не так уж много. Если же эта читательская аудитория богатых людей окажется очень небольшой, это может вообще исказить эффект влияния высокого уровня доходов в расчете на одного читателя.
Прогнозы
Уравнение прогнозирования, или уравнение регрессии, определяется в следующем виде:
прогнозируемое значение Y = а + b1X1 + b2X2 +... + bkXk,
В нашем примере с рекламными объявлениями в журналах, чтобы найти прогнозируемую величину тарифа на размещение рекламных объявлений исходя из величины читательской аудитории, процента читателей-мужчин и медианы дохода читателей для конкретного журнала, подобного тем, которые составляют рассматриваемую нами выборку данных, подставим в уравнение прогнозирования соответствующие этому журналу значения Х- переменных:
(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 =
= $4043 + 3,79(читательская аудитория) – 124(процент мужчин) + 0,903(медиана дохода).
Допустим, например, что вы собираетесь основать новый журнал, «Популярная статистика», который рассчитан на читательскую аудиторию порядка 900000 человек, 55% которых будут составлять женщины, а медиана дохода его читателей равна $50000. Данные в уравнение прогнозирования необходимо подставить в той же форме, что и в исходной совокупности данных (т.е. той, исходя из которой и строилось уравнение регрессии): X1 = 900 (читательская аудитория в тысячах человек), X2 = 45 (процент мужчин) и X3 = $50000 (медиана дохода). Прогнозируемое значение для этой ситуации определяется следующим образом:
прогнозируемый тариф на размещение рекламы в журнале «Популярная статистика» =
= 4043 +3,79(читательская аудитория) –124(процент мужчин) +0,903(медиана дохода) =
= 4043 + 3,79 ´ 900 – 124 ´ 45 + 0,903 ´ 50000 = $47024.
Разумеется, рассчитывать на то, что тариф на размещение рекламы в журнале составит ровно $47024, не приходится. Во-первых, даже между журналами, данными о которых мы располагаем, наблюдаются случайные колебания, поэтому прогнозы не являются идеальными даже для них. Во-вторых, прогнозы могут быть полезны лишь в той мере, в какой прогнозируемый журнал подобен журналам, принадлежащим к исходной совокупности данных. Если речь идет о новом журнале, то тариф на размещение рекламы в этом журнале может определяться не так, как для журналов с уже устоявшейся репутацией, которые мы использовали для построения уравнения регрессии.
С помощью этого уравнения можно также прогнозировать тарифы для журналов, принадлежащих к исходной совокупности данных. У первого журнала, «Audubon» X1 = 1645 (читательская аудитория равна примерно 1,6 миллиона человек), X2 = 51,1 (т.е. 51,1% читателей этого журнала — мужчины) и X3 = 38787 (медиана годового дохода читателей этого журнала составляет $38787). Прогнозируемое значение для этого журнала можно найти по следующей формуле:
прогнозируемый тариф на размещение рекламы в журнале «Audubon» =
= 4043 +3,79(читательская аудитория) –124(процент мужчин) +0,903(медиана дохода) =
= 4043 + 3,79 ´ 1 645 – 124 ´ 51,1 + 0,903 ´ 38787 = $38966.
Остаток, или ошибка прогнозирования, определяется по формуле: Y–(прогнозируемое значение Y).
Для журнала, принадлежащего к исходной совокупности данных, этот показатель равняется фактическому тарифу минус прогнозируемый тариф. Для журнала «Audubon» фактический тариф составляет $25315, а прогнозируемый тариф – $38966. Таким образом, ошибка прогнозирования равна 25315 – 38966 = –$13651. Отрицательный остаток указывает на то, что фактический тариф меньше прогнозируемого (в случае журнала Audubon примерно на $14000). Для многих из нас $14000 – огромные деньги; неплохо бы взглянуть на другие ошибки прогнозирования, чтобы понять, в какой мере прогнозирование отражает реальную ситуацию. Почему рекламные тарифы в журнале Audubon оказались намного меньше их ожидаемой величины? Скорее всего, потому, что для прогнозирования использовалось лишь k = 3 из множества возможных факторов, влияющих на величину рекламных тарифов (к тому же многие из этих факторов не очень понятны и их довольно сложно измерить).