.F-критерий (F-test) r-статистика (/-statistic)
вычисленное, предсказанное, теоретическое значение (estimated, predicted value)
двойная перекрестная проверка (double cross-validation)
ковариация (covariance)
• коэффициент детерминации (coefficient of determination)
• коэффициент множественной детерминации (coefficient of multiple determination)
• коэффициент регрессии (regression coefficient)
• метод наименьших квадратов (least-squares procedure)
множественная регрессия (multiple regression)
модель множественной регрессии (multiple regression model)
мул ьти кол л и неарность (multicolli nearity)
неметрическая корреляция (nonmetric correlation)
нормированный коэффициент регрессии (standardized regression coefficient)
остаточный член, остаток (residual)
парная регрессионная модель (bivariate regression model)
парная регрессия (bivariate regression)
парный коэффициент корреляции г (product moment correlation, r)
перекрестная проверка (cross-validation)
поле корреляции (scattergram) пошаговая регрессия (stepwise regression) регрессионный анализ (regression analysis скорректированный R2 (adjusted R2) стандартная ошибка (standard error)
стандартная ошибка уравнения регресси (standard error of estimate)
сумма квадратов ошибок (sum of squared errors)
частичный коэффициент корреляции (part correlation coefficient)
частный F-критерий (partial /"-test)
частный коэффициент корреляции (partial correlation coefficient)
частный коэффициент регрессии (partia regression coefficient)
УПРАЖНЕНИЯ
Вопросы
1. Что такое парный коэффициент корреляции? Указывает ли его значение, равное 0, что i ременные не связаны между собой?
2. Что такое частный коэффициент корреляции?
3. В чем заключается основное применение регрессионного анализа?
4. Что такое метод наименьших квадратов?
5. Объясните значение нормированных коэффициентов регрессии.
6. Как измеряют тесноту связи при парной регрессии? А при множественной?
7. Что означает точность предсказания?
8. Что такое стандартная ошибка уравнения регрессии?
9. Какие допущения лежат в основе парной регрессии?
10. Что такое множественная регрессия?
11. Объясните, что такое частный коэффициент регрессии. Почему он так назван?
12. Сформулируйте нулевую гипотезу при проверке значимости общего уравнения множе венной регрессии. Как проверяют данную нулевую гипотезу?
13. Для чего нужен анализ остаточных членов?
14. Объясните, что такое метод пошаговой регрессии. Какова его цель?
15. Что такое Мультиколлинеарность? Какие проблемы могут возникнуть из-за мультикол. неарности?
16. Какие показатели используют для оценки относительной важности предикторов при м жественной регрессии?
17. Опишите метод перекрестной проверки. Опишите метод двойной перекрестной проверю
18. Продемонстрируйте эквивалентность регрессии с фиктивными переменными и одноф торного дисперсионного анализа (ANOVA).
Задачи
1. Руководство сети универмагов хочет определить, как влияют расходы на продвижение товаров, на конкурентоспособность сети. Из 15 штатов получены данные о расходах на продвижение относительно главного конкурента (расходы конкурента приняли за 100) и об объеме продаж относительно этого же конкурента (объем продаж конкурента принят за 100).
Перед вами поставлена задача — доложить руководству, существует ли какая-либо связь между относительными затратами на продвижение и относительным объемом продаж.
a) Постройте график зависимости относительных объемов продаж (по оси Y) от относительных расходов на продвижение (осьХ) и поясните полученный график.
b) Какой показатель использовать для установления связи между двумя переменными? Почему?
c) Выполните парный регрессионный анализ объемов продаж от относительных расходов на продвижение.
d) Поясните коэффициенты регрессии.
e) Значима ли регрессионная связь?
f) Если наша сеть имеет одинаковые расходы на продвижение со своим конкурентом (если относительные расходы на продвижение составили 100), то какими должны быть у нее объемы продаж?
g) Интерпретируйте полученное значение г2.
Номер штата Относительные расходы на продвижение Относительные объемы продаж
1 95 98
2 92 94
3 103 110
4 115 125
5 77 82
6 79 84
7 105 112
8 94 99
9 85 93
10 101 107
11 106 114
12 120 132
13 118 129
14 75 79
15 99 105
2. Чтобы понять роль влияния качества и цены товаров на количество постоянных посетителей магазинов, маркетологи собрали оценки 14 ведущих магазинов с точки зрения: предпочтения магазина, качества товара и приемлемости цен. Магазины оценивали по 11-балльной шкале, — чем больше балл, тем выше оценка.
Номер магазина Предпочтение Качество Цена
1 653
2 9 6 11
3 864
4 321
a) Выполните множественный регрессионный анализ, объясняющий предпочтения в ношении магазинов с точки зрения качества товара и цены.
b) Объясните частные коэффициенты регрессии.
c) Определите значимость всей регрессии.
d) Определите значимость частных коэффициентов регрессии.
e) Как вы считаете, является ли мул ьтиколл и неарность проблемой в данном случае? Г чему да или почему нет?
3. Вы прочли в журнале статью, в которой говорится, что между ежегодными затратами на товые обеды (PD) и годовым доходом (INC) существует следующая связь:
PD = 23,4 + 0,003 х INC
Коэффициент при переменной INC считается значимым.
a) Правдоподобна ли эта связь? Может ли коэффициент регрессии, небольшой по ве; чине, быть значимым?
b) Можете ли вы, исходя из предоставленной информации, сказать, хорошо ли разрабо на модель?
c) Чему равны ожидаемые затраты на готовые обеды для семьи, зарабатывающей 30 ты< долларов в год?
d) Если семья, зарабатывающая 40 тысяч долларов в год, тратит 130 долларов на готое обеды, то чему равен остаточный член?
e) В чем значение отрицательного остаточного члена?