Интерпретация результатов многофакторного моделирования
Результат множественной регрессионного анализа тарифов на размещение рекламы в журналах. Коэффициенты регрессии и уравнение. Прогнозируемые значения функций и переменных. Данные в уравнение прогнозирования исходной совокупности данных в множествах.
Рубрика | Математика |
Вид | реферат |
Язык | русский |
Дата добавления | 29.09.2013 |
Размер файла | 30,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/ 9
Интерпретация результатов многофакторного моделирования
Пример. Реклама в журналах.
Название журнала |
Y, тариф (одна страница цветной рекламы), дол. |
X1, планируемая аудитория, тыс. человек |
Х2, процент мужчин |
Х3, медиана дохода семьи, дол |
|
Audubon |
25 315 |
1645 |
51,1 |
38 787 |
|
Better Homes & Gardens |
198 000 |
34 797 |
22,1 |
41933 |
|
Business Week |
103300 |
4760 |
68,1 |
63 667 |
|
Cosmopolitan |
94100 |
15 452 |
17,3 |
44 237 |
|
Elle |
55 540 |
3735 |
12,5 |
47 211 |
|
Entrepreneur |
40 355 |
2 476 |
60,4 |
47 579 |
|
Esquire |
51559 |
3037 |
71,3 |
44 715 |
|
Family Circle |
147 500 |
24 539 |
13,0 |
38 759 |
|
first For Women |
28 059 |
3 856 |
3,6 |
43 850 |
|
Forbes |
59 340 |
4191 |
68,8 |
66 606 |
|
Fortune |
60800 |
3 891 |
68,8 |
58 402 |
|
Glamour |
85 080 |
10891 |
7,8 |
46331 |
|
Goff Digest |
98760 |
6 250 |
78,9 |
61323 |
|
Good Housekeeping |
166 080 |
25 306 |
12,6 |
38 335 |
|
Gourmet |
49 640 |
4484 |
29,6 |
57 060 |
|
Harper's Bazaar |
52 805 |
2 621 |
11,5 |
44 992 |
|
Inc. |
70 825 |
2166 |
66,9 |
72493 |
|
Kiplinger's Personal Finance |
46580 |
3332 |
65,1 |
63 876 |
|
Ladies' Home Journal |
127 000 |
17040 |
6,8 |
38442 |
|
Life |
63 750 |
14 220 |
46,9 |
41770 |
|
Mademoiselle |
55 910 |
4804 |
8,0 |
46694 |
|
Martha Stewart's Living |
93 328 |
4 849 |
16,6 |
61890 |
|
McCalls |
113120 |
16301 |
7,6 |
33 823 |
|
Money |
98 250 |
9805 |
60,6 |
60549 |
|
Motor Trend |
79 800 |
5 281 |
88,5 |
48 739 |
|
National Geographic |
159345 |
32158 |
53,0 |
44 326 |
|
Natural History |
20180 |
1775 |
45,0 |
41499 |
|
Newsweek |
148 800 |
20 720 |
53,5 |
53 025 |
|
Parents Magazine |
72 820 |
12064 |
18,2 |
39369 |
|
PC Computing |
40 675 |
4606 |
67,0 |
57 916 |
|
People |
125 000 |
33 668 |
34,0 |
46171 |
|
Popular Mechanics |
78685 |
9036 |
86,9 |
40802 |
|
Reader's Digest |
193000 |
51925 |
42,4 |
38 060 |
|
Redbook |
95 785 |
13 212 |
8,9 |
41 156 |
|
Rolling Stone |
78 920 |
8 638 |
59,8 |
43 212 |
|
Runner's World |
36 850 |
2 078 |
62,9 |
60 222 |
|
Scientific American |
37 500 |
2 704 |
70,0 |
62372 |
|
Seventeen |
71 115 |
5 738 |
17,0 |
37 034 |
|
Ski |
32 480 |
2 249 |
64,5 |
58 629 |
|
Smart Money |
42 900 |
2 224 |
63,4 |
57170 |
|
Smithsonian |
73 075 |
8 253 |
47,9 |
50872 |
|
Soap Opera Digest |
35 070 |
7 227 |
10,3 |
31835 |
|
Sports Illustrated |
162 000 |
21602 |
78,8 |
45 897 |
|
Sunset |
56 000 |
5 276 |
38,7 |
52 524 |
|
Teen |
53 250 |
3 057 |
15,4 |
42640 |
|
The New Yorker |
62 435 |
3 223 |
48,9 |
49672 |
|
Time |
162 000 |
22 798 |
52,4 |
49166 |
|
True Story |
17100 |
3582 |
12,2 |
15734 |
|
TV Guide |
146400 |
40917 |
42,8 |
37 396 |
|
U.S. News & World Report |
98 644 |
9 825 |
57,5 |
52 018 |
|
Vanity Fair |
67 890 |
4 307 |
27,7 |
52189 |
|
Vogue |
63 900 |
8434 |
12,9 |
44 242 |
|
Woman's Day |
137 000 |
22 747 |
6,7 |
38463 |
|
Working Woman |
87 500 |
3312 |
6,3 |
44 674 |
|
YM |
73 270 |
3109 |
14,4 |
43 696 |
|
Среднее значение |
83 534 |
10913 |
39,7 |
47 710 |
|
Среднеквадратичное отклонение |
45446 |
11212 |
25,9 |
10 225 |
Тарифы на размещение рекламных объявлений в журналах определяются каждым журналом самостоятельно. Чем объясняются различия в тарифах? Возможно, здесь каким-то образом учитывается ценность рекламного объявления для рекламодателя. Журналы, располагающие большей читательской аудиторией (при равных прочих условиях), наверное, вправе устанавливать большие тарифы. Кроме того, журналы, рассчитанные на более состоятельные круги читателей, также вправе устанавливать более высокие тарифы. Несмотря то что наверняка имеются и другие, не менее важные факторы, мы ограничимся лишь указанными двумя, добавив к ним еще один -- предпочтения людей разного пола, и выясним, изменяют ли журналы свои тарифы в зависимости от соотношения мужчин и женщин в их читательской аудитории. Ответы на некоторые из этих вопросов можно получить с помощью множественного регрессионного анализа. Такой анализ поможет нам объяснить влияние на тарифы таких факторов, как величина читательской аудитории, структура читательской аудитории по полу и доходы читателей.
В табл. 3 представлена соответствующая многомерная совокупность данных, которую нам предстоит проанализировать. В качестве переменной У (объясняемой) мы будем рассматривать стоимость одной страницы одноразовой полноцветной рекламы. Объясняющими переменными будут Х1, читательская аудитория (планируемая в тысячах человек), Х2, процент мужчин среди планируемой аудитории, и Х3, медиана дохода семьи. Размер выборки n = 55.
В табл. 1 представлена компьютерная распечатка результатов анализа множественной регрессии. Например, с помощью Excel можно выполнить анализ множественной регрессии. Найдите пункт Data Analysis (Анализ данных) в меню Tools (Сервис) и выберите команду Regression (Регрессия). Если в меню Tools (Сервис) отсутствует пункт Data Analysis (Анализ данных), то сначала убедитесь, что вы выбрали ячейку электронной таблицы (а не график, например). Если вы все же не можете найти Data Analysis (Анализ данных), поищите пункт меню Add-Ins (Надстройки) и поставьте отметку возле Analysis ToolPak (Пакет анализа). Если это не поможет, то, видимо, необходимо переустановить Excel.
Таблица 1. Результат множественной регрессионного анализа тарифов на размещение рекламы в журналах (вычисления сделаны в Excel)
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множествен. R |
0,887 |
||||||
R-квадрат |
0,787 |
||||||
Нормированный R-квадрат |
0,775 |
||||||
Стандартная ошибка |
21577,870 |
||||||
Наблюдения |
55 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
3 |
87780733202 |
29260044401 |
62,843 |
0,000000 |
||
Остаток |
51 |
23745829151 |
465604493 |
||||
Итого |
54 |
111525962353 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
4042,799 |
16884,039 |
0,239 |
0,812 |
-29853,298 |
37938,895 |
|
Переменная X 1 |
3,788 |
0,281 |
13,484 |
0,000 |
3,224 |
4,352 |
|
Переменная X 2 |
-123,634 |
137,849 |
-0,897 |
0,374 |
-400,377 |
153,108 |
|
Переменная X 3 |
0,903 |
0,370 |
2,442 |
0,018 |
0,161 |
1,645 |
|
Коэффициенты регрессии и уравнение регрессии
Сдвиг, или постоянный член, а, и коэффициенты регрессии, b1, b2, и b3, вычисляются компьютером с использованием метода наименьших квадратов.
Среди всех возможных вариантов уравнения регрессии с различными значениями этих коэффициентов именно уравнение, найденное таким методом, обеспечивает минимальную сумму квадратов ошибок прогнозирования для рассматриваемой нами выборки журналов. Уравнение регрессии (или уравнение прогнозирования) имеет следующий вид:
(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 = $4043 + 3,79(читательская аудитория) - 124(процент мужчин) + 0,903(медиана дохода).
Сдвиг, а = $4 043, интерпретируется следующим образом: типичный тариф на размещение одностраничного цветного рекламного объявления в журнале, у которого нет платных подписчиков, нет мужчин среди читателей и читатели не имеют дохода, составляет $4043. Однако в рассматриваемой нами совокупности данных нет подобных журналов, поэтому сдвиг, а, следует рассматривать лишь как вспомогательную величину, необходимую для получения оптимальных прогнозов, но не интерпретировать это значение так буквально.
Коэффициенты регрессии интерпретируются как влияние каждой из переменных на размер тарифа, если все другие независимые («объясняющие») переменные остаются неизменными. Часто это значение включает «поправку на» другие независимые переменные, или «контролирование» этих других независимых переменных. Поэтому коэффициент регрессии для конкретной X-переменной может изменяться (иногда значительно) в результате включения в анализ или исключения других Х- переменных. В частности, каждый коэффициент регрессии определяет среднее увеличение тарифа на размещение рекламы, приходящееся на единичное увеличение соответствующей ему Х- переменной (в данном случае термин «единичное» означает одну единицу измерения конкретной Х- переменной).
Коэффициент регрессии для размера читательской аудитории, b1=3,79, указывает, что - при всех прочих равных условиях - журнал с дополнительной тысячью читателей (поскольку у нас X1 измеряется в тысячах человек) берет (в среднем) на $3,79 больше за размещение одностраничного цветного рекламного объявления. Можно также считать, что коэффициент регрессии для размера читательской аудитории означает, что каждый дополнительный читатель увеличивает для этого журнала тариф на размещение рекламных объявлений на $0,00379, т.е. увеличение составляет чуть меньше половины цента на одного человека. Поэтому, если у какого-то другого журнала такой же процент читателей-мужчин и такой же показатель медианы дохода семьи читателей, но читательская аудитория на 3548 человек больше, то можно ожидать, что тариф на размещение рекламных объявлений в этом журнале будет (в среднем) на 3,79 Ч 3,548 = $13,45 больше благодаря такому отличию размера читательской аудитории.
Коэффициент регрессии для процента мужчин, b2 = -124, указывает, что (при всех прочих равных условиях) тариф на размещение цветных рекламных объявлений в журнале с дополнительным 1% читателей-мужчин окажется (в среднем) на $124 меньше. Это означает, что читательницы представляют для журнала большую ценность, чем читатели-мужчины. Статистический вывод должен подтвердить или опровергнуть эту гипотезу путем сравнения величины влияния процента мужчин (т.е. -$124) с тем, на что можно было бы рассчитывать, если бы при данных обстоятельствах все определялось лишь чистой случайностью.
Коэффициент регрессии для медианы дохода, b3 = 0,903, указывает, что (при всех прочих равных условиях) в журнале с дополнительным долларом медианы дохода его читателей тариф на размещение одностраничного цветного рекламного объявления будет (в среднем) на $0,903 больше. Положительный знак этого коэффициента совершенно оправдан, поскольку люди с более высоким уровнем доходов могут позволить себе тратить больше на покупку рекламируемой продукции. Если у какого-то другого журнала такой же процент читателей-мужчин и такая же величина читательской аудитории, но медиана дохода семей читателей на $4 000 выше, то можно ожидать, что тариф этого журнала на размещение рекламных объявлений будет на 0,903 Ч 4000 = $3612 выше (в среднем) благодаря более высокому уровню доходов его читателей.
Помните, что коэффициенты регрессии отражают влияние на Y одной X- переменной при условии, что все другие Х- переменные остаются неизменными. Это следует понимать буквально.
Например, коэффициент регрессии b3 отражает влияние медианы дохода читателей на рекламные тарифы; он вычисляется при неизменных величинах читательской аудитории и процента читателей-мужчин. В таком случае более высокие уровни доходов читателей, как правило, ведут к установлению более высоких тарифов на размещение рекламных объявлений (поскольку b3 является положительным числом) - при фиксированных размере читательской аудитории и проценте читателей-мужчин.
Какой была бы эта взаимосвязь, если бы остальные переменные (размер читательской аудитории и процент читателей-мужчин) не фиксировались на постоянном уровне? На этот вопрос можно ответить, проанализировав обычный коэффициент корреляции (или коэффициент регрессии, прогнозирующий Y на основании только одной этой Х- переменной), вычисленный только для двух переменных: тарифа и медианы дохода. В нашем случае более высокое значение медианы дохода фактически ассоциируется с более низким тарифом (корреляция тарифа и медианы дохода является отрицательной: -0,167)! Чем это объяснить? Вполне приемлемое объяснение заключается в том, что журналы, ориентирующиеся на читателей с более высоким средним уровнем доходов, не в состоянии обеспечить себе массовую аудиторию из-за того, что богатых людей среди населения страны в целом не так уж много. Если же эта читательская аудитория богатых людей окажется очень небольшой, это может вообще исказить эффект влияния высокого уровня доходов в расчете на одного читателя.
Прогнозы
Уравнение прогнозирования, или уравнение регрессии, определяется в следующем виде:
прогнозируемое значение Y = а + b1X1 + b2X2 + ... + bkXk ,
В нашем примере с рекламными объявлениями в журналах, чтобы найти прогнозируемую величину тарифа на размещение рекламных объявлений исходя из величины читательской аудитории, процента читателей-мужчин и медианы дохода читателей для конкретного журнала, подобного тем, которые составляют рассматриваемую нами выборку данных, подставим в уравнение прогнозирования соответствующие этому журналу значения Х- переменных:
(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 = $4043 + 3,79(читательская аудитория) - 124(процент мужчин) + 0,903(медиана дохода).
множественный регрессионный прогнозирование
Допустим, например, что вы собираетесь основать новый журнал, «Популярная статистика», который рассчитан на читательскую аудиторию порядка 900000 человек, 55% которых будут составлять женщины, а медиана дохода его читателей равна $50000. Данные в уравнение прогнозирования необходимо подставить в той же форме, что и в исходной совокупности данных (т.е. той, исходя из которой и строилось уравнение регрессии): X1 = 900 (читательская аудитория в тысячах человек), X2 = 45 (процент мужчин) и X3 = $50000 (медиана дохода). Прогнозируемое значение для этой ситуации определяется следующим образом:
прогнозируемый тариф на размещение рекламы в журнале «Популярная статистика» = 4043 +3,79(читательская аудитория) -124(процент мужчин) +0,903(медиана дохода) = 4043 + 3,79 900 - 124 45 + 0,903 50000 = $47024.
Разумеется, рассчитывать на то, что тариф на размещение рекламы в журнале составит ровно $47024, не приходится. Во-первых, даже между журналами, данными о которых мы располагаем, наблюдаются случайные колебания, поэтому прогнозы не являются идеальными даже для них. Во-вторых, прогнозы могут быть полезны лишь в той мере, в какой прогнозируемый журнал подобен журналам, принадлежащим к исходной совокупности данных. Если речь идет о новом журнале, то тариф на размещение рекламы в этом журнале может определяться не так, как для журналов с уже устоявшейся репутацией, которые мы использовали для построения уравнения регрессии.
С помощью этого уравнения можно также прогнозировать тарифы для журналов, принадлежащих к исходной совокупности данных. У первого журнала, «Audubon» X1 = 1645 (читательская аудитория равна примерно 1,6 миллиона человек), X2 = 51,1 (т.е. 51,1% читателей этого журнала -- мужчины) и X3 = 38787 (медиана годового дохода читателей этого журнала составляет $38787). Прогнозируемое значение для этого журнала можно найти по следующей формуле:
прогнозируемый тариф на размещение рекламы в журнале «Audubon» = 4043 +3,79(читательская аудитория) -124(процент мужчин) +0,903(медиана дохода) = 4043 + 3,79 1 645 - 124 51,1 + 0,903 38787 = $38966.
Остаток, или ошибка прогнозирования, определяется по формуле: Y - (прогнозируемое значение Y).
Для журнала, принадлежащего к исходной совокупности данных, этот показатель равняется фактическому тарифу минус прогнозируемый тариф. Для журнала «Audubon» фактический тариф составляет $25315, а прогнозируемый тариф - $38966. Таким образом, ошибка прогнозирования равна 25315 - 38966 = -$13651. Отрицательный остаток указывает на то, что фактический тариф меньше прогнозируемого (в случае журнала Audubon примерно на $14000). Для многих из нас $14000 - огромные деньги; неплохо бы взглянуть на другие ошибки прогнозирования, чтобы понять, в какой мере прогнозирование отражает реальную ситуацию. Почему рекламные тарифы в журнале Audubon оказались намного меньше их ожидаемой величины? Скорее всего, потому, что для прогнозирования использовалось лишь k = 3 из множества возможных факторов, влияющих на величину рекламных тарифов (к тому же многие из этих факторов не очень понятны и их довольно сложно измерить).
Насколько хороши наши прогнозы?
Этот раздел следует рассматривать в основном как обзор, поскольку стандартное отклонение оценки, Se , и коэффициент детерминации, R2, имеют для множественной регрессии, вообще говоря, ту же интерпретацию, что и для простой (парной) регрессии. Единственное отличие заключается в том, что ваши прогнозы теперь базируются на нескольких X- переменных. Но все остается очень похоже, поскольку вы по-прежнему прогнозируете только одну переменную Y.
Размещено на Allbest.ru
...Подобные документы
Характеристика экзогенных и эндогенных переменных. Теорема Гаусса-Маркова. Построение двухфакторного и однофакторных уравнения регрессии. Прогнозирование значения результативного признака. Оценка тесноты связи между результативным признаком и факторами.
курсовая работа [575,5 K], добавлен 19.05.2015Решение системы линейных уравнений методами Крамера, обратной матрицы и Гаусса. Расчет длин и скалярного произведения векторов. Уравнение прямой, проходящей через точку параллельно направляющему вектору. Расчет производных функций одной и двух переменных.
контрольная работа [984,9 K], добавлен 19.04.2013Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Дифференциальное уравнение Бесселя и его интегралы. Рекуррентные формулы для данных функций. Применение теоремы Коши к интегралу Пуассона. Некоторые применения функций Бесселя. Задача на тепловое равновесие. Дифференциальное уравнение второго порядка.
курсовая работа [4,3 M], добавлен 06.06.2013Метод координат. Основные задачи аналитической геометрии на прямой и на плоскости. Основные линии второго порядка. Алгебраическая и геометрическая интерпретация векторов. Уравнение поверхности и уравнение линии в пространстве. Общее уравнение плоскости.
учебное пособие [687,5 K], добавлен 04.05.2011Определение гипергеометрического ряда, свойства его функции и представление уравнения. Дифференциальное уравнение для вырожденной гипергеометрической функции и его интегралы. Представление различных функций через вырожденные гипергеометрические функции.
курсовая работа [470,9 K], добавлен 27.11.2010Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.
контрольная работа [1,2 M], добавлен 05.08.2010Изложение теории бесселевых функций, их приложения к уравнениям математической физики. Виды цилиндрических функций. Применение бесселевых функций в математической физике на примере некоторых задач. Уравнение Лапласа в цилиндрических координатах.
дипломная работа [226,4 K], добавлен 09.10.2011Обобщенная функция, заданная на прямой, - всякий непрерывный линейный функционал на пространстве основных функций. Комплекснозначная функция действительного переменного, называемая оригиналом. Характеристика функции Грина. Линейное неоднородное уравнение.
реферат [134,4 K], добавлен 23.01.2011Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.
контрольная работа [380,9 K], добавлен 05.04.2015Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
курсовая работа [352,9 K], добавлен 26.01.2010Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Уравнение с разделяющимися переменными. Однородные и линейные дифференциальные уравнения. Геометрические свойства интегральных кривых. Полный дифференциал функции двух переменных. Определение интеграла методами Бернулли и вариации произвольной постоянной.
реферат [111,0 K], добавлен 24.08.2015Методы решений иррациональных уравнений. Метод замены переменных. Линейные комбинации двух и более радикалов. Уравнение с одним радикалом. Умножение на сопряженное выражение. Метод решения уравнений путем выделения полных квадратов под знаком радикала.
контрольная работа [116,6 K], добавлен 15.02.2016Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.
контрольная работа [68,7 K], добавлен 21.09.2009Способы задания прямой на плоскости. Уравнение с угловым коэффициентом. Рассмотрение частных случаев. Уравнение прямой, проходящей через заданную точку в заданном направлении. Построение графика прямой, проходящей через две точки. Рассмотрение примера.
презентация [104,9 K], добавлен 21.09.2013История комплексных чисел. Соглашение о комплексных числах. Геометрический смысл сложения и вычитания комплексных чисел. Геометрическая интерпретация комплексных чисел. Длина отрезка. Уравнение высших степеней, уравнение деления круга на пять частей.
реферат [325,7 K], добавлен 25.10.2012Метод интегрирования по частям. Задача на нахождение частных производных 1-го порядка. Исследование на экстремум заданную функцию. Нахождение частных производных. Неоднородное линейное дифференциальное уравнение 2-го порядка. Условия признака Лейбница.
контрольная работа [90,0 K], добавлен 24.10.2010Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014Прямолинейные, обратные и криволинейные связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Метод наименьших квадратов. Оценка значимости коэффициентов регрессии. Проверка адекватности модели по критерию Фишера.
курсовая работа [232,7 K], добавлен 21.05.2015