Основы регрессионного анализа. Парная линейная регрессия
[-251,099; - 146,661]
Для параметра q1 доверительный интервал будет выглядеть следующим образом:
[7,452-2,069*0,779; 7,452+2,069*0,779]
[5,84; 9,06]
Таким образом, параметры составленного уравнения парной регрессии являются значимыми. То есть взаимосвязь между количеством выпитого пива и средней температурой в
день охоты можно описать уравнением линейной регрессии, а незначительные отклонения возможных значений параметров от их МНК-оценок позволяют принять данные оценки в качестве хороших приближений к реальным параметрам.
Задание 3: Проверить значимость модели (уравнение регрессии) в целом с помощью критерия Фишера. Сформулировать выводы.
Для начала найдём коэффициент детерминации:
,
Где TSS = - полная сумма квадратов,
-общая сумма квадратов;
RSS = - сумма квадратов, обусловленная регрессией,
-объясненная сумма квадратов (сумма квадратов регрессии).
ESS = - остаточная сумма квадратов.
-остаточная сумма квадратов (сумма квадратов остатков)
= 15504,60+3457,033=18862,64
Так как RSS>>ESS, то остатки регрессии невелики.
Можно сделать предварительный вывод о том, что разброс значений относительно линии регрессии также невелик, и уравнение достаточно точно описывает наблюдаемые данные.
Коэффициент детерминации показывает, насколько модель объясняет исходные данные, следовательно, исходя из полученного коэффициента, можно отметить, что наша модель объясняет исходные данные о наличии зависимости количества выпитого пива от температуры на 82%.
В данном случае нельзя точно утверждать, что такое значение коэффициента детерминации означает достаточную пригодность уравнения регрессии, поэтому проверим его на значимость по критерию Фишера на 5% -ном уровне значимости.
Проверим значимость модели в целом по F - критерию:
Чтобы проверить значимость модели, необходимо проверить гипотезу:
Найдем F-статистику по формуле:
Из таблицы находим значение:
Если , то гипотеза отвергается с вероятностью 0,95.
В нашем случае 102,495 > 4,28, значит, гипотеза отвергается с вероятностью 95%.
Из проведенного анализа можно сделать вывод, что наша модель значима, и связь между количеством выпитого пива и температурой воздуха можно описать уравнением:
Y= - 193,558+7,495x
Задание. Построить таблицу дисперсионного анализа.
Источник дисперсии |
Число степеней свободы |
Сумма квадратов |
F-факт. |
F-табл. |
Значимость |
Средняя сумма квадратов |
Объясненная дисперсия |
1 |
15405,60 |
102,495 |
4,279344 |
Да |
15405,60 |
Остаточная дисперсия |
23 |
3457,033 |
- |
- |
- |
150,305 |
Общая дисперсия |
24 |
18862,64 |
- |
- |
- |
785,94 |
Задание 5: Выбрать прогнозную точку Xп в стороне от основного массива исходных данных. Используя уравнение регрессии, выполнить точечный и интервальный прогнозы величины Y в точке Xп. Проанализировать полученные результаты.
Выберем в качестве прогнозной точки значение xп=42°С. Тогда прогнозируемое значение количества выпитого Робинзоном пива будет равно:
yп = - 193,558+7,495 *42= 121,23.
Это значит, что при температуре 420С Робинзон должен выпить 121,23% от объема фляги. Выполним интервальный прогноз.
Для оценки точности прогноза необходимо вычислить стандартную ошибку прогноза по формуле:
= 7,462; tкр (0,05; 23) =2,069
Границы доверительного интервала найдем по формуле:
Получим [121,23-2,069*7,462; 121,23+2,069*7,462].
доверительный интервал дляY: [105,79; 136,67]
То есть при температуре 420С количество выпитого пива с вероятностью 95% колеблется в пределах от 105,79% до 136,67%.
Точечное прогнозирование показывает, что если температура будет равна 42 градусам, то Робинзону может быть недостаточно одной целой фляги пива для утоления жажды, т.к. объём выпитого пива выходит за рамки 100%.
Задание: Построить 95% -ный доверительный интервал для уравнения регрессии на всем диапазоне исходных данных.
i |
xi |
|
|
|
|
1 |
25 |
-6,182905484 |
6,056203037 |
-18,71318957 |
6,3473786 |
2 |
28 |
16,30221704 |
4,12461405 |
7,768390566 |
24,83604351 |
3 |
28 |
16,30221704 |
4,12461405 |
7,768390566 |
24,83604351 |
4 |
29 |
23,79725788 |
3,55664372 |
16,43856202 |
31,15595373 |
5 |
29 |
23,79725788 |
3,55664372 |
16,43856202 |
31,15595373 |
6 |
30 |
31,29229872 |
3,063192858 |
24,95455269 |
37,63004474 |
7 |
30 |
31,29229872 |
3,063192858 |
24,95455269 |
37,63004474 |
8 |
31 |
38,78733956 |
2,685656131 |
33,23071702 |
44,34396209 |
9 |
31 |
38,78733956 |
2,685656131 |
33,23071702 |
44,34396209 |
10 |
31 |
38,78733956 |
2,685656131 |
33,23071702 |
44,34396209 |
11 |
32 |
46,2823804 |
2,477601595 |
41,1562227 |
51,4085381 |
12 |
32 |
46,2823804 |
2,477601595 |
41,1562227 |
51,4085381 |
13 |
32 |
46,2823804 |
2,477601595 |
41,1562227 |
51,4085381 |
14 |
33 |
53,77742124 |
2,48202194 |
48,64211784 |
58,91272463 |
15 |
33 |
53,77742124 |
2,48202194 |
48,64211784 |
58,91272463 |
16 |
34 |
61,27246208 |
2,697872977 |
55,69056289 |
66,85436127 |
17 |
34 |
61,27246208 |
2,697872977 |
55,69056289 |
66,85436127 |
18 |
34 |
61,27246208 |
2,697872977 |
55,69056289 |
66,85436127 |
19 |
35 |
68,76750292 |
3,081033386 |
62,39284484 |
75,14216099 |
20 |
35 |
68,76750292 |
3,081033386 |
62,39284484 |
75,14216099 |
21 |
36 |
76,26254376 |
3,578152777 |
68,85934566 |
83,66574185 |
22 |
37 |
83,7575846 |
4,148463607 |
75,17441339 |
92,3407558 |
23 |
37 |
83,7575846 |
4,148463607 |
75,17441339 |
92,3407558 |
24 |
38 |
91,25262544 |
4,765761822 |
81,39226423 |
101,1129866 |
25 |
38 |
91,25262544 |
4,765761822 |
81,39226423 |
101,1129866 |
Другие рефераты на тему «Экономико-математическое моделирование»:
Поиск рефератов
Последние рефераты раздела
- Выборочные исследования в эконометрике
- Временные характеристики и функция времени. Графическое представление частотных характеристик
- Автоматизированный априорный анализ статистической совокупности в среде MS Excel
- Биматричные игры. Поиск равновесных ситуаций
- Анализ рядов распределения
- Анализ состояния финансовых рынков на основе методов нелинейной динамики
- Безработица - основные определения и измерение. Потоки, запасы, утечки, инъекции в модели