Применение математики в статистике
3) оценка неизвестных значений зависимой переменной.
По аналитическому выражению различают прямолинейную и криволинейную связи.
Прямолинейная связь имеет место, когда с возрастанием (или убыванием) значений Х значения Y увеличиваются (или уменьшаются) более или менее равномерно.
В этом случае уравнение связи записывается так:
`yх = b0 + b1х.
Криволинейная форма связи может в
ыражаться различными кривыми, из которых простейшими являются:
1) парабола второго порядка
`yх = b0 + b1х +b2х2;
2) гипербола
`yx =b0+b1 /x;
3) показательная
`yx = b0b1x;
либо в логарифмическом виде
ln`yx = lnb0 + xlnb1.
После определения формы связи, т.е. вида уравнения регрессии, по эмпирическим данным определяют параметры искомого уравнения.
При этом отыскиваемые параметры должны быть такими, чтобы рассчитанные по уравнению теоретические значения результативного признака максимально приближались к эмпирическим данным.
Чаще всего определение параметров уравнения регрессии осуществляется с помощью метода наименьших квадратов, в котором предполагается, что сумма квадратов отклонений теоретических значений от эмпирических должна быть минимальной,
В зависимости от формы связи в каждом конкретном случае определяется своя система уравнений, удовлетворяющая принципу минимизации.
Предположение о парной линейной зависимости между Х и Y можно описать функцией
Y = b0 + b1Х + и,
где b0, b1 – истинные значения параметров уравнения регрессии в генеральной совокупности; и – случайная составляющая.
Существует несколько причин возникновения случайной составляющей:
1) невключение объясняющих переменных в уравнение регрессии;
2) агрегирование объясняющих переменных, включенных в уравнение регрессии;
3) неправильное описание структуры модели, т.е. неверный выбор объясняющих переменных;
4) неправильная функциональная спецификация модели. Например, для моделирования использована линейная функция, в то время как зависимость между переменными – нелинейная;
5) ошибки наблюдения (ошибки данных).
По выборочным данным определяются оценки истинных (в случае правильной спецификации модели) параметров уравнения регрессии и случайной составляющей
`yx=b0+b1х+e
где b0, b1, е – оценки неизвестных b0, b1, и. В случае парной линейной зависимости вида
`yx=b0+b1х
В настоящее время необходимость в ручных расчетах отпала, так как существует множество компьютерных программ, реализующих методы регрессионного анализа. Важно понимать смысл параметров и уметь их адекватно интерпретировать.
На основе уравнений регрессии часто рассчитывают коэффициенты эластичности результативного признака относительно факторного.
Коэффициент эластичности (Э) показывает, на сколько процентов в среднем изменится результативный признак Y при изменении факторного признака Х на 1%.
Рассмотрим методы регрессионного и корреляционного анализов. Предположим, что нас интересует выручка от продажи баночного пива в магазинах города в течение дня. Мы провели исследование в 20 случайно выбранных магазинах и получили следующие данные (табл. 6):
Таблица 6. Данные исследования
Номер магазина |
Число посетителей |
Выручка, у.е. |
1 |
907 |
11,20 |
2 |
926 |
11,05 |
3 |
506 |
6,84 |
4 |
741 |
9,21 |
5 |
789 |
9,42 |
6 |
889 |
10,08 |
7 |
874 |
9,45 |
8 |
510 |
6,73 |
9 |
529 |
7,24 |
10 |
420 |
6,12 |
11 |
679 |
7,63 |
12 |
872 |
9,43 |
13 |
924 |
9,46 |
14 |
607 |
7,64 |
15 |
452 |
6,92 |
16 |
729 |
8,95 |
17 |
794 |
9,33 |
18 |
844 |
10,23 |
19 |
1010 |
11,77 |
20 |
621 |
7,41 |
Итого |
14,623 |
176,11 |
Для прогноза объемов продаж применим простую модель парной регрессии, в которой используется только одна факторная переменная – Х (число посетителей магазина). С увеличением числа посетителей растет выручка от продажи. Рассчитаем параметры уравнения регрессии:
`yx =b0+b1x
Для облегчения расчетов воспользуемся табл. 7.
Таблица 7
Магазин |
Число покупателей X |
Выручка Y |
X2 |
Y2 |
XY |
1 |
907 |
11,20 |
822 649 |
125,4400 |
10 158,40 |
2 |
926 |
11,05 |
857 476 |
122,1025 |
10 232,30 |
3 |
506 |
6,84 |
256,036 |
46,7856 |
3461,04 |
4 |
741 |
9,21 |
549 081 |
84,8241 |
6 824,61 |
5 |
789 |
9,42 |
622 521 |
88,7364 |
7 432,38 |
6 |
889 |
10,08 |
790 321 |
101,6064 |
8961,12 |
7 |
874 |
9,45 |
763 876 |
89,3025 |
8 259,30 |
8 |
510 |
6,73 |
260 100 |
45,2929 |
3 432,30 |
9 |
529 |
7,24 |
279 841 |
52,4176 |
3 829,96 |
10 |
420 |
6,12 |
176 400 |
37,4544 |
2 570,40 |
11 |
679 |
7,63 |
461 041 |
58,2169 |
5 180,77 |
12 |
872 |
9,43 |
760 384 |
88,9249 |
8 222,96 |
13 |
924 |
9,46 |
853 776 |
89,4916 |
8 741,04 |
14 |
607 |
7,64 |
368 449 |
58,3696 |
4 637,48 |
15 |
452 |
6,92 |
204304 |
47,8864 |
3 127,84 |
16 |
729 |
8,95 |
531 441 |
80,1025 |
6 254,55 |
17 |
794 |
9,33 |
630 436 |
87,0489 |
7 408,02 |
18 |
844 |
10,23 |
712 336 |
104,6529 |
8634,12 |
19 |
1010 |
11,77 |
1 020 100 |
138,5329 |
11 887,70 |
20 |
621 |
7,41 |
385 641 |
54,9081 |
4 601,61 |
Итого |
14623 |
176,11 |
11 306 209 |
1 602,0971 |
134 127,90 |
Другие рефераты на тему «Математика»:
Поиск рефератов
Последние рефераты раздела
- Анализ надёжности и резервирование технической системы
- Алгоритм решения Диофантовых уравнений
- Алгебраическое доказательство теоремы Пифагора
- Алгоритм муравья
- Векторная алгебра и аналитическая геометрия
- Зарождение и создание теории действительного числа
- Вероятностные процессы и математическая статистика в автоматизированных системах