Задачи Эконометрика

Задачи

Имеются следующие данные о технологических изменениях в экономике США в 1930 — 1939 гг.
Таблица-3 (вариант 8)
Технологические изменения в экономике США 1920 – 1939 гг (МодельСолоу):
Год 1920 1921 1922 1923 1924 1925 1926 1927 1928 1929
Q 0,721 0,770 0,788 0,809 0,836 0,872 0,869 0,871 0,874 0,895
k 2,58 2,55 2,49 2,61 2,74 2,81 2,87 2,93 3,02 3,06
A 1,069 1,146 1,183 1,196 1,215 1,254 1,241 1,235 1,226 1,251

q — совокупное производство в расчете на 1 человеко-час (производительность труда);
k — капиталовооруженность труда;
A — технологический индекс.

модель = + (У = ; Х= )

Для модели следует:

1) найти уравнение регрессии;
2) найти объясненную и необъясненную регрессией дисперсии;
3) найти дисперсии оценок регрессии D(a) и D(b);
4) найти коэффициент детерминации и скорректированный коэффициент корреляции;
5) проверить гипотезы о незначимости коэффициентов модели и о незначимости регрессии в целом.
6) найти доверительные интервалы для параметров регрессии на уровне значимости 95%.
Сделать выводы.

Решение.

Построим таблицу значений факторной переменной Х= и результативной переменной Y=q/A, а также расчетную таблицу:
t X У XУ Х2 У2
1 0,388 0,674 0,261 0,150 0,455
2 0,392 0,672 0,263 0,154 0,451
3 0,402 0,666 0,268 0,161 0,444
4 0,383 0,676 0,259 0,147 0,458
5 0,365 0,688 0,251 0,133 0,473
6 0,356 0,695 0,247 0,127 0,484
7 0,348 0,700 0,244 0,121 0,490
8 0,341 0,705 0,241 0,116 0,497
9 0,331 0,713 0,236 0,110 0,508
10 0,327 0,715 0,234 0,107 0,512
ВСЕГО 3,633 6,906 2,505 1,326 4,772
СРЕДНЯЯ 0,363 0,691 0,250 0,133 0,477

1) Найдем коэффициенты уравнения линии регрессии
Y=a+bX,
где дисперсии переменных X и Y равны
1,133 — (0,363)2 = 0,000641
0,000286,
а ковариация переменных X и Y равна
Cov(Х;У) = —  = 0,25 – 0,363*0,691 = -0,000428

b= -0,667;
= 0,691 – (-0,667*0,363) = 0,933.

Уравнение регрессии имеет вид
Y = 0,933 -0,667X

t
У= +bХ

e=У-У    

e2
(У- )2

1 0,6744019 0,000060 0,00000000 0,000263
2 0,6713592 0,000543 0,00000029 0,000371
3 0,6650539 0,001049 0,00000110 0,000653
4 0,6773746 -0,000953 0,00000091 0,000175
5 0,6895043 -0,001438 0,00000207 0,000001
6 0,6955707 -0,000196 0,00000004 0,000025
7 0,700535 -0,000293 0,00000009 0,000098
8 0,705296 -0,000033 0,00000000 0,000216
9 0,7120828 0,000805 0,00000065 0,000461
10 0,714971 0,000457 0,00000021 0,000593
ВСЕГО 6,9061496 0,00000536 0,002856
СРЕДНЯЯ 0,690615 0,00000054 0,000286

Построим эмпирические точки и линию регрессии

2) Найдем общую дисперсию, объясненную и необъясненную регрессией дисперсии по формулам:
общая дисперсия
= D(y) = — ( )2 = 0,477 — (0,691)2 = 0,000286
необъясненная регрессией часть дисперсии
 0,00000536 = 0,000000536
объясненная регрессией часть дисперсии
0,002856 = 0,0002856

3) Найдем дисперсии D( ) и D(b) для оценок коэффициентов регрессии:

       - несмещенная оценка дисперсии ошибок  2

            0,00000067
         D(b) = Sb2 =   =   = 0,000104
    D( ) = S  =  D(b) = 1,326  0,000104 = 0,000138
    S = 0,0102      и         S в= 0,0118    - средние квадратические отклонения оценок 

4)Найдем коэффициент детерминации
1 — = 0,998124
Значит, на 99,8 % изменения значений результативной переменной Y объясняется влиянием
факторной переменной X .

Коэффициент корреляции найдем по формуле:

,
где
0,0253; 0,0169; cov(Х;У) = -0,000428;
R= =-0,99906
Поскольку 0,7 R 1, то связь между значениями X и Y тесная.
Поскольку R < 0, то связь между Х и У обратная: со снижением значений Х средние значения У возрастают.

5) Проверим значимость коэффициентов регрессии. Для этого
а) проверим нулевую гипотезу Н: =0 на уровне доверия 95%
Используя t-статистику получим
t = = = = = -56,701
Критическое значение tc = t(n-k) найдем по таблицам распределения Стьюдента при = 0,95 и n=10 – 2 = 8 (10 – количество наблюдений переменных Х и У)
tc = 2,306
Поскольку = -56,701 < tc = 2,306, то гипотеза Н: =0 о том, что между величинами Х и У есть линейная зависимость, должна быть отвергнута на уровне доверия 95%.

 б) Проверим нулевую гипотезу   Н:  =0

Используя t-статистику получим
t = = = = = 91,308
Критическое значение статистики при  = 0,95 и n = 10 – 2 = 8 равно
tc = 2,306
Поскольку = 74,27  tc = 2,306, то гипотеза Н: =0 должна быть отвергнута на уровне доверия 95%, т.е. с вероятностью 95 % можно утверждать, что 0

Проверим гипотезу о значимости линейной регрессии с помощью F – статистики.
F = = = = 4264,01
(Можно F рассчитать по другой формуле:
F =  =  = 4256,01
Критическое значение статистики на 95 % уровне доверия находим по таблице распределения Фишера:
Fc = F(k-1; n-k) = F(1; 8) = 5,32
Поскольку F  Fc, то гипотеза Н: =0 отвергается и принимается альтернативная гипотеза Н1: 0 на уровне доверия 95%, т.е. модель значима.

  1. а) Найдем доверительный интервал для на уровне доверия 95%. Для этого рассчитаем значение t-статистики
    t = =
    Критическое значение tc найдем по таблицам распределения Стьюдента при = 0,95 и n=10–2 = 8
    tc = 2,306
    Решая неравенство  tc = 2,306 получим:
     2,306
     2,306 0,0117
    0,667 — 0,027  0,667 + 0,027
    0,64  0,689
    С вероятностью 95% можно утверждать, что значение параметра лежит в промежутке
    (0,64; 0,689) б) Найдем доверительный интервал для на уровне доверия 95%. Для этого рассчитаем значение t-статистики
    t = ==
    Критическое значение tc найдем по таблицам распределения Стьюдента при = 0,95 и n = 10 – 2 = 8
    tc = 2,306
    Решая неравенство  tc = 2,306 получим:
     2,306
     2,306  0,0102
    0,993 — 0,024   0,993 + 0,024
    0,969   1,017
    С вероятностью 95% можно утверждать, что значение параметра лежит в промежутке
    (0,969; 1,017)

Задача 2. Построить статистическую модель
ln q = + ln A + / k (У= ln q; Х = ln A; X = 1/ k)

1) найти уравнение регрессии;
2) найти объясненную и необъясненную регрессией дисперсии;
3) найти коэффициент детерминации и скорректированный коэффициент корреляции;
4) найти частные коэффициенты корреляции.
5) проверить гипотезы о незначимости коэффициентов модели и о незначимости регрессии в целом.
6) найти доверительные интервалы для параметров регрессии на уровне значимости 95%.
7) проверить на наличие мультиколинеарности.
Сделать выводы.

Решение.
Построим таблицу значений факторных переменных Х2 = ln A, Х3 = 1/ k и результативной переменной Y= ln q.
T X2 Х3 У Х
Х
У
Х Х

1 0,0667 0,3876 -0,3271 0,0045 0,1502 0,1070 0,0259

2 0,1363 0,3922 -0,2614 0,0186 0,1538 0,0683 0,0534
3 0,1681 0,4016 -0,2383 0,0282 0,1613 0,0568 0,0675
4 0,1790 0,3831 -0,2120 0,0320 0,1468 0,0449 0,0686
5 0,1947 0,3650 -0,1791 0,0379 0,1332 0,0321 0,0711
6 0,2263 0,3559 -0,1370 0,0512 0,1266 0,0188 0,0805
7 0,2159 0,3484 -0,1404 0,0466 0,1214 0,0197 0,0752
8 0,2111 0,3413 -0,1381 0,0446 0,1165 0,0191 0,0720
9 0,2038 0,3311 -0,1347 0,0415 0,1096 0,0181 0,0675
10 0,2239 0,3268 -0,1109 0,0502 0,1068 0,0123 0,0732
ВСЕГО 1,8258 3,6330 -1,8789 0,3553 1,3263 0,3971 0,6549
СРЕДНЯЯ 0,1826 0,3633 -0,1879 0,0355 0,1326 0,0397 0,0655

t
Х У

Х У
У= +

  • Х +
  • Х

e=У-У
e2
(У- )2

1 -0,0218 -0,1268 -0,3603
0,0332 0,00110 0,02031
2 -0,0356 -0,1025 -0,2925
0,0311 0,00097 0,00558
3 -0,0400 -0,0957 -0,2683
0,0301 0,00090 0,00255
4 -0,0379 -0,0812 -0,2399
0,0280 0,00078 0,00049
5 -0,0349 -0,0654 -0,2068
0,0276 0,00076 0,00012
6 -0,0310 -0,0487 -0,1656
0,0287 0,00082 0,00273
7 -0,0303 -0,0489 -0,1695
0,0291 0,00085 0,00233
8 -0,0292 -0,0471 -0,1680
0,0299 0,00089 0,00249
9 -0,0274 -0,0446 -0,1661
0,0315 0,00099 0,00267
10 -0,0248 -0,0363 -0,1412
0,0303 0,00092 0,00587
ВСЕГО -0,3131 -0,6972 -2,1783 0,2994 0,0090 0,0451
СРЕДНЯЯ -0,0313 -0,0697 -0,2178 0,0299 0,0009 0,0045

  1. Найдем коэффициенты уравнения линии регрессии
    Y= + Х + Х
    Как решение системы уравнений
    = + +
    = + +
    = + + -0,1879 = + 0,1826 + 0,3633 -0,0313 = 0,1826 + 0,0355 + 0,0655 -0,0697 = 0,3633 + 0,0655 + 0,1326 Решая систему методом Гаусса получим:
    = —0,0409; = 1,036; = -0,9251.
    Уравнение регрессии имеет вид:
    У= -0,0709 + 1,036Х2 -0,9251Х3.

Далее найдем дисперсии переменных У, Х2 и Х3, а также попарные ковариации этих переменных:
0,0355 – (0,1826)2 = 0,00219;
0,00064;
0,00441;

Cov(Х ;У) = —  = -0,0313 – 0,1826*(-0,1879) = 0,003;
Cov(Х ;У) = —  =- 0,00146;
Cov(Х ;Х ) = —  = — 0,00084.

2) Найдем общую дисперсию, объясненную и необъясненную регрессией дисперсии по формулам:
общая дисперсия
= D(y) = 0,00441;
необъясненная регрессией часть дисперсии
 0,009 = 0,0009
объясненная регрессией часть дисперсии
0,0451 = 0,00451

3) Найдем коэффициент детерминации
1 — = 0,796;
Скорректированный коэффициент корреляции найдем по формуле:
1 — = 0,738
Значение скорректированного коэффициента корреляции далеко от единицы, значит скорее всего имеется низкая степень линейной зависимости значений У от факторных величин Х и Х .
Однако следует проверить наличие корреляции между факторами Х и Х . Для этого найдем частные коэффициенты корреляции.

4) Сначала найдем коэффициенты корреляции для парных регрессий по формулам:

r (x2; y) = = = 0,9311;
r (x3; y) = = 0,7539.
Коэффициент частной корреляции между Уи Х при исключении влияния Х найдем по формуле:
r (у;x2 х3 ) = = = 0,1708.
Коэффициент частной корреляции между Уи Х при исключении влияния Х найдем по формуле:
r (у;x3 х2 ) = = -1,96
Коэффициенты частной корреляции далеки от единицы, значит связь между У и фактором Х слабая. Связь между Y и X3 обратная.

5) Проверим значимость линейной модели в целом. Для этого на уровне доверия 95% проверим нулевую гипотезу
Н: 2 = 3=0
об отсутствии линейной зависимости между У и факторами Х и Х . Для этого рассмотрим F-статистику
F = = = 13,6487.
Найдем критическое значение F-статистики:
Fс = F(k-1;n-k) = F(3-1;10-3) = F(2;7)
а) по таблице распределения Фишера при 95% уровне доверия находим
Fc = 4,74
Поскольку FFc, то гипотеза Н: 2 = 3=0 с вероятностью 95% отвергается и принимается альтернативная гипотеза о значимости линейной регрессии

6) Найдем доверительные интервалы для параметров регрессии.
Составим матрицу
Q = n = 10
Определитель этой матрицы  = 0, 000000622
Найдем диагональные элементы матрицы Q-1:
q11 = ( ) = (0,101724 – 0,088721) =325,06;
q33 = ( ) = D(Х2) = 0,006 978 = 174,45;
q22 = ( ) = D(Х3) = 0,007 066 = 176,65;

Используя t-статистику получим доверительные интервалы для коэффициентов 1, 2, 3
на доверительном уровне 95%:
m  ( — tc  ; + tc  ),
где m = 1,2,3.
Критическое значение tc = t(n-k; 0,95) = t(10-3; 0,95) = t(7; 0,95) найдем по таблицам распределения Стьюдента
tc = 2,365;
Несмещенную оценку S2 дисперсии ошибок 2 найдем по формуле:
= = 0,000 001 03
Отсюда
tc  = 0,0434; tc  = 0,0320; tc  = 0,0318.
В результате получим доверительные интервалы на уровне доверия 95%:
1  (-0,7614 – 0,0434; -0,7614 + 0,0434), т.е. 1  (-0,8048; -0,7180 );
2  (1,0305 – 0,0320; 1,0305 + 0,0320), т.е. 2  (0,9985; 1,0625 );
3  (0,3747 – 0,0318; 0,3747 + 0,0318), т.е. 3  (0,3429; 0,4065 ).

Проверим значимость регрессии. Для этого на уровне значимости 95% проверим гипотезы
Н1: α1= 0; Н2: α2= 0; Н3: α3= 0.
Составим – статистики
; ;
и найдем их значения:
, ,
Сравнивая полученные значения -статистик с критическим получим, что , , , т.е. все три гипотезы Н1, Н2 и Н3 должны быть отвергнуты на уровне доверия 95% и приняты альтернативные гипотезы, т.е. с вероятностью 95% все три коэффициента α1, α2, α3 значимы.

8) Проверим наличие мультиколинеарности. Для этого составим матрицу коэффициентов корреляции и найдем ее определитель ,
где ,
Составленный определитель равен
=1-0,000036=0,999964
На уровне значимости 95% проверим гипотезу о независимости факторных переменных
H:
Для этого рассчитаем величину
Критическое значение найдем по таблицам распределения : Пирсона при уровне значимости 95%

Поскольку , то гипотеза Н принимается на уровне доверия 95%, т.е. можно считать, что мультиколлинеарности нет.

Оцените статью
Поделиться с друзьями
BazaDiplomov