Контрольная Эконометрика

Эконометрика
Контрольная работа

Содержание
1 Построение классической линейной модели множественной регрессии 3
2 Оценка параметров множественной регрессии по методу наименьших квадратов 9
3 Расчет показателей качества регрессии и их анализ 11
Список использованной литературы 14
ЗАДАЧА 15

1 Построение классической линейной модели множественной регрессии
Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Например, при построении модели потребления того или иного товара от дохода исследователь предполагает, что в каждой группе дохода одинаково влияние на потребление таких факторов, как цена товара, размер семьи и ее состав. Вместе с тем исследователь никогда не может быть уверен в справедливости данного предположения. Для того чтобы иметь правильное представление о влиянии дохода на потребление, необходимо изучить их корреляцию при неизменном уровне других факторов. Решение такой задачи предполагает отбор единиц совокупности с одинаковыми значениями всех других факторов, кроме дохода. Этот путь приводит к планированию эксперимента — методу, который используется в химических, физических, биологических исследованиях. Экономист в отличие от экспериментатора-естественника лишен возможности регулировать другие факторы. Поведение отдельных экономических переменных контролировать нельзя, т.е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии
у = а + bх * хх + b2 * х2 + … + bр * хр + е.
Такого рода уравнение может применяться при изучении потребления. Тогда коэффициенты bj — частные производные потребления у по соответствующим факторам xj.

Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. Основная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное воздействие их на моделируемый показатель.
Построение уравнения множественной регрессии начинается с выбора спецификации модели. Она включает в себя два вопроса: отбор факторов и выбор вида уравнения регрессии.
Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя c другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:
1) быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то нужно придать ему количественную определенность (например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов недвижимости учитывается место нахождения недвижимости: районы могут быть проранжированы;
2) не должны быть коррелированы между собой и тем более находиться в точной функциональной связи.
Включение в модель факторов с высокой интеркорреляцией, когда rуч1 < rХ1Х2, для зависимости
у = а + bх * xj + b2 * х2 + е,
может привести к нежелательным последствиям — система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии.
Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель, и параметры уравнения регрессии оказываются неинтерпретируемыми. Так, в уравнении у = а + Ьх * хх + Ьг *х2 + е предполагается, что факторы хх и х2 независимы друг от друга, т.е.. rx1x2. = 0. Тогда можно говорить, что параметр bх измеряет силу влияния фактора х1 на результат у при неизменном значении фактора х2. Если же rx1x2 = 1, то с изменением фактора х1, фактор х2 не может оставаться неизменным. Отсюда bх и b2 нельзя интерпретировать как показатели раздельного влияния х1 и х2 на у.
Включаемые во множественную регрессию факторы должны объяснить вариацию зависимой переменной. Если строится модель с набором р факторов, то для нее рассчитывается показатель детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р факторов. Влияние других не учтенных в модели факторов оценивается как (1-R2) с соответствующей остаточной дисперсией S2.
При дополнительном включении в регрессию (р+1) фактор коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться.
Если этого не происходит и данные показатели практически не отличаются друг от друга, то включаемый в анализ фактор хр,, не улучшает модель и является лишним. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента.
Несмотря на то, что теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов проводится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно проводится в две стадии: на первой отбираются факторы исходя из сути проблемы; на второй — на основе матрицы показателей корреляции и определения t-статистики для параметров регрессии.
Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно коллинеарны, т. е. находятся между собой в линейной зависимости, если
Поскольку одним из условий построения уравнения множественной регрессии является независимость действия факторов, т.е.. Rxixj= 0, коллинеарность факторов нарушает это условие. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.
Включение в модель мультиколлинеарных факторов нежелательно по следующим причинам:
• затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл;
• оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.
Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.
Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между ними была бы единичной, поскольку все недиагональные элементы были бы равны нулю.
Если же между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю.
Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и надежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.
Отбор факторов, включаемых в регрессию, является одним и из важнейших этапов практического использования методов регрессии.
Наиболее широкое применение получили следующие методы построения уравнения множественной регрессии:
• метод исключения;
• метод включения
• шаговый регрессионный анализ.
При отборе факторов рекомендуется пользоваться следующим правилом:число включаемых факторов обычно в 6—7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной вариации очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, а F-критерий меньше табличного значения.
Как и в парной зависимости, используются разные виды уравнений множественной регрессии: линейные и нелинейные
Ввиду четкой интерпретации параметров наиболее широко используются линейная и степенная функции. В линейной множественной регрессии ух = а + bх * хх + b2 * х2 + … + bр * хр параметры при х называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне. (функция потребления)
Свободный член уравнения множественной линейной регрессии ее (параметр а) вбирает в себя информацию о прочих не учитываемых в модели факторах. Его величина экономической итерпретации не имеет. Формально его значение предполагает то значение у, когда все х = 0, что практически не бывает.
В степенной функции

коэффициенты bj являются коэффициентами эластичности. Они показывают, на сколько процентов в среднем изменяется результат с изменением соответствующего фактора на 1 % при неизменности действия других факторов. Этот вид уравнения регрессии получил наибольшее распространение в производственных функциях, в исследованиях спроса и потребления.
Стандартные компьютерные программы обработки регрессионного анализа позволяют перебирать различные функции и выбрать ту из них, для которой остаточная дисперсия и ошибка аппроксимации минимальны, а коэффициент детерминации максимален. Однако чем сложнее функция, тем менее интерпретируемы ее параметры.

2 Оценка параметров множественной регрессии по методу наименьших квадратов
Параметры уравнения множественной регрессии оцениваются как и в парной регрессии, методом наименьших квадратов. При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии. Ее решение может быть осуществлено методом определителей. Возможен и иной подход к определению параметров множественной регрессии, когда на основе матрицы парных коэффициентов корреляции строится уравнение регрессии в стандартизованном масштабе:

где ty, tx1,…txp- стандартизированные переменные

для которых среднее значение равно нулю: ty=txi=0,
среднее квадратическое отклонение равно единице (сигмы),
В-стандартизированные коэффициенты регрессии

Применив МНК к уравнению множественной регрессии стандартизованном масштабе, после соответствующих преобразований получим систему нормальных уравнений вида

Решая ее методом определителей, найдем параметры — стандартизованные коэффициенты регрессии. Стандартизованные коэффициенты регрессии показывают на сколько сигм изменится в среднем результат, если соответствующий фактор Xj изменится на одну сигму при неизменном среднем уровне других факторов. В силу того, что все переменные заданы как центрированные и нормированные, стандартизованные коэффициенты регрессии сравнимы между собой. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизованных коэффициентов регрессии в отличие от коэффициентов «чистой» регрессии, которые несравнимы между собой.
В парной зависимости стандартизованный коэффициент регрессии есть не что иное, как линейный коэффициент корреляции. Подобно тому, как в парной зависимости коэффициенты регрессии и корреляции связаны между собой, так и во множественной регрессии коэффициенты «чистой» регрессии bt связаны со стандартизованными коэффициентами регрессии Bt, а именно

Это позволяет от уравнения регрессии в стандартизированном масштабе переходить к уравнению регрессии в натуральном масштабе переменных. Параметр а определяется как

Содержание стандартизованных коэффициентов регрессии позволяет использовать их при отсеве факторов — из модели исключаются факторы с наименьшим значением B.

3 Расчет показателей качества регрессии и их анализ
Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера:

Dфакт — факторная сумма квадратов на одну степень свободы;
R2 — коэффициент (индекс) множественной детерминации;
n — число наблюдений;
т — число параметров при переменных х (в линейной регрессии совпадает с числом включенных в модель факторов);
Dост, — остаточная сумма квадратов на одну степень свободы.
Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности введения его в модель. Мерой для оценки включения фактора в модель служит частный F-критерий, т. е. Fxi
Частный F-критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом.
С помощью частного F-критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор хi- был введен в уравнение множественной регрессии последним.
Частный F-критерий оценивает значимость коэффициентов чистой регрессии. Зная величину Fxi, можно определить и t-критерий для коэффициента регрессии при i-м факторе, tbi, а именно .
Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента может быть проведена и без расчета частных F-критериев. В этом случае, как и в парной регрессии, для каждого фактора используется формула
где bi, — коэффициент чистой регрессии при факторе xi
mbi — средняя квадратическая ошибка коэффициента регрессии bi,.

Для уравнения множественной регрессии средняя квадратическая ошибка коэффициента регрессии может быть определена по следующей формуле:

Где — среднее квадратическое отклонение для признака у;
— коэффициент детерминации для уравнения множественной регрессии;

  • среднее квадратическое отклонение для признака хi,;
  • коэффициент детерминации для зависимости фактора хi со всеми другими факторами уравнения множественной регрессии;
    n-m-1 — число степеней свободы для остаточной суммы квадратов отклонений.
    Если величина частного F-критерия выше табличного значения, то это означает одновременно не только значимость рассматриваемого коэффициента регрессии, но и значимость частного коэффициента корреляции.
    Проверка надежности парных линейных коэффициентов корреляции при помощи t-критерия Стьюдента производиться по формуле:

где

Проверка надежности частных коэффициентов корреляции проводиться по формулам:

где

Список использованной литературы

  1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. — М.: ЮНИТИ, 1998.
  2. Эконометрика: Учебник / И.И. Елисеева, С.В.Курышева, Т.В. Костеева и др.; Под ред. И.И. Елисеевой.-2-е изд., перераб. и доп. — М.: Финансы и статистика, 2005.-576с.
  3. Практикум по эконометрике: Учеб. пособие /И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. — М.: Финансы и статистика, 2004.-192с.
  4. Елисеева И.И., Юзбашев М.М. Общая теория статистики. – М.: Финансы и статистика, 2000.

ЗАДАЧА
Пользуясь исходными данными, приведенными в таблице (вариант выбирается по последней цифре в зачетной книжке):

  1. Построить поле корреляции
  2. Определить уравнение линейной регрессии
  3. Оценить уравнение линейной регрессии в целом и каждого его параметра (критерий Фишера, Стьюдента)
  4. Определить ошибку аппроксимации
  5. Сделать прогноз при изменении фактора Х на 15%.

ВАРИАНТ 10
Х У
1 53 24
2 61 27
3 64 29
4 68 31
5 71 35
6 76 38
7 79 39
8 81 42
9 89 44
10 25 2

Решение:

  1. Построим поле корреляции .

По расположению эмпирических точек можно предположить наличие линейной корреляционной зависимости между переменными x и y.

  1. Определим уравнение линейной регрессии, для этого построим рабочую таблицу 1.

Таблица 1 — Рабочая таблица для определения параметров уравнения регрессии
№ x y

1 53 24 576 2809 1272 21,92 4,34
2 61 27 729 3721 1647 27,28 0,08
3 64 29 841 4096 1856 29,29 0,08
4 68 31 961 4624 2108 31,97 0,94
5 71 35 1225 5041 2485 33,98 1,04
6 76 38 1444 5776 2888 37,33 0,44
7 79 39 1521 6241 3081 39,34 0,12
8 81 42 1764 6561 3402 40,68 1,73
9 89 44 1936 7921 3916 46,05 4,19
10 25 2 4 625 50 3,15 1,32
Сумма 667 311 11001 47415 22705 311,00 14,28
Среднее 66,70 31,10 1100,10 4741,50 2270,50

Параметры уравнения прямой определяются путем решения системы нормальных уравнений

или по формулам:
;

Уравнение парной регрессии запишется так:

При увеличении факторного признака на единицу своего измерения, результативный признак увеличивается на 0,67 единиц своего измерения.

3 Оценим уравнение линейной регрессии в целом и каждого его параметра (критерий Фишера, Стьюдента)

Оценка тесноты связи между признаками осуществляется с помощью коэффициента линейной парной корреляции — rx,y. Он может быть рассчитан по формуле: . Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии : .
Коэффициент корреляции рассчитаем по формуле

Коэффициент корреляции больше нуля, поэтому связь между признаками прямая. Данный коэффициент близок к единице, поэтому можно сказать что связь между признаками тесная.
Коэффициент детерминации – коэффициент корреляции, возведенный в квадрат. Он показывает долю вариации результативного признака, обусловленную вариацией факторного признака.

R2 = 0.989
В нашем примере вариация результативного признака на 98.9 % обусловлена вариацией факторного признака? а на 1.1% — случайными факторами.
Оценку статистической значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. Фактическое значение F-критерия составит:

Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы составляет:
Так как Fфакт – 736,27 > , то уравнение регрессии признаётся статистически значимым.
Оценку статистической значимости коэффициента регрессии и коэффициента корреляции проведем с помощью t-статистики Стьюдента.
Определим стандартные ошибки

Тогда

Табличное значение t-критерия для числа степеней свободы и уровня значимости составит
Фактические значения t-статистики превосходят табличное значение.
Поэтому параметры b, r не случайно отличаются от нуля, а статистически значимы.

4 Определим ошибку аппроксимации

Средняя ошибка аппроксимации равна:

Средняя ошибка аппроксимации больше 5%, значит уравнение тренда непригодно для прогнозирования.

5 Сделаем прогноз при изменении фактора Х на 15%.

Оцените статью
Поделиться с друзьями
BazaDiplomov