переменной Т — время (в данном случае порядковые номера месяцев начиная с июня 1992 г.), то у нас получится следующее уравнение парной линейной регрессии:

где а — свободный член уравнения регрессии;

b — линейный коэффициент регрессии, показывающий, как изменение величины независимой переменной (фактора) Т в среднем способствует изменению зависимой переменной (результативного признака) Y,

Трасч расчетное значение результативного признака, вычисляемое по формуле 2.2.

Минимизируем сумму квадратов отклонений (остатков) Yфакт от Ypасч, т. е. фактических значений курса доллара от его расчетных значений. В результате формулу МНК (2.1.1) для линейной регрессии можно представить в следующем виде:

Уравнение 2.3, в принципе, можно решить самостоятельно, если найти его параметры согласно формулам (2.1.4) и (2.1.5), но в целях ускорения этого процесса будем его решать с помощью Пакета анализа Excel. Кстати, желающие лучше усвоить суть МНК могут сначала самостоятельно в «ручном режиме» решить уравнение регрессии, а затем сверить свои результаты с теми, что мы получим в Excel.

Чтобы подготовить исходные данные к решению уравнения регрессии, разместим в Excel два столбца исходных данных. В первом столбце, который озаглавим Time, поместим порядковые номера месяцев, начиная с июня 1992 г. (с номером 1) и кончая апрелем 2010 г. (с номером 215). Во втором столбце, который озаглавим USDollar, поместим данные по курсу доллара на конец месяца, начиная с июня 1992 г. и заканчивая апрелем 2010 г.[3] Таким образом, столбец Time представляет собой независимую переменную, которая в формуле (2.2) обозначена символом Т, а столбец USDollar является зависимой переменной Yфакt. Далее переходим к решению уравнения регрессии в Пакете анализа Excel согласно алгоритму действий № 3.

Алгоритм действий № 3 Как решить уравнение регрессии в Excel Шаг 1. Ввод в уравнение исходных данных

Сначала в Microsoft Excel 2007 в верхней панели инструментов выбирается опция ДАННЫЕ (в Microsoft Excel 1997–2003 нужно выбрать опцию СЕРВИС), потом в появившемся окне АНАЛИЗ ДАННЫХ — опция РЕГРЕССИЯ. После чего появляется новое окно РЕГРЕССИЯ (рис. 2.1), в котором в графе ВХОДНОЙ ИНТЕРВАЛ У выделяем (с помощью мышки) столбец данных USDollar (ячейки $С$1:$С$216). Здесь же в графе ВХОДНОЙ ИНТЕРВАЛ Xвыделяем столбец данных Time (ячейки $В$1:$В$216), т. е. независимую переменную Т из нашего уравнения регрессии (2.2).

Шаг 2. Дополнительные опции

Если бы мы хотели получить уравнение регрессии без свободного члена, который в формуле (2.2) обозначен символом а, то тогда нам следовало бы выбрать еще и опцию КОНСТАНТА-НОЛЬ. Но пока в использовании этой опции нет необходимости.

Опцию ОСТАТКИ следует выбирать тогда, когда есть необходимость, чтобы в выходных данных содержалась информация об отклонении расчетных У от их фактических значений. При этом остатки находятся по формуле

Опцию МЕТКИ применяют, чтобы переменные, включенные в уравнение регрессии, в ВЫВОДЕ ИТОГОВ были обозначены в виде заголовков соответствующих столбцов.

По умолчанию оценка в Excel параметров уравнения регрессии делается с 95 %-ным уровнем надежности. Однако в случае необходимости в опции УРОВЕНЬ НАДЕЖНОСТИ можно поставить цифру 99, что означает задание для программы оценить коэффициенты регрессии с 99 %-ным уровнем надежности. В результате в ВЫВОДЕ ИТОГОВ мы получим данные, характеризующие как в целом уравнение регрессии, так и верхние и нижние интервальные оценки коэффициентов уравнения с 95 %-ным и 99 %-ным уровнями надежности. При 95 %-ном уровне надежности существует риск, что в 5 % случаях оценки коэффициентов уравнения регрессии могут оказаться статистически незначимыми, а при 99 %-ном уровне надежности этот риск равен 1 %.

Шаг 3. Вывод итогов

На заключительном этапе выбираем в параметрах вывода (окно РЕГРЕССИЯ) опцию ВЫХОДНОЙ ИНТЕРВАЛ, в которой указываем соответствующую ячейку Excel ($Н$2), далее щелкаем по надписи ОК и получаем ВЫВОД ИТОГОВ (см. рис. 2.1, где можно увидеть все заданные нами параметры уравнения регрессии). В случае необходимости вывод итогов можно получить на отдельном листе (опция НОВЫЙ РАБОЧИЙ ЛИСТ) или в новой книге Excel (опция НОВАЯ РАБОЧАЯ КНИГА).

Результаты решения уравнения регрессии, которые в программе Excel выдаются в виде единой таблицы под заголовком ВЫВОД ИТОГОВ, у нас представлены в виде трех блоков (табл. 2.2–2.4). Так, в табл. 2.2 сгенерированы результаты по регрессионной статистике, в табл. 2.3 дается дисперсионный анализ, а в табл. 2.4 оценивается статистическая значимость коэффициентов регрессии.

Параметры, представленные в табл. 2.2, характеризуют уровень аппроксимации фактических данных, полученный с помощью уравнения регрессии. Так, параметр МНОЖЕСТВЕННЫЙ R обозначает коэффициент множественной корреляции R, который характеризует тесноту связи между результативным признаком Y и факторами переменных Д, Х2…., Хn. Этот коэффициент изменяется в пределах от 0 до 1, причем чем ближе к 1, тем теснее корреляционная связь между переменными, включенными в уравнение регрессии. Коэффициент множественной корреляции равен квадратному корню, извлеченному из коэффициента детерминации R2, который также приводится в регрессионной статистике. Коэффициент множественной корреляции R находят по формуле:

Зная величину коэффициента корреляции R, можно дать качественную оценку силы связи между зависимой и независимыми переменными, включенными в уравнение (2.5). С целью классификации силы связи обычно используют шкалу Чеддока (табл. 2.1).

Если между переменными существует функциональная связь, то R= 1, а если корреляционная связь отсутствует, то R = 0. Поскольку в табл. 2.2 коэффициент множественной корреляции Нравен 0,8456, то, согласно шкале Чеддока, связь между переменными, включенными в уравнение регрессии, можно считать высокой. Следует также заметить, что если коэффициент множественной корреляции меньше 0,7, то это означает, что величина коэффициента детерминации R2 будет меньше 50 %, а потому регрессионные модели с таким коэффициентом детерминации не имеют большого практического значения.

Однако самым важным является другой параметр регрессионной статистики — R-КВАДРАТ (в табл. 2.2 он выделен шрифтом), обозначающий коэффициент детерминации R2. Коэффициент детерминации R2 характеризует долю дисперсии результативного признака У, объясняемую уравнением регрессии, в общей дисперсии результативного признака. Коэффициент детерминации R2 находится по следующей формуле:

Коэффициент детерминации R2, как и коэффициент множественной корреляции R, изменяется в пределах от нуля до единицы. Если R2 равен единице, то доля объясненной дисперсии составляет 100 %, а следовательно, связь между зависимой переменной Y и независимыми переменными Х1,

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату