где
ЛЕКЦИЯ № 13. Корреляционно–регрессионный анализ
1. Понятие и виды корреляционного анализа
К. Пирсон и Дж. Юл разработали корреляционный анализ, который по их мнению должен ответить на вопрос о том, как выбрать с учетом специфики и природы анализируемых переменных подходящий измеритель статистической связи (коэффициент корреляции, корреляционное отношение, и т.д.), решить задачу как оценить его числовые значения по уже имеющимся выборочным данным.
Корреляционный анализ поможет: найти методы проверки того, что полученное числовое значение анализируемого измерителя связи действительно свидетельствует о наличии статистической связи; определить структуру связей между исследуемыми k признаками х1, х2,…, хк, сопоставив каждой паре признаков ответ («связь есть» или «связи нет»).
Парный коэффициент корреляции, характеризует тесноту связи между случайными величинами х и у, определяется по формуле:
Если р = 0, то между величинами х и у линейная связь отсутствует и они называются
Коэффициент корреляции, определяемый по вышеуказанной формуле, относится к генеральной совокупности.
Ординальная (порядковая) переменная помогает упорядочивать статистически исследованные объекты по степени проявления в них анализируемого свойства.
К. Спирмен в 1904г предложил показатель, который служил для измерения степени тесноты связи между ранжировками
х1(k),x2(k) ,..,x
В последствии данный коэффициент был назван ранговым коэффициентом К. Спирмен:
2. Методы регрессионного анализа
Термин «регрессия» ввел английский психолог и антрополог Ф.Гальтон.
Для точного описания уравнения регрессии необходимо знать закон распределения результативного показателя у. В статистической практике обычно приходится ограничиваться поиском подходящих аппроксимаций для неизвестной истинной функции регрессии Д(х), так как исследователь не располагает точным знанием условного закона распределения вероятностей анализируемого результатирующего показателя у при заданных значениях аргумента х.
Рассмотрим взаимоотношение между истинной f(х) = М(у/х). модельной регрессией у и оценкой у регрессии. Пусть результа–тив–ный показатель у связан с аргументом х соотношением:
где
Истинная функция регрессии в этом случае имеет вид:
f(х) = М(у/х) = 2х11,5 1,5+?i
Для наилучшего восстановления по исходным статистическим данным условного значения результативного показателя f(х) и неизвестной функции регрессии /(х) = М(у/х) наиболее часто используют следующие
?(yi – f(хi)2 > min,
Получаемая регрессия называется
Согласно методу наименьших модулей, минимизируется сумма абсолютных отклонений наблюдаемых значений результативного показателя от модульных значений:
И получаем