Парный регрессионный анализ

Исходные данные

Таблица 3.1 Исходные данные

x

1

2

3

4

5

6

7

y

0,84

3,81

4,73

5,11

5,81

7,23

8,85

Система двух случайных величин имеет пять основных статистических характеристик: средние значения и , дисперсии и и корреляционный момент (или ковариацию) , которые вычисляются по формулам:

(3.1)

(3.2)

. (3.3)

Особый интерес представляет формула корреляционного момента, которая отражает взаимосвязь между случайными величинами x и y. Поскольку корреляционный момент имеет размерность, его преобразуют в безразмерную величину по формуле:

. (3.4)

Величина играет чрезвычайно большую роль в статистических исследованиях и называется коэффициентом корреляции. Его значения заключены в интервале между +1 и -1. Если коэффициент корреляции равен нулю, то линейная связь между случайными величинами отсутствует. При связь функциональная положительная. При связь функциональная отрицательная. В реальных условиях коэффициент корреляции не бывает равен единице (или минус единице) и характеризует степень статистической связи между свойствами х и у. Чем ближе по абсолютной величине к единице, тем сильнее связь между свойствами; она может быть положительной ( > 0) и отрицательной ( < 0). Таким образом, коэффициент корреляции является мерой линейной зависимости между двумя величинами.

Если значения более 0,7-0,8, то можно считать связь сильной, при = 0,5-0,7 - связь средняя, а при =0,2-0,5 - связь слабая. Принято считать, что линейной корреляции нет, если <0,4. Таким образом, для прямолинейной связи коэффициент корреляции определяет меру связи между величинами. При малом значении коэффициента корреляции теснота прямолинейной связи между исследуемыми признаками оценивается критерием Стьюдента.

Различают два вида связи: 1) функциональная, 2) вероятностная (стохастическая).

Уравнение множественной регрессии должно быть адекватно изучаемому процессу. Коэффициенты в уравнении регрессии вычисляются методами матричной алгебры.

Задачу решают проведением прямой линии через набор опытных точек и в определении уравнения описывающего эту прямую. Обычно используется метод наименьших квадратов. Суть метода состоит в том, что изучаемая зависимость аппроксимируется таким алгебраическим выражением (трендом), который даёт наименьшее расхождение с наблюдаемыми значениями.

Перейти на страницу: 1 2 3 4

Другие статьи

Оценка кредитоспособности региона
За время рыночных реформ, происходящих вот уже второе десятилетие в России, финансовая система развивалась с опережающими темпами, по сравнению с развитием экономики в целом. Несмотря на возросший объем инвестиционных ресурсов, их масштабы не достигли дореформенного уровня, ...