Что характеризует частный коэффициент корреляции множественной. Коэффициент корреляции и причинно-следственная связь: формулы и их интерпретация. Предвзятость средств массовой информации

До сих пор мы рассматривали корреляционные связи между двумя признаками: результативным (у ) и фактор­ным (х). Например, выпуск продукции зависит не только от размера основного капитала, но и от уровня квалифи­кации рабочих, состояния оборудования, обеспеченности и качества сырья и материалов, организации труда и т.д. В связи с этим возникает необходимость в изучении, из­мерении связи между результативным признаком, двумя и более факторными. Этим занимается множественная корреляция.

Множественная корреляция решает три задачи. Она определяет:

1) форму связи;

2) тесноту связи;

3) влияние отдельных факторов на общий результат.

Определение формы свя­зи сводится обычно к отысканию уравнения связи у с фак­торами x,z,w,...у. Так, линейное уравнение зависимости результативного признака от двух факторных определяет­ся по формуле

Для определения параметров а 0 , а } и а 2 , по способу наименьших квадратов необходимо решить следующую систему трех нормальных уравнений:

(8.29.)

При определении тесноты связи для множественной зависимости пользуются коэф­фициентом множественной (совокупной) корреляции, предварительно исчислив коэффициенты парной корреля­ции. Так, при изучении связи между результативным признаком у и двумя факторными признаками - х и z, нужно предварительно определить тесноту связи между у и х, между у и z, т.е. вычислить коэффициенты парной кор­реляции, а затем для определения тесноты связи резуль­тативного признака от двух факторных исчислить коэф­фициент множественной корреляции по следующей фор­муле:

(8.30.)

где r xy , r zy , r xz - парные коэффициенты корреляции.

Коэффициент множественной корреляции колеблется в пределах от 0 до 1. Чем он ближе к 1, тем в большей мере учтены факторы, определяющие конечный резуль­тат.

Если коэффициент множественной корреляции возве­сти в квадрат, то получим совокупный коэффициент де­терминации, который характеризует долю вариации резуль­тативного признака у под воздействием всех изучаемых факторных признаков.

Совокупный коэффициент детерминации, как и при парной корреляции, можно исчислить по следующей фор­муле:

где - дисперсия факторных признаков, - диспер­сия результативного признака. Однако вычисление теоретических значений Y при множественной корреляции и сложно, и громоздко. Поэтому факторную дисперсию исчисляют по следующей формуле.

Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации.

Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием факторных признаков, т.е. определяет, какая доля вариации признака у учтена в модели и обусловлена влиянием на него факторов, включенных в модель:

Множественный коэффициент корреляции может быть найден как корень квадратный из коэффициента детерминации. Чем ближе коэффициент корреляции к единице, тем теснее связь между результатом и всеми факторами и уравнение регрессии лучше описывает фактические данные. Если множественный коэффициент корреляции близок к нулю, то уравнение регрессии плохо описывает фактические данные, и факторы оказывают слабое влияние на результат. Этот коэффициент в отличие от парного коэффициента корреляции не может быть использован для интерпретации направления связи.

Значение коэффициента множественной корреляции больше или равно величине максимально коэффициента парной корреляции:

Для линейной множественной регрессии коэффициент множественной корреляции может быть рассчитан по следующей формуле:

Соответственно множественный коэффициент детерминации:

Существует еще одна формула для расчета множественного коэффициента корреляции для линейной регрессии:

где - определитель полной матрицы линейных парных коэффициентов корреляции (т.е. включающей парные линейные коэффициенты корреляции факторов с результатом и между собой):

Определитель матрицы линейных парных коэффициентов корреляции факторов между собой:

Рассчитывается также скорректированный коэффициент детерминации:

где n – число наблюдений;

m – число параметров уравнения регрессии без учета свободного члена (для линейной регрессии, например, это число равно числу факторов, включенных в модель).

Скорректированный коэффициент детерминации применяется для решения двух задач: оценки реальной тесноты связи между результатом и факторами и сравнения моделей с разным числом параметров. В первом случае обращают внимание на близость скорректированного и нескорректированного коэффициентов детерминации. Если эти показатели велики и различаются незначительно, модель считается хорошей.

При сравнении разных моделей предпочтение при прочих равных условиях отдается той, у которой больше скорректированный коэффициент детерминации.

Следует отметить, что область применения скорректированного коэффициента детерминации ограничивается только этими задачами. Его нельзя использовать в формулах, где применяется обычный коэффициент детерминации. Скорректированный коэффициент детерминации нельзя интерпретировать как долю вариации результата, объясненную вариацией факторов, включенных в модель регрессии.


Для проверки существенности коэффициента множественной корреляции используют F -критерий Фишера, который определяется по формуле:

где R 2 – множественный коэффициент детерминации;

m – число параметров при факторах х в уравнении множественной регрессии (в парной регрессии m =1).

Полученное значение F-критерия сравнивается с табличным при определенном уровне значимости и m и n-m-1 степенях свободы. Если расчетное значение F -критерия больше табличного, уравнение множественной регрессии признается значимым.

Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат.

Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:

где – общая дисперсия результативного признака;

–остаточная дисперсия для уравнения
.

Методика построения индекса множественной корреляции аналогична построению индекса корреляции для парной зависимости. Границы его изменения те же: от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции:

.

При правильном включении факторов в регрессионный анализ величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной зависимости. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем, четвертом знаках). Отсюда ясно, что, сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение регрессии того или иного фактора. Так, если рассматривается как функцияии получен индекс множественной корреляции
, а индексы парной корреляции при этом были
и
, то совершенно ясно, что уравнение парной регрессии
охватывало 67,2 % колеблемости результативного признака под влиянием фактора, а дополнительное включение в анализ фактораувеличило долю объясненной вариации до 72,3,%, т. е. уменьшилась доля остаточной вариации на 5,1 проц. пункта (с 32,8 до 27,7%).

Расчет индекса множественной корреляции предполагает определение уравнения множественной регрессии и на его основе остаточной дисперсии:

.

Можно пользоваться следующей формулой индекса множественной корреляции:

При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением:

,

где – стандартизованные коэффициенты регрессии;

– парные коэффициенты корреляции результата с каждым фактором.

Или, по-другому:

Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции , или, что то же самое, совокупного коэффициента корреляции .

Возможно также при линейной зависимости определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции:

где
– определитель матрицы парных коэффициентов корреляции;

–определитель матрицы межфакторной корреляции.

Для уравнения определитель матрицы коэффициентов парной корреляции примет вид:

Определитель более низкого порядка
остается, когда вычеркиваются из матрицы коэффициентов парной корреляции первый столбец и первая строка, что и соответствует матрице коэффициентов парной корреляции между факторами:

Как видим, величина множественного коэффициента корреляции зависит не только от корреляции результата с каждым из факторов, но и от межфакторной корреляции. Рассмотренная формула позволяет определять совокупный коэффициент корреляции, не обращаясь при этом к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.

При трех переменных для двухфакторного уравнения регрессии данная формула совокупного коэффициента корреляции легко приводится к следующему виду:

Индекс множественной корреляции равен совокупному коэффициенту корреляции не только при линейной зависимости рассматриваемых признаков. Тождественность этих показателей, как и в парной регрессии, имеет место и для криволинейной зависимости, нелинейной по переменным.

В рассмотренных показателях множественной корреляции (индекс и коэффициент) используется остаточная дисперсия, которая имеет систематическую ошибку в сторону преуменьшения. Эта ошибка тем более значительна, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений . Если число параметров приравно
и приближается к объему наблюдений, то остаточная дисперсия будет близка к нулю, и коэффициент (индекс) корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, используетсяскорректированный индекс (коэффициент) множественной корреляции .

Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы, а именно остаточная сумма квадратов
делится на число степеней свободы остаточной вариации
, а общая сумма квадратов отклонений
– на число степеней свободы в целом по совокупности
.

Формула скорректированного индекса множественной детерминации имеет вид:

где
– число параметров при переменных;

–число наблюдений.

Поскольку
, то величину скорректированного индекса детерминации можно представить в виде

Чем больше величина
, тем сильнее различия
и
.

Для линейной зависимости признаков скорректированный коэффициент множественной корреляции определяется по той же формуле, что и индекс множественной корреляции, т.е. как корень квадратный из
. Отличие состоит лишь в том, что в линейной зависимости под
подразумевается число факторов, включенных в регрессионную модель, а в криволинейной зависимости
– число параметров прии их преобразованиях (,
и др.), которое может быть больше числа факторов как экономических переменных.

Пример . Предположим, что при
для линейного уравнения регрессии с четырьмя факторами
, а с учетом корректировки на число степеней свободы

Чем больше объем совокупности, по которой исчислена регрессия, тем меньше различаются показатели
и
. Так, уже при
при том же значении
и т величина
составит 0,673.

В статистических пакетах прикладных программ в процедуре множественной регрессии обычно приводится скорректированный коэффициент (индекс) множественной корреляции (детерминации). Величина коэффициента множественной детерминации используется для оценки качества регрессионной модели. Низкое значение коэффициента (индекса) множественной корреляции означает, что в регрессионную модель не включены существенные факторы – с одной стороны, а с другой стороны – рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. Требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.

Если частные коэффициенты корреляции модели множественной регрессии оказались значимыми, т. е. между результативной переменной и факторными модельными переменными действительно существует корреляционная взаимосвязь, то в этом случае построение множественного коэффициента корреляции считается целесообразным.

С помощью множественного коэффициента корреляции характеризуется совокупное влияние всех факторных переменных на результативную переменную в модели множественной регрессии.

Коэффициент множественной корреляции для линейной модели множественной регрессии с n факторными переменными рассчитывается через стандартизированные частные коэффициенты регрессии и парные коэффициенты корреляции по формуле:

где r (yxi) – парный (не частный) коэффициент корреляции между результативной переменной у и факторной переменной xi

Коэффициент множественной корреляции изменяется в пределах от нуля до единицы. С его помощью нельзя охарактеризовать направление связи между результативной и факторными переменными. Чем ближе значение множественного коэффициента корреляции к единице, тем сильнее взаимосвязь между результативной и независимыми переменными, и наоборот, чем ближе значение множественного коэффициента корреляции к нулю, тем слабее взаимосвязь между результативной и независимыми переменными.

Коэффициентом множественной детерминации R2 называется квадрат множественного коэффициента корреляции:

Коэффициент множественной детерминации характеризует, на сколько процентов построенная модель регрессии объясняет вариацию значений результативной переменной относительно своего среднего уровня, т. е. показывает долю общей дисперсии результативной переменной, объяснённой вариацией факторных переменных, включённых в модель регрессии.

Коэффициент множественной детерминации также называется количественной характеристикой объяснённой построенной моделью регрессии дисперсии результативной переменной. Чем больше значение коэффициента множественной детерминации, тем лучше построенная модель регрессии характеризует взаимосвязь между переменными.

Для коэффициента множественной детерминации всегда выполняется неравенство вида:

Следовательно, включение в линейную модель регрессии дополнительной факторной переменной xn не снижает значения коэффициента множественной детерминации.

Коэффициент множественной детерминации может быть определён не только как квадрат множественного коэффициента корреляции, но и с помощью теоремы о разложении сумм квадратов по формуле:

где ESS (Error Sum Square) – сумма квадратов остатков модели множественной регрессии с n независимыми переменными:

TSS (TotalSumSquare) – общая сумма квадратов модели множественной регрессии с n независимыми переменными:

Однако классический коэффициент множественной детерминации не всегда способен определить влияние на качество модели регрессии дополнительной факторной переменной. Поэтому наряду с обычным коэффициентом рассчитывают также и скорректированный (adjusted) коэффициент множественной детерминации, в котором учитывается количество факторных переменных, включённых в модель регрессии:

где n – количество наблюдений в выборочной совокупности;

РЕАЛИЗАЦИЯ ЗАДАЧ МНОГОМЕРНОГО КОРРЕЛЯЦИОННОГО АНАЛИЗА

С ИСПОЛЬЗОВАНИЕМ ПАКЕТА MS EXCEL

Проведение корреляционного анализа рассмотрим на примере.

С целью анализа взаимосвязи показателей эффективности производства продукции бы­ли рассмотрены параметры производственно-хозяйственной деятельности 30 предприятий машиностроения.

Необходимо провести анализ взаимосвязи следующих экономических показателей:

Результативный признак:

Y 1 – производительность труда

Факторные признаки:

Х 10 - фондоотдача;

Х 14 - фондовооруженность труда;

Х 15 - оборачиваемость нормируемых оборотных средств;

X 16 -

Исходные данные представлены в файле Коррел. анализ.xls .

Предположим, что рассматриваемые признаки в генеральной совокупности подчиняются нормальному закону распределения, и указанные данные представляют выбор­ку из этой генеральной совокупности. Для решения данной задачи воспользуемся программным продуктом MS EXCEL.

1. Скопируйте в свою папку или на Рабочий стол файл Коррел. анализ.xls с диска U:\Общая информация\Эконометрика;

2. Откройте файл Коррел. анализ.xls иперейдите на лист Задание;

3. Подключите в Excel пакет анализа:

Меню СЕРВИС – Надстройки – Пакет анализа – ОК;

Меню СЕРВИС – Анализ данных – Корреляция – ОК;

4. Укажите следующие параметры диалогового окна «Корреляция»:

1. Входной интервал

Укажите массив исходных показателей, выделив мышкой все значения ис­следуемых переменных (Y 1 , Х 10 , Х 14 , Х 15 , X 16 ).

2. Группирование

Установите переключатель в положение по столбцам .

Метки в первой строке

Поставьте флажок в опции Метки в первой строке , чтобы добавить во входной диапазон верхнюю строку, содержащую названия переменных, тогда корреляци­онная матрица будет выведена с названиями переменных.

Выходной интервал

Поставьте точку в опции Выходной интервал , затем щелкните мышью в строке напротив надписи Выходной интервал и щелкните мышью в ячейку G1 листа Задание .



После установки указанных параметров нажмите на кнопку ОК .

Получим корреляционную матрицу в следующем виде:

Таблица 1

Y1 X10 Х14 Х15 X16
Y1
X10 -0,02152
Х14 0,577299 -0,03604
Х15 0,334637 0,153663 0,077981
X16 -0,2042 -0,34832 -0,16676 -0,25017

5. Для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной, и коэффициенты r ij = r ji . Скопируйте нужные парные коэффициенты корреляции в соответствующие ячейки.

В результате мы получим матрицу парных коэффициентов корреляции размерности 5x5:

Таблица 2

Y1 X10 Х14 Х15 X16
Y1 -0,02152 0,577299 0,334637 -0,2042
X10 -0,02152 -0,03604 0,153663 -0,34832
Х14 0,577299 -0,03604 0,077981 -0,16676
Х15 0,334637 0,153663 0,077981 -0,25017
X16 -0,2042 -0,34832 -0,16676 -0,25017

6. Далее необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу Hо: r ij = 0. Для этого рассчитаем наблюдаемые значения t -статистики для всех ко­эффициентов корреляции по формуле:

Для этого скопируйте предыдущую таблицу и вставьте ее под самой собой, отступив две строки. Удалите из таблицы все числовые данные и установите курсор в ячейку на пересечении переменных Y 1 и Х 10. Находясь в указанной ячейке, введите в строку формул выражение для записи вышеуказанной формулы в следующем виде:

=(H3/КОРЕНЬ(1-H3*H3))*КОРЕНЬ(49).

При вводе данного выражения необходимо щелкать мышью в ячейку с соответствующим коэффициентом, для которого рассчитывается значение t -статистики, в данном случае в ячейку H3. Введя указанное выражение, нажмите ENTER. Растяните введенную формулу с помощью черного крестика по соседним ячейкам, в результате у вас должна получиться следующая матрица наблюдаемых значений t -статистики:

Таблица 3

t набл Y1 X10 Х14 Х15 X16
Y1
X10 -0,15071
Х14 4,949094 -0,25242
Х15 2,485769 1,088567 0,547536
X16 -1,4602 -2,60115 -1,18391 -1,80872

Мы вычислили наблюдаемые значения t -статистики только для нижнего треугольника таблицы, поскольку матрица парных коэффициентов корреляции является симметричной.

7. Наблюдаемые значения t t кр, найденным для уровня значимости α=0,05 и числа степенен свободы ν=п-2. Для этого используем встроенную функцию Excel ВСТАВКА Функция – Статистические – СТЬЮДРАСПОБР.

Для расчета t кр выделите пустую ячейку, затем вызовите функцию СТЬЮДРАСПОБР, введите в поле Вероятность число 0,05, а в поле Степени_свободы – число 49, поскольку всего мы имеем 51 наблюдение, поэтому ν=п-2=51-2=49. Нажав на кнопку ОК , мы получим следующее значение t кр = 2,009574.

Сравним рассчитанные нами наблюдаемые значения t -статистики с критическим (табличным) и опреде­лим, какие коэффициенты значимы, а какие нет. Коэффициент значим, если его |t набл | > t кр.

8. Отметьте жирным шрифтом в таблице значимые коэффициенты корреляции:

Таблица 4

Матрица парных коэффициентов корреляции исследуемых показателей с выделением зна­чимых коэффициентов (при α=0,05)

Y1 X10 Х14 Х15 X16
Y1 -0,02152 0,577299 0,334637 -0,2042
X10 -0,02152 -0,03604 0,153663 -0,34832
Х14 0,577299 -0,03604 0,077981 -0,16676
Х15 0,334637 0,153663 0,077981 -0,25017
X16 -0,2042 -0,34832 -0,16676 -0,25017

9. Для значимыхпарных коэффициентов корреляции построим с заданной надёжностью γ=0,95 интервальную оценку r min < r < r тах с помощью Z-преобразования Фишера (см. формулы в лекции). Z" можно найти, используя функцию Excel:

ВСТАВКА Функция – Статистические – ФИШЕР, в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r .

10. Значение t γ рассчитаем, используя функцию Excel: ВСТАВКА – Функция – Статистические – НОРМСТОБР, где в поле Вероятность вводится значение 0,95.

Z min = ; Z max =

Для обратного преобразования используем функцию Excel: ВСТАВКА Функция – Статистические –ФИШЕРОБР, где в поле Y вводятсяячейки со значением Z min , Z max , т.е. для расчета r min вводим Z min , а для расчета r тах вводим Z max .

Расчеты представим в виде следующей таблицы:

Таблица 5

Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции ис­следуемых экономических показателей с надёжностью γ = 0,95

r Z’ Z min Z max r min r тах
Y1X14 0,577299 0,658403 0,413403 0,903403 0,3913583 0,71795081
Y1X15 0,334637 0,348041 0,103041 0,593041 0,10267786 0,5320792
Х10Х16 -0,34832 -0,36353 -0,60853 -0,11853 -0,5430915 -0,11797801

Таким образом, доверительные интервалы с надёжностью γ = 0,95найдены для всех значимых парных коэффициентов корреляции.

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1). Значимая обратная корреляционная взаимосвязь обнаружена между изучаемым при­знаком Х 10 - фондоотдача и факторным признаком X 16 - оборачиваемость ненормируемых оборотных средств.

2). Между производительностью труда (Y 1) и фондовооруженностью труда (Х 14) имежду производительно­стью труда (Y 1) иоборачиваемостью нормируемых оборотных средств (Х 15 ) существует прямая связь.

3). Наиболее сильная связь существует между результативным признаком производительность труда (Y 1) и факторным признаком фондовооруженность труда (Х 14), причем отмеченная связь прямая.

Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэф­фициентов корреляции.

Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбран­ными переменными при исключении влияния остальных показателей (т.е. характеризуют «чистую» связь только между этими признаками) и важны для понимания взаимодействия всего комплекса показателей, т.к. позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.

Частный коэффициент (k-2)- гo порядка между переменными, например, между Y 1 и Х 10 , равен:

,

где R ij - алгебраическое дополнение элемента r ij корреляцион­ной матрицы R , равное , где M ij – минор-определитель матрицы, полученный из матрицы R путем вычеркивания i- той строки и j- го столбца.

11. Для расчета частных коэффициентов корреляции нужно сформировать в Excel соответст­вующие матрицы размерности 4*4.

Например, алгебраическое дополнение R 12 рассчитывается путем вычеркивания из нашей корреляционной матрицы первой строки и второго столбца:

Y1 X10 Х14 Х15 X16
Y1 -0,02152 0,577299 0,334637 -0,2042
X10 -0,02152 -0,036036 0,153663 -0,34832
Х14 0,577299 -0,03604 0,077981 -0,16676
Х15 0,334637 0,153663 0,077981 -0,25017
X16 -0,2042 -0,34832 -0,166761 -0,25017
0,577299 0,334637 -0,2042
0,577299 0,077981 -0,16676
0,334637 0,077981 -0,25017
-0,2042 -0,166761 -0,25017

Чтобы найти определители этих матриц используем функцию Excel: ВСТАВКА - Функция - Математические - МОПРЕД (указать в качестве массива соот­ветствующую матрицу переменных). Воспользовавшись функцией получаем:

-(-0,05438)

0,786557

0,528443

Подставив значения в формулу, получаем = - 0,084348

Аналогично проводятся расчеты для всех остальных частных коэффициентов корреляции:

R 13 =(-1) 1+3 * M 13 = - 0,42585 R 34 =(-1) 3+4 * M 34 = - (-0,1)

R 14 =(-1) 1+4 * M 14 = - 0,225305 R 35 =(-1) 3+5 * M 35 = 0,063223

R 15 =(-1) 1+5 * M 15 = 0,05218 R 45 =(-1) 4+5 * M 45 = - (-0,08965)

R 23 =(-1) 2+3 * M 23 = - (-0,02282) R 33 =(-1) 3+3 * M 33 = 0,702903

R 24 =(-1) 2+4 * M 24 = - 0,05483 R 44 =(-1) 4+4 * M 44 = 0,551944

R 25 =(-1) 2+5 * M 25 = - (-0,18526) R 55 =(-1) 5+5 * M 55 = 0,561651

r 13/245 = 0,572722 r 25/134 = - 0,340055

r 14/235 = 0,341947 r 34/125 = - 0,160548

r 15/234 = - 0,078507 r 35/124 = - 0,100622

r 23/145 = - 0,037443 r 45/123 = - 0,161016

r 24/135 = 0,101525


В результате получим матрицу следующего вида:

Таблица 6 Матрица частных коэффициентов корреляции исследуемых экономических показателей

Y1 X10 Х14 Х15 X16
Y1 - 0,084348 0,572722 0,341947 - 0,078507
X10 - 0,084348 - 0,037443 0,101525 - 0,340055
Х14 0,572722 - 0,037443 - 0,160548 - 0,100622
Х15 0,341947 0,101525 - 0,160548 - 0,161016
X16 - 0,078507 - 0,340055 - 0,100622 - 0,161016

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируе­мых переменных случайных величин (в нашем случае l =3),

n - количество наблюдений.

Построим матрицу наблюдаемых значений t -статистик для всех коэффициентов r ij :

Таблица 7

Матрица наблюдаемых значений t-статистик для частных коэффициентов корреляции исследуе­мых экономических показателей

t набл Y1 X10 Х14 Х15 X16
Y1
X10 -0,574122
Х14 4,7385072 -0,254129
Х15 2,4679682 0,692152 -1,103200
X16 -0,534109 -2,452522 -0,685933 -1,106502

Наблюдаемые значения t -статистик необходимо сравнить с критическим значением t кр, най­денным для уровня значимости α =0,05 и числа степеней свободы v=n-l-2.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, α =0,05 и число степеней свободы v=n-l-2=51-3-2=46 .

13. Сравним расчетные значения с критическим и определим, какие коэффициенты значимы. По­лучим матрицу частных коэффициентов корреляции с выделенными значимыми коэффициента­ми:

Таблица 8

Матрица частных коэффициентов корреляции исследуемых показателей с выделением значи­мых коэффициентов (при α=0,05)

Y1 X10 Х14 Х15 X16
Y1 -0,084348 0,572722 0,341947 -0,078507
X10 -0,084348 -0,037443 0,101525 -0,34006
Х14 0,572722 -0,037443 -0,160548 -0,100622
Х15 0,341947 0,101525 -0,160548 -0,161016
X16 -0,078507 -0,34006 -0,100622 -0,161016

14.Для значимых частных коэффициентов корреляции построим с заданной надёжностью γ интервальную оценку r min < r < r тах с помощью Z-преобразования Фишера (см. формулы в лекции). Получим следующий результат:

Таблица 9

Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции иссле­дуемых экономических показателей с надёжностью γ = 0,95

r Z’ Z min Z max r min r тах
Y1X14 0,572722 0,651564 0,406564 0,896564 0,385551 0,714621
Y1X15 0,341947 0,356296 0,111296 0,601296 0,110838 0,537971
Х10Х16 -0,340055 -0,354155 -0,599155 -0,109155 -0,536448 -0,108723

15. Построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.

Таблица 10

Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции исследуе­мых показателей с выделением значимых коэффициентов (при α=0,05)

Между переменными Коэффициент корреляции
парный частный
Y1X10 -0,0215248 -0,084348
Y1X14 0,5772995 0,572722
Y1X15 0,3346368 0,341947
Y1X16 -0,2042044 -0,078507
Х10Х14 -0,03604 -0,037443
Х10Х15 0,153663 0,101525
Х10Х16 -0,34832 -0,34006
Х14Х15 0,077981 -0,160548
Х14Х16 -0,166761 -0,100622
Х15Х16 -0,25017 -0,161016

По полученным данным можно сделать следующие выводы:

1. Значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, подтвердились и при вычислении частных коэффициентов корреляции. При этом выявлены следующие механизмы воздействия переменных друг на друга: наиболее тесная связь наблюдается между изучаемым признаком Y 1 – производительность труда и факторными признаками Х 14 - фондовооруженность труда и Х 15 - оборачиваемость нормируемых оборотных средств (прямые зависимости) и между факторными признаками Х 10 – фондоотдача и X 16 - оборачиваемость ненормируемых оборотных средств(обратная зависимость).

2. Воздействие других переменных, что характерно для частного коэффициента корреляции (для парного коэффициента корреляции рассматриваются только две переменные без прочих посторонних), несколько ослабляет положительную взаимосвязь между производительностью труда (Y 1) и фондовооруженностью труда (Х 14), т.к. величина частного коэффициент корреляции r y 1 x 14 / x 10 x 15 x 16 = 0,573 меньше величины парного коэффициента корреляции r y 1 x 14 = 0,577.

3. Аналогичная ситуация наблюдается и для обратной связи между фондоотдачей (Х 10 ) и
оборачиваемостью ненормируемых оборотных средств (X 16 ) - при исключении воздействия других
переменных абсолютная величина (взятая по модулю) парного коэффициент корреляции превышает абсолютное
значение частного коэффициента корреляции.

4. Для связи между производительностью труда (Y 1 ) и оборачиваемостью нормируемых оборотных средств (Х 15) характерна об­ратная ситуация: воздействие других переменных усиливает эту взаимосвязь (величина част­ного коэффициента корреляции больше величины парного коэффициента корреляции).

5. Наиболее сильная связь, выявленная на этапе расчёта парных коэффициентов корреляции,
между производительностью труда (Y 1) и фондовооруженностью труда (Х 14) остаёт­ся наиболее тесной и значимой и при расчете частных коэффициентов корреляции. Направление связи между данными показателями, как и в случаях с двумя другими значимыми коэффициентами, совпадает для парных и частных коэффициентов корреляции.

Расчёт множественных коэффициентов корреляции

Множественные коэффициенты корреляции служат мерой связи одной переменной с совме­стным действием всех остальных показателей.

16.Вычислим точечные оценки множественных коэффициентов корреляции. Множествен­ный коэффициент корреляции, например, для 1-го показателя Y 1 вычисляется по формуле:

где |R | - определитель корреляционной матрицы R;

R ij - алгебраическое дополнение элемента r ij корреляцион­ной матрицы R.

Все алгебраические дополнения R ij были найдены ранее, на этапе расчёта частных коэф­фициентов корреляции, поэтому осталось вычислить только определитель самой корреляцион­ной матрицы.

Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математи­ческой функцией Excel МОПРЕД. Получим |R|= 0,453494.

Подставляя полученное значение определителя в формулу, получаем значения множественных коэффициентов корреляции:

= 0,650726

Множественный коэффициент детерминации получается возведением коэффициента корре­ляции в квадрат.

17. Проверим значимость полученных множественных коэффициентов корреляции и детерми­нации. Проверка осуществляется с помощью F -критерия:

где k - количество рассматриваемых факторов (в нашем случае k = 5 ),

п - количество наблюдений.

Произведя расчёты, получим следующую таблицу:

Таблица 11

Множественные коэффициенты корреляции и детерминации исследуемых показателей с выде­лением значимых коэффициентов (на уровне значимости α = 0,05)

18. Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F -распределения для заданного уровня значимости α и числа степеней свободы числителя v1=k-1 и знаменателя v2=n-k.

Для определения F кр воспользуемся встроенной функцией Excel: ВСТАВКА - Функция - Статистические - FРАСПОБР, введя в диалоговое окно функции вероятность α = 0,05 и число степеней свободы v1=k-1=5-1=4 и v2=n-k=51-5-46 .

Получаем F кр = 2,574033

Если наблюдаемое значение F -статистики превосходит ее критическое значение, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается.

Следовательно, в рассматриваемом примере значимыми являются множественные коэффициенты корреляции r y 1/ x10 x14 x15 x16, r x 14/ y1 x10 x15 x16, r x 16/ y1 x10 x14 x15 . Множественные коэффициенты корреляции r x 10/ y1 x14 x15 x16 и r x 15/ y1 x10 x14 x16 являются незначимыми.

Результаты проведенного анализа позволяют сделать следующие выводы:

1.Множественный коэффициент корреляции r y 1/ x10 x14 x15 x16 = 0,651 значим и имеет достаточно высокое значение, что говорит о том, показатель Y 1 – производительность труда имеет тесную связь с многомерным массивом факторных признаков Х 10 - фондоотдача, Х 14 - фондовооруженность труда, Х 15 - оборачиваемость нормируемых оборотных средств и X 16 - оборачиваемость ненормируемых оборотных средств. Это даёт ос­нование для проведения дальнейшего регрессионного анализа.

2.Множественный коэффициент детерминации r y 1/ x10 x14 x15 x16 2 = 0,423 показывает, что 42,3% доли дисперсии Y 1 – производительности труда, обусловлены изменениями факторных призна­ков.

3.Факторные признаки Х 14 - фондовооруженность труда и X 16 - оборачиваемость ненормируемых оборотных средств, также имеют значимые значения множественных коэффици­ентов корреляции и детерминации, что свидетельствует о их достаточно сильной взаимосвязи с рассматриваемыми признаками. Однако, хотя множественные коэффициенты фактора X 16 и значимы, но только 19,3% доли его дисперсии обусловлены изменениями переменных, включённых в рассматриваемую мо­дель, а, соответственно 80,7% его дисперсии обусловлены влиянием других, не включённых в модель факторов.

4.Полученные результаты корреляционного анализа, показавшие, что показатель Y 1 – производительность труда, имеет тесную связь с многомерным массивом факторных признаков, позволяют пе­рейти ко второму этапу статистического исследования - построению регрессионной модели.

В продолжение темы:
Культура

Чтобы пользоваться предварительным просмотром презентаций создайте себе аккаунт (учетную запись) Google и войдите в него: https://accounts.google.comПодписи к...

Новые статьи
/
Популярные