Корреляционная таблица | Высшая математика | Студенту | Статьи и обсуждение вопросов образования в Казахстане

Корреляционная таблица

На практике в результате независимых наблюдений над величинами X и Y, как правило, имеют дело не со всей совокупностью всех возможных пар значений этих величин, а лишь с ограниченной выборкой из генеральной совокупности, причем объем n выборочной совокупности определяется как количество имеющихся в выборке пар.

Первоочередной задачей статистической обработки экспериментального материала является систематизация полученных данных и выяснение формы соответствующей генеральной совокупности.

Пусть величина Х в выборке принимает значения x₁, x₂,....x_m, где количество различающихся между собой значений этой величины, причем в общем случае каждое из них в выборке может повторяться. Пусть величина Y в выборке принимает значения y₁, y₂,....y_k, где k - количество различающихся между собой значений этой величины, причем в общем случае каждое из них в выборке также может повторяться. В этом случае данные заносят в таблицу с учетом частот встречаемости. Такую таблицу с группированными данными называют корреляционной.

Первым этапом статистической обработки результатов является составление корреляционной таблицы (таблица 1).

Y\X	x₁	x₂	...	x_m	n_y
y₁	n₁₂	n₂₁		n_m1	n_y₁
y₂		n₂₂		n_m2	n_y₂
...
y_k	n_1k	n_2k		n_mk	n_{y_k}
n_x	n_x₁	n_x₂		n_{x_m}	n

В первой строке основной части таблицы в порядке возрастания перечисляются все встречающиеся в выборке значения величины X. В первом столбце также в порядке возрастания перечисляются все встречающиеся в выборке значения величины Y. На пересечении соответствующих строк и столбцов указываются частоты n_ij (i=1,2,...,m; j=1,2,...,k) равные количеству появлений пары (x_i;y_i) в выборке. Например, частота n₁₂ представляет собой количество появлений в выборке пары (x₁;y₁).

Так же n_{x_i}n_ij, 1≤i≤m, сумма элементов i-го столбца, n_{y_j}n_ij, 1≤j≤k, - сумма элементов j-ой строки и n_{x_i}=n_{y_j}=n

Аналоги формул (3), полученные по данным корреляционной таблицы, имеют вид:

(6)

Пример 3. Изучалась зависимость между качеством стандартности товаров Y(%) и количеством товаров (X) шт. Результаты наблюдений приведены в виде корреляционной таблицы.

Y\X	18	22	26	30	n_y
70	5				5
75	7	46	1		54
80		29	72		101
85			29	8	37
₉₀				3	3
n_x	12	75	102	11	200

Требуется:
1) Найти выборочное уравнение прямой регрессии Y на X.
2) Определить выборочные аналоги функции регрессии.
3) Сравнить между собой при каждом значении Х приближения средних значений Y, полученные по функции регрессии и по уравнению прямой регрессии.

Решение: Пользуясь данными, приведенными в этой таблице, по формулам (6), находим:

Следовательно,
a=79.475-1.111•24.24=79.475-26.930=52.544

Таким образом, выборочное уравнение прямой регрессии Y на X выражается формулой:

Y=79.475+1.111(x-24.24)=79.475+1.111x-26.930=52.545+1.111x

Откуда:

X	18	22	26	30
Y_лин	72.5	76.98	81.45	85.92
Y_x	72.91	76.93	81.37	86.36

где Y_лин(x=x₁)=52.545+1.111•18=72.5 и т.д. y_x₁=(5•70+7•75)/12=72.91 и т.д.

Сопоставляя полученные результаты, приходим к выводу, что значения, вычисленные по уравнению выборочной регрессии и по линейной зависимости хорошо согласуются.

Заключение. Величины, вычисленные путем подстановки возможных значений Х в уравнение прямой регрессии и в функцию регрессии, практически совпадают.

Замечание. Для упрощения вычислений в корреляционной табл. удобно от (x_i;y_i) перейти к новым переменным (u_i;v_i), положив u_i=(x_i-x₀)/h₁; v_j=(y_j-y₀)/h₂ (*)

где x₀ и y₀ варианты соответствующие наибольшим частотам соответственно x_i и y_i. h_i=x_i+1-x_i.

Обратный пересчет осуществляется по формулам:

26.08.2010 19:34 Высшая математика Артем 43859 0

статистическая обработка, корреляционная таблица, анализ, Высшая математика, лекция по высшей математике

Добавлять комментарии могут только зарегистрированные пользователи.
Регистрация Вход

Поиск на сайте

Вход на сайт