6. Построение графика корреляционной таблицы
При изучении теории вероятностей и математической статистики возникают такие графические задачи, как построение графиков функций распределения и графиков плотностей распределения, многоугольников распределения, гистограмм, линий регрессии, интерполирующих многочленов. В данной работе рассмотрим задачу графического построения данных корреляционной таблицы двумерной случайной величины и графика, определенной по этой таблице линии регрессии. Эта задача является стандартной задачей, которая рассматривается при изучении математической статистики.
Пример 6.1.Дана корреляционная таблица значений признаков X и Y . Построить на плоскости значения двумерной случайной величины Z=(X,Y) , заданные в таблице, указав частоты этих значений. Найти и построить линию прямой регрессии Y на X .
X Y | 20 | 25 | 30 | 35 | 40 | |
100 | 2 | 11 | - | - | - | 13 |
120 | 3 | 4 | 5 | - | - | 12 |
140 | - | - | 42 | 3 | - | 45 |
160 | - | - | 4 | 10 | 8 | 22 |
180 | - | - | - | - | 8 | 8 |
5 | 15 | 51 | 13 | 16 | n=100 |
Решение.Выполним вычисления и проведем построение в пакете Maple
Классическое окно | Стандартное окно |
1) Задаем точность вычислений | |
> Digits := 4: |
|
2) Вводим значения составляющих X и Y двумерной случайной величины Z=(X,Y) | |
> X:=vector[row]([20,25,30,35,40]); Y:=vector[row]([100,120,140,160,180]); |
|
3) Определяем число значений составляющих двумерной случайной величины | |
> with(linalg):n:=vectdim(X);m:=vectdim(Y); |
|
4) Заполняем матрицу частот (по строкам) | |
> nxy:=matrix(m,n,[2,11,0,0,0,3,4,5,0,0,0,0,42,3,0,0, 0,4,10,8,0,0,0,0,8]); |
|
5) Найдем отдельные частоты значений составляющих | |
> f:=(i)->sum('nxy[i,k]','k'=1..n): g:=(k)->sum('nxy[i,k]','i'=1..m): ny:=vector[row](m,f);nx:=vector[row](n,g); |
|
6) Найдем объем выборки | |
> N:=sum('nx[i]','i'=1..n);N1:=sum('ny[i]','i'=1..m); |
|
7) Вычислим выборочные средние составляющих X и Y | |
> xv:=sum('(X[k]*nx[k])/N','k'=1..n): yv:=sum('(Y[k]*ny[k])/N','k'=1..m): 'xv'=evalf(xv);'yv'=evalf(yv); |
|
8) Вычислим выборочные средние квадратичные отклонения | |
> sx:=sqrt(sum('(X[k]-xv)^2*nx[k]/N','k'=1..n)): sy:=sqrt(sum('(Y[k]-yv)^2*ny[k]/N','k'=1..m)): 'sx'=evalf(sx);'sy'=evalf(sy); |
|
9) Найдем выборочный коэффициент линейной корреляции | |
> rv:=(sum(sum('nxy[i,k]*X[k]*Y[i]','i'=1..m), 'k'=1..n)-N*xv*yv)/(N*sx*sy):'rv'=evalf(rv); |
|
10) Составим уравнения линейных регрессий Y на X и X на Y | |
> y[x]:=rv*(sy/sx)*(x-xv)+yv; x[y]:=rv*(sx/sy)*(y-yv)+xv; |
|
11) Составим список пар наблюдаемых значений | |
> A:=[]: > for i from 1 to n do for j from 1 to m do if nxy[j,i]<>0 then A:=[op(A),[X[i],Y[j]]]; PQ[nops(A)]:=nxy[j,i]; fi; od; od; > PP:=[seq([op(1,A[i]),op(2,A[i])],i=1..nops(A))];
|
|
12) Строим требуемые графики значений, частот, линии регрессии | |
> with(plots): > T:=pointplot(PP,symbol=solidcircle): > for k from 1 to nops(PP) do TP[k]:=textplot([op(1,PP[k])+0.2,op(2,PP[k])+0.2, PQ[k]],align={ABOVE,RIGHT});od: > TT:=plot(y[x],x=X[1]-X[1]*0.1..X[n]+X[n]*0.1): > plots[display](T,TT,seq(TP[k],k=1..nops(PP))); print(`выборочные средние`,'x[в]'=evalf(xv), 'y[в]'=evalf(yv)); print(`стандартные отклонения`,'s[x]'=evalf(sx), 's[y]'=evalf(sy)); print(`уравнение регрессии`,'y[x]'=evalf(y[x])); print(`коэффициент корреляции`,'r[в]'=evalf(rv)); |
|
Рисунок 6.1 – График корреляционной таблицы и линии регрессии
Библиографический список
1. Аладьев В.З. Системы компьютерной математики: MAPLE: искусство программирования.// – М.: Лаборатория базовых знаний, 2006, 792 с.
2. Аладьев В.З., Бойко В.К., Ровба Е.А. Программирование и разработка приложений в Maple.// Гродно, Таллинн, 2007, 458 с.
3. Дьяконов В.П. Maple 9.5/10 в математике, физике и образовании. // –М.: СОЛОН-Пресс, 2006, 720 с.
4. Васильев А.Н. Maple 8. Самоучитель.// – М.: Издательский дом «Вильямс», 2003, 352 с.
5. Матросов А.В. Maple 6. Решение задач высшей математики и механики.// –СПб.: БХВ-Петербург, 2001, 528 с.
- Построение графиков в пакете Maple
- 1. Графики на плоскости и в пространстве
- 2. Функция plot построения графиков на плоскости
- 2.1. График явно заданной функции
- 2.2. Построение графика функции, заданной процедурой
- 2.3. График параметрически заданной функции
- 2.4. График функции, заданной параметрически процедурами
- 2.5. График, построенный по точкам, заданным декартовыми координатами
- 2.6. Опции функции plot
- 3. Функция plot3d построения графиков в пространстве
- 3.1. График функции двух переменных
- 3.2. График поверхности, заданной параметрически
- 4. Пакет построения графиков plots
- 4.1. График неявно заданной функции одной переменной
- 4.2. Текстовые графики на плоскости
- 4.3. Комбинированные графики
- 5. Графические построения при решении задач дисциплины «Математика»
- 5.1. Исследование функций и построение их графиков
- 5.2. Построение графиков областей на плоскости, ограниченных заданными кривыми
- 5.3. Построение областей в пространстве, ограниченных заданными поверхностями
- 5.4. Построение графиков частичных сумм степенного ряда
- 5.5. Построение графиков периодических функций и графиков частичных сумм ряда Фурье
- 6. Построение графика корреляционной таблицы