Estadística bidimensional
Enviado por pauu.rossi • 22 de Febrero de 2021 • Trabajo • 2.167 Palabras (9 Páginas) • 89 Visitas
ESTADÍSTICA BIDIMENSIONAL
Alumnos: Paula Rossi, Cristina Galán y Juan González
Profesor: David Domingo Asignatura: Matemática
Fecha de entrega: 15/05/2020
!1
ÍNDICE
1.Portada.............................................................1 2.Indice...............................................................2 3.Introducción...........................................................3 4.Marco teórico...................................................................3 5.Problema No 1..................................................................7 6.Problema No 2................................................................10 7.Problema No 3................................................................12
!2
INTRODUCCIÓN
A continuación, vamos a realizar el proyecto de evaluación final en la asignatura de matemáticas. Durante este curso hemos estudiado estadística considerando solo una variable. Ahora vamos a investigar distribuciones bidimensionales, coeficiente de correlación lineal y recta de regresión y lo vamos a aplicar a los ejercicios propuestos hacia nuestro grupo (número 7). Si se realiza de manera adecuada el informe, se puede subir hasta 1 punto en la nota final de evaluación.
MARCO TEÓRICO
En una distribución bidimensional a cada individuo de una población se le asignan dos valores, uno de cada variable o característica.
Una variable estadística bidimensional, (X, Y), representa los pares de valores asociados a cada individuo.
CORRELACIÓN LINEAL
Se dice que hay correlación lineal entre las variables, si los puntos se distribuyen en torno a una línea recta. Si la pendiente de la recta es positiva la correlación es directa y si es negativa la correlación es inversa. Observando la forma de la nube de puntos, se puede deducir si la correlación es fuerte o débil.
TABLAS DE CONTINGENCIA
Si el número de datos es grande y los pares de valores se repiten se utiliza una tabla de contingencia.
!3
• X1,X2....Xn son los valores de la variable X
• Y1,Y2....Ym son los valores de la variable Y
• f11 es la frecuencia del valor (X1, Y1). En general fij es la frecuencia correspondiente al valor (Xi ,Yj)
• f1 eslasumadelas frecuencias correspondientes a X1
• f.1 es la suma de las frecuencias correspondientes a Y1
COVARIANZA Y COEFICIENTE DE CORRELACIÓN LINEAL
La correlación entre las dos variables de una distribución bidimensional se puede cuantificar estudiando la relación entre los puntos del diagrama de dispersión y el centro de gravedad.
aritméticas de cada una de las variables:
CENTRO DE GRAVEDAD
__
El centro de gravedad x, y es el punto cuyas coordenadas son las medias
X = ∑ Xi Y = ∑Yj NN
donde N es el numero de puntos
Tener en cuenta que el centro de gravedad no tiene por qué coincidir con uno de los puntos de la nube
COVARIANZA
La covarianza mide la variación conjunta de ambas variables. !4
Sxy=∑(Xi −X).(Yj −Y)=∑XiYj −XY NN
* Sxy > 0 * Sxy < 0 * Sxy ≃ 0
Directa Inversa Débil
Tener en cuenta que la covarianza mide la suma de las áreas de los rectángulos que tienen por vértices opuestos el punto y el centro de gravedad.
COEFICIENTE DE CORRELACIÓN LINEAL
La correlación lineal entre dos variables se puede cuantificar con un único número, el coeficiente de correlación lineal, r.
r= Sxy Sx.Sy
Donde Sxy es la covarianza y Sx, Sy son las desviaciones típicas de la variable
El coeficiente de correlación lineal no tiene dimensiones, es decir, no depende de las dimensiones de las variables. Su valor está comprendido entre −1 y 1.
* Si r > 0, la correlación es directa.
* Si r < 0, la correlación es inversa.
* Si r está próximo a 0, la correlación es débil.
* Si r está próximo a 1 o −1 la correlación es fuerte.
!5
* Si r = 1 o r = −1 la correlación es perfecta y los puntos están sobre una recta, es decir, hay dependencia funcional.
RECTA DE REGRESIÓN LINEAL
La recta de regresión lineal de Y sobre X pasa por el centro de gravedad __
(x, y), y su ecuación es: Y − Y = Sxy ( X − X )
S2x
Su pendiente se llama coeficiente de regresión de Y sobre X, y es la
siguiente
Sxy S2x
La recta de regresión de Y sobre X permite estimar el valor que tomará la variable Y para un determinado valor de la variable X. El valor de la estimación es fiable cuando:
* El valor está en el rango de valores de X o muy cerca de sus extremos. * Si el coeficiente de correlación se aproxima a 1 o −1.
!6
PROBLEMA No1
1.- La siguiente tabla muestra el número de gérmenes patógenos por
cm 3 de un determinado cultivo según el tiempo transcurrido:
a) Calcula la recta de regresión para predecir el número de gérmenes por centímetro cúbico en función del tiempo.
b) ¿Qué cantidad de gérmenes por centímetro cúbico cabe esperar que haya a las 6 horas? ¿Es buena esta estimación?
a) Lo que vamos a realizar en este apartado es completar la tabla de datos o tabla de contingencia y luego vamos a calcular la ecuación de la recta de regresión de Y sobre X
Xi
Yi
Xi*Yi
Xi^2
Yi^2
0
20
0
0
400
1
26
26
1
676
2
33
66
4
1089
3
41
123
9
1681
4
47
188
16
2209
5
53
265
25
2809
15
220
668
55
8864
Ahora vamos a proceder a hallar la recta de regresión lineal.Sabiendo que la formula de la misma es la siguiente
Y − Y = Sxy ( X − X ) S2x
Calculamos los parámetros necesarios:
!7
Sabemos que la formula para calcular los centros de gravedad es la misma que se utiliza para calcular la media de una estadística, ya que el centro de gravedad es el punto cuyas coordenadas son las medias aritméticas de cada una de las variables, por lo qué la formula que utilizaremos para calcularlos es la siguiente
X = ∑ Xi Y = ∑Yj NN
X =15=2,5 6
Y = 220 = 36,67 6
Llegando a la conclusión de que el centro de gravedad es
(X =2,5;Y =36,67)
Ahora hallaremos la covarianza (Sxy), sabiendo que su formula
...