¿De qué manera afectan los datos raros a la media?
Enviado por David Perdomo Cuellar • 23 de Marzo de 2016 • Práctica o problema • 2.194 Palabras (9 Páginas) • 5.421 Visitas
- Ejercicios del Capítulo 4
- ¿De qué manera afectan los datos raros a la media?
R./ Le afecta en medida un dato raro refleja una situación especial que se debe investigar, puede ser un error de dedo, de medición o puede también reflejar un comportamiento especial del proceso en cualquier caso se debe investigar.
- ¿Explique los errores en la interpretación de la media que se señalan en la sección 4.4?
R/ a) Cuando se calcula la media muchas personas al interpretar piensan que todos los datos son igual al dato calculado o que todos están cerca, cuando en realidad existe una variabilidad que es definida por otros factores.
b) Cuando no se conocen los conceptos de las medidas de tendencia central es muy común confundir con la moda.
c) Otro error es el confundir la media con la mediana.
d) Suponer que la media muestral es la misma que la poblacional, la media muestral es una variable aleatoria.
- ¿Explique la relación entre la media y la desviación estándar que establece la regla empírica y el teorema de chebyshev?
R/La desigualdad de Chebyshev nos afirma que entre X–2S y X+2S debe estar al menos el 75% de los datos de la muestra; y que entre X + 3S está por lo menos el 89%.
En cuanto a la regla práctica en muchos datos que surgen en la práctica se ha observado empíricamente qué entre X-S y X+S está el 68% de los datos de la muestra; y entre X + 2S está el 95% y entre X+ 3S está el 99%.
Todos los intervalos anteriores son válidos solo para los datos muéstrales. Sin embargo si los intervalos se calculan con la media y la desviación estándar de la población, entonces serán válidos para toda la población.
Lo que afirma el teorema de chebyshev es válido para cualquier tipo de datos, independiente de su comportamiento o distribución, mientras que la regla empírica como su nombre lo dice se ha obtenido por medio de la observación empírica y es válida para muchos de los casos que se dan en la práctica, sobre todo si los datos tienen un comportamiento con cierto grado de similitud a una campana o la distribución normal.
- ¿Se desea investigar el peso promedio de 1000 artículos de un lote, por lo que se eligen aleatoriamente 40 de ellos, se pesan y se obtiene X = 252gr, con S= 5?
- ¿Quiere decir que el peso medio de los 1000 artículos es de 252?
R/ No, esto no significa que el peso promedio que tienen los artículos es de 252g ya que la media solamente se ha obtenido de 40 artículos y no es directamente proporcional a los 1000 artículos que pueden aumentar o disminuir de esa media.
- ¿La mayoría de los artículos pesa 252 gramos?
R/ Esto no significa que todos o la mayoría de los artículos pesen 252g, ya que pueden haber variaciones debido al total de todos los artículos.
- ¿De los 40 artículos en la muestra uno pudo haber pesado 300 gramos?
R/
3 (S)= 3 (5)= 15
X= 252+15= 267
No puede ser posible que uno de los datos haya pesado 300 gramos ya que el 99% de los datos esta en valores máximos de 267 gramos.
- Una empresa se llevan los registros del número de fallas de equipos por mes, la media es de 10 y la mediana es de 5:?
- Si usted tiene que reportar la tendencia central de fallas, ¿Qué numero reportaría?
R/ Yo reportaría el valor de 5 (que corresponde a la mediana). Ya que si usamos el dato de la media no es conveniente ya que a veces la media está afectada por datos “raros” o los extremos.
- ¿La discrepancia entre la media y la mediana se debió a que en varios meses ocurrieron pocas fallas?
R/ Si, lo más probable es que esta discrepancia se halla dado porque en varios meses ocurrieron pocas o ninguna falla, y por consecuencia el margen de diferencia entre la media y la mediana es muy grande, debido a que aunque en algunos meses no se dieron errores al calcular la media esos meses siempre tuvieron que tomarse en cuenta, mientras que en la mediana no, solamente se tomaron las fallas en total que ocurrieron.
- Un aspecto clave de la calidad de cierto producto es su peso: la norma establece que su peso mínimo sea de 2kg. El ingeniero de producción informa que está cumpliendo con tal norma, ya que el peso promedio del producto es de 2.5kg. ¿Está usted de acuerdo con el ingeniero?
R/ El ingeniero está equivocado, ya que con ese simple dato no puede tomar decisiones debido a que no se sabe la variabilidad de los datos, es necesario al menos la mediana y para mejor seguridad la desviación estándar. Ya que es probable que ese promedio se vea afectado por diferentes pesos, no precisamente por ese valor más grande que lo mínimo requerido es que sea un buen dato.
- Tres máquinas A, B y C, realizan cortes de manera automática en ciertas tiras de hule. La longitud ideal de las tiras es de 90cm, con una tolerancia de +2cm. Se toma una muestra de 80 piezas de la producción de una semana de cada máquina y el método de muestreo que se usara es el sistemático.
- Con base en lo anterior ¿Cómo le diría al operador de cada máquina que toma la muestra?
R/ Que las medidas sean de 88 a 92 Cm.
- Las longitud promedio de las 80 tiras de cada máquina son: A/ X = 90; B/ X = 90.5; C/ X = 92. ¿Con base en esto puede decidir cuál maquina es mejor?
R/ no podemos tomar una decisión en base a esto ya que la media no es una medida de tendencia con la cual se pueden tomar buenas decisiones, no es confiable debido a que la media siempre está afectada por los extremos de los datos.
- Si además la desviación estándar obtenida es A = S = 1.5, B = S= 1, C = S = 0.5, decida cual maquina estuvo funcionando mejor.
R/ Con los resultados de la desviación estándar podemos tomar una decisión acertada; A mi Criterio la Maquina C es la que ha estado funcionando mejor en el corte de tiras de hule.
- En el ejemplo 4.3 se observó que en la fabricación de las láminas de asbesto un equipo de mejora detecto que se tienen problemas en cuanto a que no se está cumpliendo con el grosor especificado que es de 5mm con una tolerancia de + 0.8mm. Con el objetivo de corregir tal situación, el grupo pone en práctica un plan de mejora. Para verificar si el plan tuvo éxito, toman aleatoriamente 35 láminas de la producción de una semana posterior a las modificaciones. Los espesores obtenidos se muestran a continuación.
- Calcule la media mediana y desviación estándar y, comparándolas con los respectivos estadísticos antes de la mejora, decida si el plan dio resultado.
MEDIA | 4.91 |
MEDIANA | 4.90 |
DESV. EST. | 0.34 |
- Se observa que el plan si dio resultado, y que todos los espesores de las láminas ahora si se encuentran dentro de las tolerancias permitidas por el cliente.
- Construya un histograma e inserte en el las especificaciones y, comprobándolo con el histograma antes de la mejora, investigue si el plan fue exitoso. Argumente su respuesta.
Dato MAYOR | 5.6 | Total datos | 35 |
|
Dato menor | 4.3 |
|
|
|
Rango | 1.3 | 1.3 | ||
Numero de clases: | 5.9 | 6 | ||
Longitud de clase: Rango/NC | 0.217 | 0.21 |
Clase | Intervalos | Límites reales | Marcas para conteo | Frecuencias | Frec. Relat. | ||
1 | 4.30 | 4.51 | 4.25 | 4.56 | 5 | 5 | 14.3 |
2 | 4.52 | 4.73 | 4.47 | 4.78 | 11 | 11 | 31.4 |
3 | 4.74 | 4.95 | 4.69 | 5.00 | 3 | 3 | 8.6 |
4 | 4.96 | 5.17 | 4.91 | 5.22 | 9 | 9 | 25.7 |
5 | 5.18 | 5.39 | 5.13 | 5.44 | 5 | 5 | 14.3 |
6 | 5.40 | 5.61 | 5.35 | 5.66 | 2 | 2 | 5.7 |
TOTALES |
|
| 35 | 35 | 100.0 |
...