Inferencial
Enviado por jandrochavez • 18 de Junio de 2014 • 2.354 Palabras (10 Páginas) • 165 Visitas
Análisis de Varianza a una vía: Diseño completamente aleatorizado
Hay varias formas en las cuales puede diseñarse un experimento ANOVA. Quizás el más común es el diseño completamente aleatorizado a una vía. El término proviene del hecho que varios sujetos o unidades experimentales se asignan aleatoriamente a diferentes niveles de un solo factor. Por ejemplo: varios empleados (unidades experimentales) pueden seleccionarse aleatoriamente para participar en diversos tipos (niveles diferentes) de un programa de capacitación (el factor).
El análisis de varianza se basa en una comparación de la cantidad de variación en cada uno de los tratamientos. Si de un tratamiento al otro la variación es significativamente alta, puede concluirse que los tratamientos tienen efectos diferentes en las poblaciones.
Esta variación entre el número total de las 14 observaciones. Esto se llama variación total.
Existe variación entre los diferentes tratamientos (muestras). Esto se llama variación entre muestras.
Existe variación dentro de un tratamiento dado (muestra). Esto se denomina variación dentro de la muestra.
TAMAÑO DE LA MUESTRA PARA ESTIMAR MEDIAS Y PROPORCIONES.
El tamaño de la muestra que debemos escoger para hacer una estimación del parámetro con las características especificadas(de nivel de confianza y error de estimación.) es un problema de gran importancia ya que:
1. Si tomamos una muestra más grande de la indicada para alcanzar los resultados propuestos, constituye un desperdicio de recursos(tiempo, dinero, etc.); mientras que una muestra demasiado pequeña conduce a menudfo a resultados poco confiables.
2. cuando elegimos una muestra de tamaño n sólo revisamos una fracción o parte de la población y con base en ella tomamos decisiones que afectan a toda la población. Es evidente que por este procedimiento se abre la posibilidad de que nos equivoquemos en nuestras decisiones, pero esta posibilidad depende en gran medida del tamaño de muestra o fracción de población que se haya analizado.
El tamaño que debe tener la muestra depende del nivel de confianza propuesto, así como del máximo error que estemos dispuestos a admitir entre el valor estimado y el valorreal del parámetro que corresponde al error de estimación.
Veamos cómo se determinaría el tamaño de la muestra a partir de la consideración del nivel de confianza y del error de estimación cuando hacemos muestreo con repetición o en poblaciones infinitas.
Supongamos que d es el error de estimación(precisión) y el nivel de confianza es 100(1- ) para la estimación de la media de una población normal con varianza conocida , con estos datos formamos la ecuación d=
De esta ecuación, elevando al cuadrado obtenemos d2=Z2 de esta ecuación despejamos nd2=Z2 por lo tanto n = .
Esta fórmula nos permite obtener el tamaño de la muestra cuando tratamos de estimar un intervalo de confianza para la media con error de estimación y nivel de confianza dados.
El tamaño de la muestra depende de dos elementos básicos(supuesta dada la varianza) que hay que sopesar cuando se va a tomar una decisión al respecto; se trata del nivel de confianza y del error de estimación y tenemos:
1. El tamaño de la muestra aumenta a medida que aumenta el nivel de confianza para un error de estimación y una varianza dados.
2. El tamaño de la muestra aumenta a medida que disminuye el error de estimación para un nivel de confianza y varianza dados.
Si la población es finita y el tamaño de ésta debeser tenida en cuenta, el tamaño muestral viene dado por:
En las dos fórmulas anteriores aparece la varianza, por lo tanto es necesario conocerla. Si es desconocida debe ser estimada por cualquiera de los medios siguientes:
1. Se toma una muestra preliminar llamada “muestra piloto” y estimamos la varianza mediante S2. Si el tamaño de la muestra piloto es inferior a 30 se recomienda emplear el valor t en lugar del valor normal.
2. Se utilizan estimaciones previas que se hayan hecho acerca de la varianza en estudios anteriores.
3. Si existe evidencia de que la población estudiada tiene distribución normal, estimaremos mediante A/4 donde A es la amplitud o rango de la población. Este método requiere el conocimiento del valor máximo y mínimo de la varianza investigada.
Caso de la proporción poblacional. En este caso el tamaño de la muestra esta dado por:
n =
Cuando no se da estimación alguna para la proporción, utilizaremos la fórmula anterior tomando =0´5. Esto arroja por lo general una muestra mucho mayor de la indicada.
Si el tamaño de la población debe ser tenido en cuenta el tamaño de muestra esta dado por:
n =
PRUEBA DE INDEPENDENCIA
ji-cuadrado
En una prueba de independencia el único número que el investigador controla directamente es el tamaño total de la muestra. Se extrae una muestra de tamaño n de la población y cada objeto se clasifica según las dos variables que se estudian. Ni las frecuencias de cada celda, ni los totales de fila y columna se conocen de antemano.
El investigador no fija previamente ningún conjunto, es decir, son aleatorios.
El planteamiento de las Hipótesis será:
H 0 : A y B son independientes
H 1 : A y B no son independientes
Independencia significa que el conocimiento del nivel de clasificación de un objeto respecto a la característica A no tiene nada que ver con su nivel respecto a la característica B. Para expresar esta idea matemáticamente utilizamos las probabilidades dadas en la siguiente tabla:
Tabla de contingencia 2 x 2 con proporciones o probabilidades
Variable 1 (A)
Variable 2
(B) Si No Total
Si p 11 p 12 p 1.
No p 21 p 22 p 2.
Total p .1 p .2 1
Se sabe que, para que dos sucesos sean independientes, la probabilidad de que ocurran ambos a la vez debe ser igual al producto de las probabilidades de que cada suceso ocurra individualmente.
P[A y B] = P[A]P[B]
O
p 11 = p .1 p 1.
La relación debe cumplirse para cada celda. Por tanto, la hipótesis nula de independencia se expresa matemáticamente como
i = 1, 2
H 0 : p ij = p i. P .j
j = 1, 2
i = 1, 2
H 1 : p ij ? p i. P .j
j = 1, 2
Comparamos el número de observaciones en cada celda con el número esperado, si H 0 es cierta. Si estos números difieren poco, no hay razón para
...