Recopílación de datos
Enviado por jupitersake • 29 de Octubre de 2012 • 3.345 Palabras (14 Páginas) • 456 Visitas
Recopílación de datos
Este análisis de Datos requiere de la Estadística como una de sus principales herramientas, por lo que los investigadores de profesión y las personas que de una y otra forma la realizan requieren además de los conocimientos especializados en su campo de actividades, del manejo eficiente de los conceptos, técnicas y procedimientos estadísticos
La estadística es la ciencia que estudia los métodos que permiten realizar este proceso para variables aleatorias. Estos métodos permiten resumir datos y acotar el papel de la casualidad (azar). Se divide en dos áreas:
Estadística descriptiva La descripción completa de una variable aleatoria está dada por su función densidad de probabilidad (fdp). Afortunadamente una gran cantidad de variables de muy diversos campos están adecuadamente descritas por unas pocas familias de fdps: binomial, Poisson, normal, gamma, etc. Dentro de cada familia, cada fdp está caracterizada por unos pocos parámetros, típicamente dos: media y varianza. Por tanto la descripción de una variable indicará la familia a que pertenece la fdp y los parámetros correspondientes.
Estadística inferencial. Los dos tipos de problemas que resuelven las técnicas estadísticas son: estimación y contraste de hipótesis. En ambos casos se trata de generalizar la información obtenida en una muestra a una población. Estas técnicas exigen que la muestra sea aleatoria. En la práctica rara vez se dispone de muestras aleatorias, por la tanto la situación habitual es la que se esquematiza en la figura.
Población y muestra
Al recoger datos relativos a las características de un grupo de individuos u objetos, sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fábrica, suele ser imposible o nada práctico observar todo el grupo, en especial si es muy grande. En vez de examinar el grupo entero, llamado población o universo, se examina una pequeña parte del grupo, llamada muestra. Una población puede ser finita o infinita. Por ejemplo, la población consistente en todas las tuercas producidas por una fábrica un cierto día es finita, mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita. Si una muestra es representativa de una población, es posible inferir importantes conclusiones sobre las poblaciones a partir del análisis de la muestra. La fase de la estadística que trata con las condiciones bajo las cuales tal diferencia es válida se llama estadística inductiva o inferencia estadística. Ya que dicha inferencia no es del todo exacta, el lenguaje de las probabilidades aparecerá al establecer nuestras conclusiones. La parte de la estadística que sólo se ocupa de describir y analizar un grupo dado, sin sacar conclusiones sobre un grupo mayor, se llama estadística descriptiva o deductiva.
Muestra aleatoria: muestra elegida independientemente de todas las demás, con la misma probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de otros y con la misma probabilidad.
Intervalos de Clase
Los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Tamaño de intervalos
a) Intervalo abierto: Se colocan los límites del intervalo entre paréntesis, esto quiere decir que la función no toca los límites.
Por ejemplo, los limites (3,5), la función va de 3.0001 hasta 4.9999.
b) Intervalo cerrado: Los límites se expresan entre corchetes, esto significa que la función empieza en el límite inferior y termina en el limite superior.
Por ejemplo, los limites [3,5], significa que la función empieza en 3 y termina en 5
c) Intervalo Semiabierto: Se expresa con un paréntesis de un lado y un corchete del otro, por ejemplo (3,5], esto significa que la función empieza en 3.0001 y termina en 5
Distribución de frecuencias
A la agrupación de datos en categorías mutuamente excluyentes que indican el si de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.
Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.
Una distribución de frecuencias es una tabla en la que se organizan los datos en clases, es decir, en grupos de valores que describen una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases.
Datos no agrupados
Tendencia central: la tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen como medidas de posición.
Dispersión: se refiere a la extensión de los datos en una distribución, es decir, al grado en que las observaciones se distribuyen.
Datos Agrupados
Medidas de Dispersión Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.
Medidas de Tendencia central La estadística busca entre otras cosas, describir las características típicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulación más alta de datos se encuentra en los valores intermedios.
Las medidas de tendencia central comúnmente empleadas son :
Media aritmética
Mediana
Moda
Media geométrica
Media armónica
Los cuantiaos
Estudio Descriptivo
Ayudará a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos..... Los resultados recogidos en la muestra se resumen en una matriz de datos N x M , en la cual N es el número de unidades de análisis utilizadas ( número de casos ) y M es el número de características de dichas unidades , unidades de las que tenemos información. Transformación de los datos : la transformación persigue la consecución de una distribución aproximada a la normal. Tipos de transformación :
Lineales : suma , resta , división , multiplicación , cambia los valores brutos ( datos obtenidos ) de la variable sin alterar nada mas.
No lineales monotónicas : cambian los valores originales y tambien sus distancias pero no el orden
No lineales no
...