Proyecto Probabilidad y Estadística
Enviado por danielaElizalde • 19 de Mayo de 2014 • 2.103 Palabras (9 Páginas) • 311 Visitas
Introducción
El siguiente trabajo de investigación de la materia “Probabilidad y Estadística” tiene como finalidad aplicar los conocimientos adquiridos a lo largo del curso mediante una serie de recolecciones de datos muéstrales basados en dos variables diferentes las cuales son: el tiempo que tarda en abrir un archivo de Word y el tiempo que tarda en abrir un archivo de Power Point; a su vez se expondrán los resultados obtenidos en forma escrita y grafica para visualizar de una manera más detallada la recolección y manipulación de estos a lo largo del trabajo manejaremos ciertos términos los cuales son muy importantes tales como Media, Mediana, Varianza, Desviación Estándar, Muestra, Variable, Histograma y Frecuencia.
La importancia de la medida de los tiempos de carga de archivos ya sea en Word y Power Point es muy esencial para la mejora continua en cuanto a las tecnologías de información, pues estas son usadas día a día por gente de todas las edades desde niños hasta empresarios; la globalización también tiene un papel muy importante pues año a año la velocidad en cuanto a procesamiento computacional aumenta de manera acelerada.
Un punto importante a destacar en este trabajo es la variabilidad de los datos investigados; actualmente existen muchas marcas y modelos de computadoras las cuales no funcionan al mismo ritmo es por eso que la recolección de datos no es la misma siempre son diferentes.
Después de leer y analizar este trabajo seremos capaces de responder las siguientes preguntas: ¿Qué archivos abren más rápido?, ¿Es verdad que siempre el primer archivo tarda más? ¿Cuál tarda más Word o Power Point? ¿Qué tanta variación hay entre ambos programas? ¿Hay un estándar de tiempo puesto por Microsoft para abrir los programas? Estas preguntas serán respondidas mediante mediciones, gráficas y recolecciones de datos.
Así mismo el propósito del trabajo es ayudar a personas encargadas de los sistemas de información a que conozcan el tiempo que tardan los archivos de Word Y Power Point en abrir y como se pueden mejorar haciéndolos más eficientes y eficaces.
Explicar la teoría
Conceptos y aplicación de la estadística.
La estadística estudia la forma de organizar, resumir y analizar un conjunto de datos con el fin de observar e interpretar su comportamiento. La estadística se divide en dos partes:
Estadística descriptiva: Se ocupa de la organización grafica o numérica de los datos, ya sean de una población o de una muestra.
Estadística inferencial: Trata de los métodos de selección de muestras y utiliza los métodos de organización de la estadística descriptiva para su análisis.
El muestreo estudia los métodos de selección de las observaciones para obtener una muestra representativa. Una muestra representativa debe contener los diferentes elementos presentes en la población.
Las técnicas estadísticas se utilizan para describir y comprender la variabilidad, la cual es inherente a todos los procesos y sistemas de la vida cotidiana. La variabilidad es el cambio de condición al llevar a cabo un experimento. Como la variabilidad no se puede eliminar, el interés del investigador recae en reducir la variabilidad de los procesos.
El universo de estudio es el grupo de individuos u objetos sobre los cuales se realiza una investigación.
Una variable es una característica común entre el grupo de individuos u objetos que se estudia. Las variables se clasifican en categóricas y numéricas.
Las variables categóricas asumen valores representados mediante categorías. Estas se clasifican en nominales y ordinales. Las variables categóricas nominales no presentan una relación de jerarquía entre sus valores, por lo tanto no existe un orden para acomodarlas. Las variables categóricas ordinales si pueden establecer jerarquías entre sus valores, por lo tanto si existe un orden para acomodarlas.
En las variables numéricas los posibles valores son números y se clasifican en discretas y continuas. Entre cada valor de las variables numéricas discretas existe una cantidad finita de valores, en la mayoría de los casos son números enteros. Entre cada valor de las variables numéricas continuas existe una cantidad infinita de valores; por lo general son números con decimales.
Población y muestra.
La población es el conjunto de características observadas en cada elemento del universo estudiado.
Una muestra es una parte del conjunto de características observadas en la población. El tamaño de la muestra se representa con la letra n.
Organización y descripción grafica de un conjunto de datos.
La frecuencia cuenta cuantas veces aparece cada dato en el conjunto y se representa con la letra f.
La frecuencia relativa es el cociente de la frecuencia del dato entre el número total de datos. La frecuencia acumulada se calcula sumando la frecuencia hasta un determinado nivel. La frecuencia relativa acumulada se calcula sumando la frecuencia relativa hasta un determinado nivel.
Graficas: histogramas, polígonos y ojivas.
Grafica de barras: Se utiliza para graficar variables categóricas y se construye con las barras separadas. En el eje de las “x” se representa las categorías y en el eje de las “y” se representa la frecuencia.
Histograma: Se utiliza para graficar variables numéricas y las barras van unidas. En el eje de las “x” se representa los datos o la marca de clase, y en el eje de las “y” se representa la frecuencia.
Polígono de frecuencias: Se construye con puntos y al final se unen. La altura del punto es la frecuencia. En el eje de las “x” se representa los datos o la marca de clase, y en el eje de las “y” se representa la frecuencia.
Ojiva: También se construye con puntos que al final se unen, pero se grafica con frecuencias relativas acumuladas o frecuencias acumuladas.
Medidas Descriptivas de los datos
Nombre Características Símbolo
Media Se obtiene sumando todos los datos y dividiendo el resultado entre la cantidad total de estos. μ o x ̅
Mediana Es el valor central de un conjunto ordenado de datos . (μ ) ̃ o x ̃
Moda Es el dato que más se repite. Si el conjunto de datos no contiene una moda se llama unimodal. Si el conjunto de datos contiene dos modas se llama bimodal, etc. μ ̂ o x ̂
Varianza Es una medida que ayuda a observar que tanta variación, en promedio, existe entre los elementos de un conjunto. Entre mayor sea la varianza, existe mayor variación. Se expresa en unidades al cuadrado. σ^2 o s^2
Desviación estándar Es la raíz cuadrada de la varianza y ayuda a observar más fácilmente la variación entre los valores del conjunto, pues se expresa en las
...