PEC3. Recogida, tratamiento y análisis de datos
Enviado por jordirq • 10 de Enero de 2023 • Práctica o problema • 3.067 Palabras (13 Páginas) • 298 Visitas
PEC3. Recogida, tratamiento y análisis de datos
Soluciones orientativas
Prueba de evaluación continua 3. Recogida, tratamiento y análisis de datos
Cada estudiante recibirá un comentario personalizado del trabajo realizado dado que no hay unas soluciones únicas para esta PEC. Aun así, se facilita un ejemplo completo para facilitar el autoaprendizaje y autoevaluación.
- Tratamiento y análisis de datos: los siguientes gráficos presentan algunos problemas para representar una visión adecuada del fenómeno que pretende describir. Interpreta primero el gráfico, y a continuación, identifica las deficiencias y propone qué forma seria más adecuada para corregir estas deficiencias. Identifica un tema de investigación que te interese.
- Caso 1. Death rates due to COVID-19 by age, health condition, and gender
[pic 1]
La visualización, con el eje del índice de fatalidad terminando en 15% en lugar de 100%, hace que la situación “se vea mucho peor de lo que es”. Incluso si podemos leer la visualización y ver que la tasa de mortalidad más alta es del 15%, vemos que la barra naranja en la parte superior se extiende por toda la vista, y ese 15% parece mucho más grande de lo que realmente es, y, hay riesgo de que percibamos que eso significa el 100%. Lo que falta en esta vista es el contexto. La visualización de estos datos no cuenta la historia completa de los datos. No hay espacio para que visualicemos a las personas que sobrevivieron a la enfermedad, y en realidad no sabemos de dónde provienen estos datos en primer lugar. Cuando se comunican datos, sobre todo en temas de epidemia, es muy importante conocer de dónde proceden los datos. Para recrear la visualización y que transmita el contexto necesario se podrían agregar valores porcentuales a las barras, o incluso, extender el eje de la tasa de mortalidad a 100% para que las tasas muestren contexto.
[pic 2]
- Caso 2. COVID-19 looks a lot closer to the season flue
[pic 3]
Fuente: Time.com (march 9, 2020)
Lo que está mal en el gráfico es la propia representación en sí mismo y la falta de contextualización. Los gráficos circulares muestran la composición de cada caso (enfermedad), y, aunque la tasa de mortalidad representa un subconjunto de un valor total, en contexto, estos gráficos son francamente engañosos. Lo primero que debemos tener en cuenta es que la pandemia de Covid-19 aún se estaba desarrollando en 2020. Por lo tanto, no es justo comparar las tasas de mortalidad por Covid-19 con brotes anteriores que han seguido su curso. Los datos de la gripe estacional, por ejemplo, son un promedio anual compilado durante muchos años de recopilación de datos, y, en este caso son solo para los EE. UU. Por lo tanto, esta no es una comparación equitativa (no estamos comparando las mismas variables).
También falta algo de contexto esencial en estos gráficos. La tasa de infección, también conocida como R cero o R0 para abreviar, puede tener un enorme impacto en el volumen de mortalidad. La ciencia de Covid-19 aún se estaba desarrollando cuando se presentaron estos datos, y las ratios de infecciones eran diferentes. Todo esto se suma a varios errores importantes con este gráfico. Primero, un gráfico circular no es la mejor manera de mostrar estos datos. En segundo lugar, solo mostrar las tasas de mortalidad en este gráfico descuida el contexto esencial que el lector podría necesitar. Y tres, como cuestión de principio, no es tan productivo comparar la tasa de mortalidad de Covid-19 en esta etapa de la pandemia. Así que el punto débil de la representación de estos datos aquí es el contexto.
- Covid-19's mortality rate
[pic 4]
En cuanto al formato y la presentación, el diseño del gráfico es correcto para representar estos datos. Incluso tomaron algunas decisiones de diseño sólidas, como asegurarse de que ambos gráficos usen el mismo rango del eje, así como extender las líneas de cuadrícula horizontales en ambos gráficos.
El problema es cómo el autor ha comparado los datos. En primer lugar, los datos del lado izquierdo se basan en las tendencias de la gripe estacional solo en los EE. UU., mientras que los datos del lado derecho se basan en los datos de casos de Covid-19 de Corea del Sur. Estos no son conjuntos de datos directamente relacionados, por lo que se debe tener cuidado al comparar datos de dos momentos, países y fuentes diferentes (es decir, gripe estacional frente a Covid-19).
Pero el problema más grande aquí radica en el eje de las X, ya que los dos gráficos usan intervalos de edad completamente diferentes, lo que dificulta y confunde al lector para hacer comparaciones. Es probable que esto sea el resultado de cómo se estructuraron los conjuntos de datos originales.
Una vez más, comparar los datos históricos de gripe estacional en los EE. UU. con los datos actuales de casos de Covid-19 en Corea del Sur no es de utilidad (se comparan cosas de contextos distintos). Pero si se pretende hacer una comparación hay distingas opciones para hacer que el eje sea más comparable. Por ejemplo, los grupos de edad tienen un corte a los 50 años. Por lo tanto, se podría calcular un promedio para los menores de 50 y los mayores de 50 años en ambas influenzas. Sin embargo, se debería tener en cuenta los datos reales del caso y calcular un promedio ponderado. Pero es factible y haría que los datos fueran mucho más fáciles de comparar.
- Las siguientes preguntas se han extraído y/o adaptado de diferentes cuestionarios on-line y también presentan algún problema. Identifica el problema y proporciona una redacción alternativa de pregunta que supere estas deficiencias.
- ¿Crees que tu familia estaría encantada de disfrutar de una salida en globo por la Capadocia?
Sí No[pic 5][pic 6]
El problema de esta pregunta es que es claramente tendenciosa: “encantada de disfrutar”. A parte de pedir la opinión de toda la familia también podría llevar a interpretaciones muy diversas por parte de los encuestados. Por último, no ofrece la posibilidad de “no sé/no contesto”. Puede que el encuestado no conozca las preferencias de toda la familia en relación a este tipo de actividad. Una posible redacción alternativa seria:
¿Crees que a la mayor parte de los miembros de tu familia les gustaría hacer una salida en globo por la Capadocia?
...