Análisis estadístico: tipos de datos

Ver también: Entendiendo las correlaciones

Nuestra pagina en Investigación observacional y datos secundarios describió dos fuentes principales de datos (su propia investigación y los datos que se han publicado anteriormente). Sin embargo, también hay muchos tipos diferentes de datos, y los datos se pueden clasificar de varias formas diferentes. El tipo de datos afectará las formas en que puede usarlos y qué análisis estadístico es posible. También afectará a las conclusiones e inferencias que pueda sacar.

Por tanto, la elección del tipo de datos es muy importante. Esta página describe algunas de las distinciones en los tipos de datos y las implicaciones para los métodos de investigación y los hallazgos.

Datos cuantitativos versus cualitativos

La primera y más obvia distinción es entre datos cuantitativos y cualitativos:



  • Datos cuantitativos son numéricos: pueden recopilarse y presentarse como números; y

  • Datos cualitativos no son numéricos.

Nuestra pagina en investigación cualitativa y cuantitativa explica esta distinción con más detalle y expone las ventajas y desventajas de ambos.

Datos objetivos frente a datos subjetivos

Los datos también se pueden dividir en objetivo y subjetivo.

  • Los datos objetivos son observables y medibles . Incluyen cosas como altura, peso o cantidad de elementos. Por lo general, se recopilan mediante observaciones o mediciones directas.

  • Los datos subjetivos se recopilan de comunicaciones personales de individuos. . Esto puede ser hablado o escrito, pero también puede tomar otras formas. Por ejemplo, el lenguaje corporal puede proporcionar información subjetiva (' Se quedó quieta, con los ojos cerrados y la boca apretada [objetiva], como si tuviera dolor [subjetivo] ”).

Tanto los datos objetivos como los subjetivos pueden ser tanto cualitativos como cuantitativos. Por ejemplo, puede observar (objetivo) un cambio de color (cualitativo) y puede pedirle a las personas que expresen sus opiniones sobre un tema (subjetivo) utilizando una escala numérica (cuantitativa).

¿Cómo averiguas el promedio?

Ambos tipos tienen ventajas y desventajas. Por ejemplo, los datos subjetivos pueden proporcionar una gama de información mucho más amplia, porque muchas cosas simplemente no se pueden medir. Estos incluyen variables como el nivel de dolor, donde cada uno tiene su propia interpretación. Incluso el uso de una escala del 1 al 10, que hace que los datos sean cuantitativos, no significa que serán directamente comparables entre individuos.

Sin embargo, los datos subjetivos también dependen de que las personas recuerden y evalúen las cosas con precisión. Por lo tanto, es probable que los datos subjetivos sean menos confiables cuando las personas tienen que recordar eventos de hace más tiempo.

Por lo tanto, cuando es posible, se prefieren los datos objetivos, pero existe un entendimiento general de que a veces solo se dispone de datos subjetivos.



Datos longitudinales frente a datos transversales

La distinción entre datos longitudinales y transversales es en realidad más una distinción en diseño del estudio que el tipo de datos.

  • Estudios longitudinales trabajar con el mismo grupo a lo largo del tiempo. Por tanto, pueden mostrar cambios a lo largo del tiempo e identificar la causalidad.

  • Estudios transversales puede recopilar datos en diferentes momentos, pero de diferentes grupos. Por lo tanto, solo pueden mostrar una instantánea o una serie de instantáneas en el tiempo.

La distinción crucial entre los dos tipos de estudio y, por tanto, los datos, es que los datos longitudinales pueden demostrar la causalidad.

En general, se considera imposible demostrar la causalidad a partir de datos transversales, porque solo tiene información sobre un momento en el tiempo. Por lo tanto, no es posible cambiar algo y ver qué efecto tiene (es decir, si hay un relación causal ).

Sin embargo, los estudios transversales son mucho más convenientes. Solo tiene que realizar una única encuesta o investigación, en lugar de seguir una cohorte a lo largo del tiempo. Los estudios longitudinales pueden proporcionar datos de muy alta calidad y mostrar las causas, pero adolecen de problemas como el abandono de la cohorte. También es difícil conseguir financiación para estudios longitudinales de alta calidad a largo plazo.

Ejemplo: combinación de investigación transversal y longitudinal


los Estudio de Comunicación y Lenguaje en la Educación de Surrey (SCALES ) es un buen ejemplo de un estudio longitudinal a largo plazo, que también incluyó algunos elementos transversales.

¿Cuáles son las propiedades de un polígono?

El primer elemento del estudio fue una encuesta a gran escala de niños en el año de recepción en 180 escuelas primarias en Surrey. Todos los niños de la población fueron evaluados para determinar sus habilidades lingüísticas al ingresar a la escuela, a través de una encuesta completada por los maestros de la clase para cada niño. Se les preguntó sobre comportamiento, lenguaje y habilidades sociales. Esto brindó una instantánea de las habilidades lingüísticas al ingresar a la escuela y permitió a los investigadores evaluar si el plan de estudios coincidía con la capacidad y establecer que los niños más pequeños tenían más probabilidades de tener problemas de lenguaje.

La siguiente etapa seleccionó una muestra de 590 niños de los examinados, estratificados utilizando los hallazgos de la primera etapa para dar una gama de habilidades lingüísticas. Fueron vistos por un investigador en el primer año y nuevamente en el tercer año, y se evaluaron sus habilidades lingüísticas. También se pidió a los padres que proporcionaran información sobre el lenguaje y el comportamiento en ambos puntos.

La siguiente etapa siguió a la cohorte SCALES original en los años 6 y 8, para evaluar sus resultados sociales, emocionales y de salud mental.

Los investigadores estaban interesados ​​en el vínculo entre el desarrollo del lenguaje en la primera infancia y el desarrollo social y emocional en la adolescencia. Este tipo de información simplemente no puede obtenerse de un estudio transversal o de dos estudios separados a diferentes edades. Puede pedirles a los participantes y a los padres que piensen en retrospectiva, pero el lapso de tiempo es tal que es poco probable que el recuerdo sea confiable.

Datos categóricos, continuos, discretos y clasificados

Otra distinción son los datos categóricos, continuos, discretos o clasificados:

  • Los datos categóricos se dividen en distintos grupos o categorías .

    Por lo tanto, incluyen, por ejemplo, el género, si le gustan los helados y si alguna vez ha visitado un país en particular. También pueden incluir la edad si se agrupa en grupos de diez o cinco años.

  • Los datos continuos se definen como aquellos que pueden tomar un número infinito de valores entre dos valores cualesquiera.

    Esto suena complicado, pero en realidad es simple. Estos son datos como el peso o la altura, que pueden ser cualquier valor dentro del rango de pesos y alturas posibles, no valores fijos o porcentaje de una clase a la que le gustan los helados (cualquier valor dentro del rango 0-100%). Cada punto de datos es un número distinto y separado, y no se incluye en un grupo. La edad, por ejemplo, se incluiría si la mide con mucha precisión en días o fracciones de año, en lugar de años completos.

  • Los datos discretos se definen como aquellos que tienen un número definido de valores posibles entre dos valores cualesquiera

    Por lo tanto, los datos discretos incluyen el número de quejas de los clientes o el número de personas a las que les gusta el helado, es decir, no puede tener la mitad de una queja o un tercio de una persona. Otro ejemplo sería la edad en años completos. A los efectos del análisis, los datos discretos se consideran muy similares a los datos continuos.

  • Los datos clasificados se han ordenado y ordenado, y luego se han numerado según su orden de clasificación.

    Por ejemplo, si tuviera cuatro bits de datos con valores 4, 6, 3 y 7, podría clasificarlos en orden ascendente como 3, 4, 6 y 7. Luego tomarían su orden de clasificación, por lo que 3 sería 1 (1º), 4 sería 2 (2º), y así sucesivamente. Los datos generalmente se clasifican cuando lo único que le interesa es el orden y no los valores absolutos. Este suele ser el caso cuando dos variables cambian juntas, pero no tienen una relación lineal (es decir, cambian a ritmos diferentes). Por ejemplo, el siguiente gráfico muestra este tipo de relación (en este caso, exponencial).

    Gráfico que muestra la relación exponencial entre dos variables.

    ¡Advertencia!


    Es importante recordar que cuando clasifica los datos, pierde información.

    Por lo tanto, esto solo debe hacerse cuando realmente lo necesite.


Estos cuatro tipos de datos son adecuados para diferentes tipos de análisis, y deberá utilizar diferentes pruebas estadísticas y formas de análisis para cada uno.

Para obtener más información sobre el uso de diferentes tipos de datos para el análisis, puede consultar nuestra página en Correlaciones .

Conclusión

Hay muchos tipos diferentes de datos que puede recopilar como parte de su investigación. La elección del tipo de datos suele estar impulsada por sus métodos de investigación, que a su vez están impulsados ​​por su pregunta de investigación y su enfoque general de la investigación. Sin embargo, la elección del tipo de datos también tiene implicaciones para el tipo de análisis y las conclusiones que puede extraer.


Continuar con:
Entendiendo las correlaciones
Análisis estadístico simple