Analisis multivariable

Ver también: Métodos de búsqueda

Nuestras paginas Análisis estadístico simple , Desarrollar y probar hipótesis y Intervalos de importancia y confianza explicar algunas de las técnicas más sencillas utilizadas para el análisis estadístico. Esta página analiza algunas de las técnicas más avanzadas, que involucran varias variables y no solo una o dos.

En la vida real, a diferencia de la investigación de laboratorio, es probable que descubra que sus datos se ven afectados por muchas cosas además de la variable que desea probar. Existen correlaciones entre elementos que nunca ha considerado y el mundo es complejo.

El propósito del análisis estadístico avanzado es simplificar algunas de las relaciones, al tiempo que crea un modelo más eficaz de lo que está viendo.




Hay cuatro formas de simplificar el análisis

  • Diseño
  • Usar submuestras
  • Usar controles estadísticos
  • Analisis multivariable

1. Diseño

Puede diseñar su investigación de modo que los factores causales sean independientes entre sí. Por ejemplo, si cree que puede haber un vínculo entre la edad y el salario, entonces una muestra aleatoria de empleados correrá el riesgo de combinar los efectos de ambos. Sin embargo, si divide la población en grupos por edad, y luego muestrea al azar números iguales de cada grupo, habrá hecho que la edad y el salario sean independientes.

2. Uso de submuestras

Aquí, selecciona su muestra para que sea igual en cualquier factor de confusión potencial. Por ejemplo, el tipo de trabajo puede afectar el salario, por lo que si desea estudiar los efectos de otro factor en el salario, puede seleccionar solo personas que hagan el mismo trabajo.

3. Uso de controles estadísticos

Si sospecha que pueden estar vinculadas tres variables, puede control para que uno pruebe las correlaciones entre los otros dos. Efectivamente, ajusta el valor estadístico del control para que sea constante y prueba si todavía existe una relación entre las otras dos variables. Puede encontrar que la relación observada permanece alta (es real) o se reduce considerablemente (probablemente no haya una relación real). Hay un tercer caso: donde no hay relación hasta que controlas la tercera variable, lo que significa que la variable de control está enmascarando la relación entre las otras dos.

4. Análisis multivariado

El análisis multivariado incluye muchos métodos estadísticos que están diseñados para permitirle incluir múltiples variables y examinar la contribución de cada una.

Los factores que incluya en su análisis multivariante seguirán dependiendo de lo que desee estudiar. Algunos estudios querrán ver la contribución de ciertos factores y otros estudios para controlar esos factores como (más o menos) una molestia.

Dos tipos de variables

En el análisis multivariado, lo primero que hay que decidir es el papel de las variables.

Hay dos posibilidades:

cómo controlar mejor tus emociones
  • La variable causas Un efecto: variable predictora
  • La variable es afectado : variable dependiente

Esta es una función de su modelo, no de las variables en sí mismas, y la misma variable puede estar en diferentes estudios.

Las relaciones entre variables suelen estar representadas por una imagen con flechas:

Diagrama para mostrar la relación entre variables.

También puede observar las variables directamente o inferirlas de lo que está sucediendo. Estos se conocen como variables latentes .

¿Qué es un polígono de cuatro lados?

Ejemplo: éxito en la escuela


Es difícil de medir ' éxito en la escuela ': es un variable latente .

Podrías decidir eso ' éxito en la escuela 'consiste en el éxito académico, junto con alguna medida de éxito social (tal vez la duración promedio de las amistades o el tamaño del' grupo de amigos ') más un esfuerzo realizado (que podría medir como percepciones de los estudiantes o los maestros). Estas son sus variables observadas.

los modelo de medición examina la relación entre las variables observadas y latentes.


Variables subjetivas y objetivas


Siempre que esté investigando, es probable que haya diferentes tipos de datos involucrados. Por ejemplo, aquí hay tanto datos objetivos (éxito académico, duración media de la amistad) como datos subjetivos (esfuerzo percibido). El tipo de datos que elija tendrá un efecto en la calidad de su investigación y también en las conclusiones que pueda extraer.

Hay más sobre esto en nuestra página en Tipos de datos .

La idea detrás de estos modelos es que existen correlaciones entre las variables observadas y latentes (para comprender más, es posible que desee leer nuestra página en Correlaciones ).

Se supone que estas correlaciones son causadas por factores comunes . Cuanto mayor sea la influencia de los factores comunes (la carga de factor ), mayores son las correlaciones entre las variables latentes y observadas. Por lo tanto, debe medir estas correlaciones para evaluar la confiabilidad, lo que puede hacer de varias maneras. Uno de los más comunes es usar una construcción llamada Alfa de Cronbach (que la mayoría de los paquetes de software estadístico calcularán por usted). Esto evalúa si su variable observada mide realmente la variable latente de interés, es decir, si la variable observada es una prueba confiable para la variable latente. Un valor de 0,70 o más da un buen nivel de fiabilidad al modelo.

Alfa de Cronbach se utiliza para medir las correlaciones entre variables. Un valor de 0,70 o más da un buen nivel de fiabilidad al modelo.


Análisis de modelos de medición en análisis multivariable

Existe una variedad de métodos de análisis para modelos de medición como este. Incluyen Análisis factorial confirmatorio y Análisis factorial exploratorio , y generalmente se llevan a cabo por computadora.

Los detalles de cómo llevar a cabo cada uno están más allá del alcance de esta página, pero la idea básica es que miden cuánta de la variación vista en el constructo general es causada por cada factor.

Modelos causales

Los modelos causales analizan la forma en que las variables se relacionan entre sí. Si bien no es posible probar la causalidad más allá de toda duda, los modelos causales le permiten decir si la relación sugerida se ajusta a los datos y qué tan bien.

La fortaleza o debilidad de cualquier modelo causal es la selección de las variables. Si se pierde un factor causal importante, sus conclusiones serán limitadas o incorrectas. Por lo tanto, vale la pena tomarse el tiempo para definir su modelo con el mayor cuidado posible.

Hay que encontrar un equilibrio entre la simplicidad y la inclusión de más variables para obtener un mejor ajuste. Obviamente, no querrá perderse una variable causal importante, e incluir más variables siempre dará un mejor ajuste. Pero debe considerar si la complejidad adicional vale la pena por la ganancia en calidad del modelo.


Los métodos de análisis adecuados para modelos causales tienden a ser los llamados modelos lineales generalizados, que incluyen análisis de regresión logística , Análisis de regresión multiple , análisis multivariado de covarianza (MANCOVA) y análisis de varianza multivariado (MANOVA) .

como elevas tu autoestima

Todos estos métodos le dan una medida de cuánta variación en las variables dependientes es causada por los predictores y, por lo tanto, si su modelo es bueno.

Nuevamente, existen paquetes de computadora que pueden realizar estos análisis por usted, pero asegúrese de comprender lo que está haciendo y de interpretar los resultados correctamente.

Modelado de ecuaciones estructurales reúne modelos de medición y modelos causales. Es una técnica de modelado por computadora que ajusta una ecuación estructural al modelo. Esta técnica es complicada, pero en esencia compara posibles modelos e identifica el que mejor se ajusta a los datos.

Un área compleja

El mundo es un lugar complejo y, a veces, la única forma de comprender lo que está sucediendo es utilizar técnicas estadísticas avanzadas para modelar.

Sin embargo, estos también son complejos y no debe embarcarse en ellos sin comprender los conceptos básicos. Si no es así, es una buena idea consultar a alguien que lo haga, generalmente un estadístico. Incluso si ha utilizado la técnica antes, es una buena idea conseguir que un estadístico eche un vistazo a lo que planea hacer y luego verifique sus resultados en caso de errores evidentes.

Un análisis deficiente socavará una buena investigación muy rápidamente.

Continuar con:
Muestreo y diseño muestral
Entendiendo las correlaciones