Saturday 18 November 2017

Manova Example In Stata Forex


Bienvenido al Instituto de Investigación y Educación Digital Stata Anotada Salida MANOVA Esta página muestra un ejemplo de análisis multivariado de varianza (MANOVA) en Stata con notas de pie de página explicando la salida. Los datos utilizados en este ejemplo son del experimento siguiente. Un investigador asigna aleatoriamente 33 sujetos a uno de tres grupos. El primer grupo recibe información dietética técnica de forma interactiva desde un sitio web en línea. El grupo 2 recibe la misma información de una enfermera practicante, mientras que el grupo 3 recibe la información de una cinta de video hecha por la misma enfermera practicante. Cada sujeto entonces hizo tres calificaciones: dificultad, utilidad e importancia de la información en la presentación. El investigador examina tres clasificaciones diferentes de la presentación (dificultad, utilidad e importancia) para determinar si hay una diferencia en los modos de presentación. En particular, el investigador está interesado en si el sitio web interactivo es superior porque es la forma más rentable de entregar la información. En el conjunto de datos, las calificaciones se presentan en las variables útiles. Dificultad e importancia. El grupo de variables indica el grupo al que se asignó un sujeto. Estamos interesados ​​en cómo la variabilidad en las tres clasificaciones puede ser explicada por un grupo de sujetos. Grupo es una variable categórica con tres valores posibles: 1, 2 o 3. Debido a que tenemos múltiples variables dependientes que no se pueden combinar, elegiremos utilizar MANOVA. Nuestra hipótesis nula en este análisis es que un grupo de sujetos no tiene ningún efecto sobre ninguna de las tres clasificaciones diferentes. Podemos empezar examinando las tres variables de resultado. Obsérvese que Stata etiqueta el grupo 1 como el grupo de tratamiento, el grupo 2 como control1. Y el grupo 3 como control2. A continuación, podemos ingresar nuestro comando MANOVA. Al mirar nuestros resultados, queremos referirnos a los valores propios de la matriz de suma de cuadrados del modelo ya la matriz de suma de cuadrados del error. Estos valores serán informativos para entender la salida de MANOVA. Para mostrar los valores, pedimos a Stata que liste la matriz de valores propios del modelo. Valores propios a Salida MANOVA b a. Valores propios: son los valores propios del producto de la matriz de suma de cuadrados del modelo y la matriz de suma de cuadrados del error. Existe un valor propio para cada uno de los tres vectores propios del producto de la matriz de suma modelo de cuadrados y la matriz de suma de cuadrados de error, una matriz 3x3. Debido a que sólo dos se enumeran aquí, podemos suponer que el tercer valor propio es cero. Estos valores propios se encuentran entre los resultados guardados de nuestra manova en Stata. Se utilizan en el cálculo de las estadísticas de las pruebas multivariadas y, por lo tanto, son útiles a considerar cuando se considera la producción de MANOVA. segundo. Salida MANOVA - En Stata, la salida MANOVA incluye cuatro estadísticos de prueba multivariante para cada variable predictora. Las cuatro pruebas se enumeran por encima de la tabla de salida. Para cada una de las cuatro estadísticas de prueba, también se muestra una estadística F y el valor p asociado. do. Wilks lambda - Esto se puede interpretar como la proporción de la varianza en los resultados que no se explica por un efecto. Para calcular Wilks Lambda, para cada autovalor, calcule 1 / (1 el autovalor), luego encuentre el producto de estas relaciones. Por lo tanto, en este ejemplo, primero calcularía 1 / (10.8919879) 0.5285446, 1 / (10.00524207) 0.9947853 y 1 / (10) 1. Luego multiplique 0,5285446 0,9947853 1 0,5258. re. Pillais traza - Esta es otra estadística de prueba multivariante. Para calcular la huella de Pillais, divida cada valor propio por 1 la raíz característica, luego sume estas relaciones. Por lo tanto, en este ejemplo, se calcularía primero 0,8919879 / (10,8919879) 0,471455394, 0,00524207 / (10,00524207) 0,005214734 y 0 / (10) 0. Cuando éstos se añaden llegamos a Pillais traza: (0,471455394 0,005214734 0) 0,4767. mi. Lawley-Hotelling traza - Esto es muy similar a Pillais Trace. Es la suma de las raíces del producto de la matriz de suma de cuadrados del modelo y la matriz suma de cuadrados del error para las dos funciones de regresión lineal y es una generalización directa de la estadística F en ANOVA. Podemos calcular el Rastreo de Hotelling-Lawley sumando las raíces características enumeradas en la salida: 0.8919879 0.00524207 0 0.8972. F. La raíz más grande de Roys - Ésta es la más grande de las raíces del producto de la matriz de la suma-de-cuadrados del modelo y de la matriz de la suma-de-cuadrados del error para las dos funciones de la regresión lineal. Debido a que es un máximo, puede comportarse de manera diferente de las otras tres estadísticas de prueba. En los casos en que los otros tres no son significativos y Roys es significativo, el efecto debe ser considerado insignificante. gramo. Fuente: indica la variable predictora en cuestión. En nuestro modelo, estamos considerando al grupo como una fuente de variabilidad en las calificaciones. marido. Estadística - Esta es la estadística de la prueba para la fuente dada en la columna anterior y la estadística multivariable indicada con la letra (W, P, L o R). Para cada variable independiente, se calculan cuatro estadısticas de prueba multivariante. Véase los superíndices c, d, ey f. yo. Df - Este es el número de grados de libertad. Aquí, nuestro predictor tiene tres categorías y nuestro conjunto de datos tiene 33 observaciones, por lo que tenemos 2 grados de libertad para la hipótesis, 30 grados de libertad residual y 32 grados de libertad totales. J. F (df1, df2), F - Las dos primeras columnas (df1 y df2) enumeran los grados de libertad utilizados para determinar las estadísticas F. La tercera columna enumera la estadística F para la fuente dada y la prueba multivariante. K Prob gt F - Este es el valor p asociado con la estadística F de un efecto dado y la estadística de la prueba. La hipótesis nula de que un determinado predictor no tiene efecto sobre ninguno de los resultados se evalúa con respecto a este p-valor. Para un nivel alfa dado, si el valor p es menor que alfa, se rechaza la hipótesis nula. Si no es así, no rechazamos la hipótesis nula. En este ejemplo, rechazamos la hipótesis nula de que el grupo no tiene ningún efecto sobre las tres clasificaciones diferentes al nivel alfa .05 porque los valores p son todos menores que .05. L E exacto, un aproximado, u límite superior en F - Esto indica cómo se calculó la estadística F (si era un cálculo exacto, una aproximación o un límite superior) para cada una de las pruebas multivariantes. El contenido de este sitio web no debe ser interpretado como un endoso de cualquier sitio web, libro o producto de software en particular por la Universidad de California. Bienvenido al Instituto de Investigación y Educación Digital. El código para esta página se probó en Stata 12. MANOVA se utiliza para modelar dos o más variables dependientes que son continuas con una o más variables predictoras categóricas. Nota: El propósito de esta página es mostrar cómo usar varios comandos de análisis de datos. No abarca todos los aspectos del proceso de investigación que se espera que hagan los investigadores. En particular, no cubre la limpieza y comprobación de datos, la verificación de supuestos, el diagnóstico del modelo o los posibles análisis de seguimiento. Ejemplos de análisis multivariante de varianza unidireccional Ejemplo 1. Un investigador asigna aleatoriamente 33 sujetos a uno de tres grupos. El primer grupo recibe información dietética técnica de forma interactiva desde un sitio web en línea. El grupo 2 recibe la misma información de una enfermera practicante, mientras que el grupo 3 recibe la información de una cinta de video hecha por la misma enfermera practicante. El investigador examina tres clasificaciones diferentes de la presentación, dificultad, utilidad e importancia, para determinar si hay una diferencia en los modos de presentación. En particular, el investigador está interesado en si el sitio web interactivo es superior porque es la forma más rentable de entregar la información. Ejemplo 2. Un psicólogo clínico recluta a 100 personas que sufren de trastorno de pánico en su estudio. Cada sujeto recibe uno de los cuatro tipos de tratamiento durante ocho semanas. Al final del tratamiento, cada sujeto participa en una entrevista estructurada, durante la cual el psicólogo clínico hace tres valoraciones: fisiológicas, emocionales y cognitivas. El psicólogo clínico quiere saber qué tipo de tratamiento reduce los síntomas del trastorno de pánico, medido en las escalas fisiológicas, emocionales y cognitivas. (Este ejemplo fue adaptado de Grimm y Yarnold, 1995, página 246.) Descripción de los datos Vamos a seguir el Ejemplo 1 desde arriba. Tenemos un archivo de datos, manova. dta. Con 33 observaciones sobre tres variables de respuesta. Las variables de respuesta son clasificaciones llamadas útiles. Dificultad e importancia. El nivel 1 de la variable de grupo es el grupo de tratamiento, el nivel 2 es el grupo de control 1 y el nivel 3 el grupo de control 2. Observemos los datos. Siempre es una buena idea comenzar con estadísticas descriptivas. Métodos de análisis que podría considerar A continuación se muestra una lista de algunos métodos de análisis que puede haber encontrado. Algunos de los métodos enumerados son absolutamente razonables, mientras que otros han caído de favor o tienen limitaciones. MANOVA - Esta es una buena opción si hay dos o más variables dependientes continuas y una variable predictora categórica. Análisis de funciones discriminantes - Esta es una opción razonable y es equivalente a un MANOVA de un solo sentido. Los datos podrían ser remodelados en formato largo y analizados como un modelo multinivel. ANOVAs univariadas independientes - Se pueden analizar estos datos utilizando ANOVAs univariados separados para cada variable de respuesta. El ANOVA univariado no producirá resultados multivariados utilizando información de todas las variables simultáneamente. Además, las pruebas univariadas separadas son generalmente menos potentes porque no tienen en cuenta la inter-correlación de las variables dependientes. MANOVA de un solo sentido Comenzaremos por ejecutar el comando manova. Stata proporciona cuatro pruebas multivariantes por defecto. Cada una de estas pruebas es estadísticamente significativa. Para obtener más información sobre estas pruebas, consulte nuestra página de resultados anotados Stata: MANOVA. La prueba multivariable general es significativa, lo que significa que existen diferencias entre los niveles del grupo variable. Para encontrar dónde están las diferencias, seguiremos con varias pruebas post-hoc. Comenzaremos con la prueba multivariante del grupo 1 versus el promedio de los grupos 2 y 3. Primero, usaremos el comando manova, showorder para determinar el orden de los elementos en la matriz de diseño. Saber el orden de los elementos en la matriz de diseño es necesario para ejecutar las pruebas post-hoc. (Obsérvese que el orden de los elementos en la matriz de diseño cambió en Stata 11.) Comenzaremos comparando el grupo de tratamiento (grupo 1) con un promedio de los grupos de control (grupos 2 y 3). Esto pone a prueba la hipótesis de que los grupos de control medios son iguales al grupo de tratamiento. La salida anterior indica que el cuarto elemento de la matriz es la constante, por lo que en el comando de matriz a continuación, lo pondremos a 0. Una vez que hemos creado una matriz (que llamamos c1), podemos usar el comando manovatest para probar C1. Estos resultados indican que el grupo 1 es estadísticamente significativamente diferente del promedio de los grupos 2 y 3. Ahora comparamos el grupo control 1 (grupo 2) con el grupo control 2 (grupo 3). De nuevo, necesitamos crear una matriz (llamada c2 en este ejemplo) para hacer esta comparación, y luego usar esa matriz en el comando manovatest. Los resultados indican que el grupo de control 1 no es estadísticamente significativamente diferente del grupo de control 2. Podemos usar el mando de márgenes para obtener valores predichos ajustados para cada uno de los grupos. En el primer ejemplo a continuación, obtenemos los medios previstos para la dificultad de la variable dependiente. En los dos ejemplos siguientes, obtenemos las medias predichas para las variables dependientes útiles e importantes. Estos valores pueden ser útiles para ver dónde están las diferencias entre los niveles de la variable predictora y describir el modelo. En cada una de las tres salidas anteriores, vemos que las medias previstas para los grupos 2 y 3 son muy similares, la media pronosticada para el grupo 1 es más alta que la de los grupos 2 y 3. En los ejemplos siguientes obtenemos las diferencias en los medios Para cada una de las variables dependientes para cada uno de los grupos de control (grupos 2 y 3) en comparación con el grupo de tratamiento (grupo 1). Con respecto a la dificultad de la variable dependiente. La diferencia entre las medias para el grupo de control 1 frente al grupo de tratamiento es aproximadamente de -0,61 (5,58 - 6,19). La diferencia entre las medias para el grupo de control 2 frente al grupo de tratamiento es aproximadamente de -0,82 (5,37 - 6,19). Finalmente, vamos a ejecutar ANOVAs univariados separados. Utilizaremos un bucle foreach para ejecutar el ANOVA para cada variable dependiente. Aunque ninguno de los tres ANOVAs fueron estadísticamente significativos al nivel alfa 0,05, en particular, la razón F para la dificultad fue menor que 1. Cosas a considerar Uno de los supuestos de MANOVA es que las variables de respuesta provienen de las poblaciones del grupo que son Multivariado normal distribuido. Esto significa que cada una de las variables dependientes se distribuye normalmente dentro del grupo, que cualquier combinación lineal de las variables dependientes se distribuye normalmente, y que todos los subconjuntos de las variables deben ser normales multivariables. Una prueba parcial de esta suposición se puede obtener con el comando mvtest de normalidad. Por ejemplo, mvtest normalidad difícil importancia útil. (El comando mvtest se introdujo en Stata 11.) Con respecto a la tasa de error de Tipo I, MANOVA tiende a ser robusto a las infracciones menores de la suposición de normalidad multivariante. La homogeneidad de las matrices de covarianza poblacional (a. k.a. esfericidad) es otra suposición. Esto implica que las varianzas y covarianzas poblacionales de todas las variables dependientes deben ser iguales en todos los grupos formados por las variables independientes. Una prueba de esta suposición se puede obtener con el mvtest covariance comando. Por ejemplo, mvtest covariance difícil importancia útil, por (grupo). Las muestras pequeñas pueden tener baja potencia, pero si se cumple el supuesto de normalidad multivariante, el MANOVA es generalmente más potente que las pruebas univariadas separadas. Hay al menos cinco tipos de análisis de seguimiento que se pueden hacer después de un MANOVA estadísticamente significativo. Estos incluyen ANOVA univariable múltiple, análisis de stepdown, análisis discriminante, contribución variable dependiente y contrastes multivariantes. Véase también Referencias Grimm, L. G. y Yarnold, P. R. (editores). 1995. Lectura y comprensión de las estadísticas multivariadas. Washington, D. C. Asociación Americana de Psicología. Huberty, C. J. y Olejnik, S. 2006. Aplicada MANOVA y Discriminant Analysis, Segunda Edición. Hoboken, New Jersey: John Wiley y Sons, Inc. Stevens, J. P. 2002. Estadísticas Multivariadas Aplicadas para las Ciencias Sociales, Cuarta Edición. Mahwah, Nueva Jersey: Lawrence Erlbaum Associates, Inc. Tatsuoka, M. M. 1971. Análisis Multivariable: Técnicas para la Investigación Psicológica y Educativa. Nueva York: John Wiley and Sons. El contenido de este sitio web no debe ser interpretado como un endoso de ningún sitio web, libro o producto de software en particular por la Universidad de California. Introducción a Estadísticas Multivariantes Este curso involucró estadística multivariante, pero antes de poder definir estadísticas multivariadas debemos definir qué Nos referimos a las estadísticas univariadas. Definición . Las estadísticas univariadas incluyen todas las técnicas estadísticas para analizar una sola variable de interés (variable dependiente). O si te gusta una sola variable dependiente. Nota: las estadísticas univariadas incluyen métodos, donde puede tener una o más variables explicativas (variables independientes) como ocurre en la regresión múltiple. Ejemplos de métodos univariados son cosas tales como: Sin embargo, en muchas aplicaciones estadísticas, podemos estar interesados ​​en más de una variable dependiente. Definición . Las estadísticas multivariadas incluyen todas las técnicas estadísticas para analizar dos o más variables de interés o, si se desea, dos o más variables dependientes. Echemos un vistazo a un ejemplo de un estudio estadístico multivariado. Ejemplo: Women146s Nutrition Survey En 1985, el USDA encargó un estudio sobre la nutrición de las mujeres. La ingesta de nutrientes se midió para una muestra aleatoria de 737 mujeres de 25-50 años. El objetivo del estudio fue cuantificar los hábitos nutricionales de las mujeres estadounidenses. En un estudio univariado podríamos centrarnos en un solo componente nutricional. Por ejemplo, podríamos preguntar a cada mujer en la encuesta cuánta vitamina C tomarían diariamente. Sin embargo, un estudio multivariado puede hacer preguntas más interesantes, como mirar más de un componente nutricional. Ciertamente la vitamina C no es la única variable importante relacionada con la nutrición de las mujeres. Esto por sí mismo proporcionaría una imagen muy incompleta de los hábitos alimenticios de las mujeres. Por lo tanto, esta encuesta en particular no sólo miró la ingesta diaria de vitamina C, sino también se observó en el calcio, hierro, proteína y vitamina A. Estudio multivariante. Se midieron las siguientes variables: Cuestiones de Interés En un análisis multivariado se podrían formular varias preguntas diferentes. Las preguntas más simples tienen que ver con una sola población. Estas preguntas podrían incluir: 1. Para una sola población de mujeres, podríamos preguntar: Pregunta 1. Cuál es la media de la ingesta diaria de cada nutriente y vitamina Las técnicas restantes que vamos a echar un vistazo en este curso no tienen análogos univariados. Considere esta pregunta. 4. Teniendo en cuenta los valores para la toma nutricional diaria de una mujer individual, es posible que desee preguntar si tiene o no la presión arterial alta O, en otras palabras, podemos predecir si tiene o no hipertensión sólo a partir de los datos de ingesta Como método para responder a esta pregunta podemos obtener datos de muestreo no sólo de las variables de ingesta nutricional, sino también medir la presión arterial de un gran número de mujeres con el fin de determinar si cada mujer tiene presión arterial alta. El método estadístico que vamos a ver aquí se llama Análisis Discriminante. Análisis Discriminante produce una función que puede ser capaz de predecir si una mujer tiene o no la presión arterial alta. 5. ¿Cómo es la absorción diaria de nutrientes de las mujeres en relación con su salud? Otra pregunta que se puede hacer a estas mujeres es cómo su ingesta diaria está relacionada con su salud en general. En este caso, podemos no sólo medir los diferentes aspectos de la ingesta nutricional, sino también medir otros resultados generales de salud también. Variables que incluyen: Presión arterial Frecuencia cardiaca Colesterol Glucosa Índice de masa corporal Lo que nos gustaría hacer es relacionar las variables de ingesta de nutrientes con las diversas variables generales de resultado de salud. Este método estadístico que vamos a ver aquí se llama Análisis de correlación canónica. El análisis de correlación canónica describe las relaciones entre los dos grupos de variables. 6. ¿Pueden las mujeres ser divididas o clasificadas en grupos de individuos similares Finalmente podríamos preguntar si los grupos de mujeres pueden clasificarse en grupos de individuos similares. Tal clasificación podría estar diseñada para desarrollar un protocolo educativo específico de grupo. Tal vez un protocolo educativo no se adapta a todas las mujeres. El método estadístico que vamos a ver aquí se llama Análisis de Cluster. El análisis de agrupaciones describe grupos similares dentro de una muestra grande.

No comments:

Post a Comment