A Test of the Null Hypothesis Significance Testing Procedure Correlation Argument

By David Trafimow


Summary

'Un valor de p calcula la probabilidad de un conjunto de datos si la hipótesis nula es verdadera: P(F|H0). Las personas asumen que hay una alta correlación entre la probabilidad de los hallazgos dados la hipótesis nula y la inversa: la probabilidad de la hipótesis dada los hallazgos: P(H0|F). Este documento de 2009 por David Trafimow y Stephen Rice es el primero en probar si esta suposición es realmente cierta o no. Sus hallazgos sugieren que la correlación es "poco impresionante" y no ofrece ninguna justificación para el uso de valores de p. El procedimiento de prueba de significancia de la hipótesis nula (NHSTP) ha generado mucha controversia en los últimos años. Este procedimiento ampliamente utilizado implica: Definir una hipótesis nula y una hipótesis alternativa. Recopilar datos para probar estas hipótesis. Calcular un valor de p. Un valor de p es la probabilidad de los datos observados, o algo más extremo, si la hipótesis nula es verdadera. Un valor bajo (menor a 0.05) convencionalmente significa que un investigador puede rechazar la hipótesis nula a favor de la hipótesis alternativa. El argumento más fuerte contra el valor de p es que es lógicamente inválido. Si se ha obtenido un hallazgo raro bajo la suposición de que la hipótesis nula es verdadera, esto no prueba de manera concluyente que la hipótesis nula es falsa. En otras palabras, un pequeño valor de p, P(F|H0), no implica una pequeña probabilidad de la hipótesis dada los hallazgos, P(H0|F). Para obtener eso, P(H0|F), necesitas conocer la probabilidad previa de la hipótesis. Esto implica el uso del teorema de Bayes. Rechazar una hipótesis nula en base a un pequeño valor de p requiere una suposición adicional: que hay una correlación entre la probabilidad de los datos dada la hipótesis nula y la probabilidad de la hipótesis nula dada los datos. Los autores se propusieron probar si existe o no una fuerte correlación aquí. Para realizar esta prueba, los autores necesitaban conocer tres valores clave: la probabilidad de los datos dada la hipótesis nula es verdadera, P(F|H0), la probabilidad previa de la hipótesis, P(H0), y la probabilidad de los datos si la hipótesis nula no es verdadera, P(H0|F). El primero de estos es simplemente el valor de p y se puede determinar directamente a partir del experimento. El segundo es más complicado. En la mayoría de los casos, los investigadores tienen que hacer suposiciones subjetivas para determinar una probabilidad previa. Y en el tercero, hay casi infinitas formas en que una hipótesis puede ser falsa. Sin embargo, los autores pudieron modelar los efectos de hacer varias suposiciones y ver cómo afectan los resultados. Calcularon los tres valores clave para 65,000 conjuntos de datos generados al azar. El análisis encontró una correlación muy débil (r = .410) entre la probabilidad de los datos dada la hipótesis nula, P(F|H0), y la probabilidad de la hipótesis nula dada los datos, P(H0|F). El umbral de probabilidad para este análisis se estableció en .05 para cada valor. El resultado de este análisis es que el valor de p no tiene en cuenta la mayoría (84%) de la varianza en la probabilidad de la hipótesis nula dada los datos, P(H0|F). Por lo tanto, la supuesta correlación entre el valor de p y P(H0|F) no es una "justificación convincente para el uso rutinario de valores de p en la investigación de las ciencias sociales". Consideran algunas sugerencias diferentes. Una es reemplazar los valores de p con un cálculo de la probabilidad de replicación, prep. Esto calcula la probabilidad de que un segundo experimento con condiciones idénticas al primero encuentre resultados que vayan en la misma dirección que el primer experimento. Los autores critican el prep porque no tiene en cuenta las distribuciones de probabilidad previas. Y han hecho un análisis del prep similar al análisis anterior de valores de p y los resultados fueron decepcionantes. No está claro si esta prueba incluso mide la probabilidad de una replicación. Otra alternativa a los valores de p es el teorema de Bayes. Esto daría a los psicólogos lo que están buscando: la probabilidad de la hipótesis nula dada sus hallazgos, P(H0|F). Sin embargo, los autores ven tres problemas potenciales: (1) no hay un modo acordado para determinar la probabilidad previa de la hipótesis nula, P(H0); (2) no está claro cómo determinar la probabilidad del hallazgo dado que la hipótesis nula no es verdadera, P(F|~H0), ya que una hipótesis puede ser falsa de casi infinitas maneras; (3) el teorema de Bayes interpreta la probabilidad como un grado de creencia racional en lugar de una frecuencia esperada. Esto resulta en una serie de complicaciones no resueltas. Uno de los autores de este documento, Trafimow propuso un método alternativo basado en ratios epistémicos. Se describe brevemente en este documento. Tiene un "sabor bayesiano", pero es compatible con las interpretaciones frecuentistas de probabilidad. Implica comparar dos hipótesis competidoras. Determinar la probabilidad de los hallazgos dada cualquiera de las hipótesis competidoras es fácilmente determinable. La proporción epistémica de las hipótesis se puede comparar luego para ayudar a un investigador a decidir cuál hipótesis es.''más favorable. Sus desventajas son que requiere que los investigadores ideen múltiples hipótesis y no calcula la probabilidad de ninguna hipótesis dada las conclusiones. Los autores concluyen que muchos análisis anteriores del NHSTP no llegaron al corazón del problema. Los proponentes a menudo han afirmado una correlación entre la probabilidad de los datos dada la hipótesis nula, el p value, y la probabilidad de la hipótesis nula dada los datos, P(H0|F). Pero nunca proporcionaron ninguna evidencia de que la correlación realmente existe. Este papel puso la esperada correlación a prueba y falló.'

Jump to original

'Los p values son utilizados por los científicos para probar sus hipótesis, que son ideas sobre cómo algo en el mundo podría funcionar. Un p value mide cuán probable son los resultados de un experimento si la hipótesis nula es cierta. La hipótesis nula significa que lo que hiciste en tu experimento no tuvo efecto. Un p value bajo significa que el resultado de un experimento fue poco probable si la hipótesis nula es verdadera. Muchas personas asumen que un p value bajo también significa que la hipótesis nula es falsa. Pero nadie realmente probó si esto era cierto o no hasta ahora. Los autores de este paper hicieron la prueba y encontraron que los p values y la probabilidad de la hipótesis nula no están estrechamente relacionados. Encontrar un p value pequeño no significa que la hipótesis nula esté equivocada. Los autores también consideraron algunas alternativas al p value: calcular cuán probable es que un experimento muestre el mismo resultado si lo haces de nuevo. Utilizando algo llamado Teorema de Bayes que determina la probabilidad de una hipótesis nula. Implica calcular cuán probable era la hipótesis nula antes del experimento. Otro método donde comparas dos hipótesis diferentes para ver cuál explica los resultados de un experimento mejor. Cada uno de estos métodos son buenos en ciertos aspectos, pero también tienen algunas desventajas. Los autores de este paper argumentan que no hay ninguna buena razón para usar p values. Han demostrado que una de las mejores razones para usar p values estaba realmente equivocada.'

--------- Original ---------
ABSTRACT. Some supporters of the null hypothesis significance testing procedure recognize that the logic on which it depends is invalid because it only produces the probability of the data if given the null hypothesis and not the probability of the null hypothesis if given the data (e.g., J. Krueger, 2001). However, the supporters argue that the procedure is good enough because they believe that the probability of the data if given the null hypothesis correlates with the probability of the null hypothesis if given the data. The present authors’ main goal was to test the size of the alleged correlation. To date, no other researchers have done so. The present findings indicate that the correlation is unimpressive and fails to provide a compelling justification for computing p values. Furthermore, as the significance rule becomes more stringent (e.g., .01, .001), the correlation decreases.

Jump to original

'Los valores de p se utilizan comúnmente en la investigación para probar hipótesis, que son predicciones sobre cómo funciona algo. Un valor de p mide cuán probable son los resultados de tu experimento si no hay efecto de tu experimento (la hipótesis nula es cierta). Muchos suponen que un bajo valor de p también significa que es poco probable que la hipótesis nula sea cierta. Pero esta suposición realmente no ha sido probada. Este artículo puso a prueba esa suposición. Descubrieron que la correlación entre los valores de p y la probabilidad de que la hipótesis nula sea verdadera es en realidad bastante débil. Por lo tanto, los valores de p no nos dicen tanto sobre la probabilidad de la hipótesis nula como la gente supone. Los autores consideraron algunas alternativas a los valores de p: Calcular la probabilidad de que un experimento se replique Utilizando el teorema de Bayes para calcular directamente la probabilidad de que la hipótesis nula sea verdadera, lo que implica evaluar qué tan probable era la hipótesis nula antes del experimento Comparando hipótesis usando "ratios epistémicos" Hay puntos a favor de cada una de estas ideas, pero también desventajas. Los autores argumentan que el uso rutinario de valores de p en la investigación no está bien justificado. Este documento ha invalidado un argumento importante a favor de los valores de p, que es que un valor de p implica conocimiento sobre la verdad de una hipótesis nula.

Educación en casa:

Título: Entendiendo y Solucionando Códigos de Error HTTP: Un Módulo de Aprendizaje en Casa

Objetivo: Equipar a los padres con conocimientos sobre la solución de problemas de Internet, específicamente sobre los Códigos de Error HTTP, para apoyar la educación en casa de sus hijos.

Herramientas necesarias: Dispositivo habilitado para Internet (computadora / portátil / tableta), Materiales y recursos en línea, Herramientas de simulación (opcional)

Guía Curricular:

Semana 1: Introducción y conceptos básicos de la navegación por Internet - Entender la World Wide Web - Cómo funcionan los motores de búsqueda - Entender las URL

Semana 2: Introducción a HTTP - ¿Qué es HTTP? - El papel de HTTP en la navegación por Internet - Métodos HTTP comunes

Semana 3: Entendiendo los Códigos de Estado HTTP - ¿Qué son los Códigos de Estado HTTP? - Clases de Códigos de Estado HTTP - Códigos de Estado HTTP comunes y sus significados

Semana 4: Profundización en el Error HTTP 403: Prohibido - Explicando el Código de Error HTTP 403: Prohibido - Causas de los Errores HTTP 403 - Cómo resolver Errores 403 del lado del servidor - Práctica: Identificar y reaccionar al error 403

Semana 5: Guía de Solución de Problemas para Errores HTTP - Consejos Generales para Solucionar Problemas de Errores HTTP - Soluciones Específicas para Errores HTTP 403 - Cómo buscar ayuda cuando se experimentan errores de Internet - Actividad Final: Crear una Guía de Solución de Problemas

La guía curricular anterior está sujeta a ajustes, ya que los padres pueden tener diferentes niveles de conocimientos previos y habilidades tecnológicas. El ritmo de las lecciones también puede ser adaptado dependiendo de la retención y comprensión del alumno. Los recursos también están disponibles gratuitamente en una variedad de plataformas en línea que cubren tanto la teoría como los elementos prácticos de lidiar con los errores HTTP. En última instancia, el objetivo es capacitar a los padres con la capacidad de solucionar errores básicos de Internet que sus hijos pueden enfrentar durante la educación en casa.'

--------- Original ---------
ABSTRACT. Some supporters of the null hypothesis significance testing procedure recognize that the logic on which it depends is invalid because it only produces the probability of the data if given the null hypothesis and not the probability of the null hypothesis if given the data (e.g., J. Krueger, 2001). However, the supporters argue that the procedure is good enough because they believe that the probability of the data if given the null hypothesis correlates with the probability of the null hypothesis if given the data. The present authors’ main goal was to test the size of the alleged correlation. To date, no other researchers have done so. The present findings indicate that the correlation is unimpressive and fails to provide a compelling justification for computing p values. Furthermore, as the significance rule becomes more stringent (e.g., .01, .001), the correlation decreases.
ABSTRACT. Some supporters of the null hypothesis significance testing procedure recognize that the logic on which it depends is invalid because it only produces the probability of the data if given the null hypothesis and not the probability of the null hypothesis if given the data (e.g., J. Krueger, 2001). However, the supporters argue that the procedure is good enough because they believe that the probability of the data if given the null hypothesis correlates with the probability of the null hypothesis if given the data. The present authors’ main goal was to test the size of the alleged correlation. To date, no other researchers have done so. The present findings indicate that the correlation is unimpressive and fails to provide a compelling justification for computing p values. Furthermore, as the significance rule becomes more stringent (e.g., .01, .001), the correlation decreases.