El valor predictivo positivo de un estudio, o hasta qué punto es cierto un hallazgo

[…] aunque Neyman y Pearson nunca propusieron emplear el nivel 5% como una línea decisoria para el error de tipo I, este umbral caló hondo en la comunidad científica, convirtiéndose casi en un objetivo “per se” en todo tipo de experimentos. Los resultados eran divididos en dos clases, los “estadísticamente significativos” (p<alfa) y los “no significativos” (p>=alfa), con alfa fijado en 0.05, y solamente los resultados “significativos” eran publicados, reduciendo a menudo el análisis de datos a un “tuneo” de los parámetros de tal manera que dieran lugar a p-valores inferiores a 0.05 (actividad que se conoce como “p-hacking”). […] […] exigir un p-valor por debajo de 0.001 ayuda, pero R actúa como un factor limitante: en un área muy especulativa, en la que solamente el 1% de las ideas planteadas fuesen correctas, con 1-beta igual a 0.8 (valor estándar), aún exigiendo un p-valor de 0.001, tendríamos un 11% de falsos positivos […] Egon Pearson (1895-1980) y Jerzy Neyman (1894-1981), propusieron los test de hipótesis como medio para evaluar hipótesis científicas. Todo lo que comes previene o causa cáncer (o las dos cosas a la vez) Todos tenemos, en mayor o menor medida, la misma sensación: lo que hoy se […]