El psicólogo clínico promedio odia las matemáticas y por ende a la estadística. Lo entiendo, yo me llevé matemática más de una vez en la secundaria… pero bueno, hay que superar los traumas infantiles… ¿sino con qué cara vamos a mirar la foto de Edna Foa que colgamos el otro día? Cuando en cursos de posgrado pregunto qué es un desvío estándar, lo usual es que nadie pueda explicarlo y eso por nombrar algo que se supone que todos supieron al menos durante el tiempo necesario para aprobar la materia en la facultad.
El problema de odiar las matemáticas es que son necesarias y odiar algo necesario es muy malo: o te amigas o sufres. Sufres por tener que saberlo o sufres por las consecuencias de ignorarlo, pero sufres. Como adivinan por el ejemplo del párrafo anterior, el psicólogo promedio ha elegido la última de las opciones.
Digamos que, para simplificar, existen tres formas de saber estadística: como lo hace un profesor de estadística (nivel dios diría un meme ahora), nivel investigador (que sabe usarla aplicarla y entenderla) y nivel usuario (que sería lo que se espera de un clínico). Si usted es psicólogo y no cataloga para nivel usuario, está sufriendo las consecuencias, sépalo o no.
Un conocimiento básico de estadística le permite saber una serie de cosas que son importantes. Sin ello estamos condenados a confiar en los demás de un modo ingenuo y peligroso, porque nadie que quiere convencernos nos dirá que su propuesta es “estadísticamente flojita” o que la muestra en la que aplicó su tratamiento era “un poquitín sesgada” y menos que menos si hay empresas de por medio: La editorial que quiere venderte un test, difícilmente pondrá en la tapa “esta prueba tiene la especificidad de una bazuca y la sensibilidad de un sicario, úsela bajo su propio riesgo”. Obviamente podemos confiar en las voces críticas… el problema con eso es que existen muchas personas críticas y muy pocas críticas desinteresadas. Entonces, tener criterio propio es bastante conveniente y para eso hay que saber que quieren decir los números.
¿Qué debería saber de estadística un psicólogo?
Estadística descriptiva
Media, mediana, varianza, desvío estándar, moda… lo siento, entra en el examen. Sirve además para muchas cosas, como para entender las encuestas electorales e incluso para seducir en el baile, bueno no, eso no. Imaginen que tienen 20 personas en un aula. 10 de 20 años, 5 de 40 y 5 de 50. El promedio de edad es de 32 años. ¿hay alguien de 30? Ninguno. Vieron… la media es tramposa. ¿Cuándo desconfiamos? Cuando hay un desvío estándar alto… ¿cuál es el desvío estándar acá? 13 años. ¿es mucho? Si. ¿por qué? Porque es casi la mitad de la media y es más de la mitad de la moda (20 años).
Diferencia entre correlación y causalidad
La correlación es tentadora porque permite que uno encuentre cosas fácilmente en los datos. Si uno toma una muestra grande, encontrara cientos de correlaciones que se deben a causas intermedias, por ejemplo: En Estados Unidos encontraron que el CI de los negros era inferior al de los blancos. Eso a la gente que todavía no sabía que perdió el sur, le parecía buenísimo. Y obviamente ponía nerviosos a todos los demás ¿Por qué correlaciona la inteligencia y el color de piel? Muy probablemente porque la inteligencia correlaciona con la estimulación y la escolaridad y ¡oh que sorpresa! Los negros tenían menos acceso a la educación y a estimulación en la infancia.
Si me guiara por la correlación, pensaría cosas muy perturbadoras, pero si analizo bien los datos, casi que puedo ser el próximo premio nobel de la paz. ¿Vieron que importante?
¿Qué es y cómo se interpreta un análisis factorial?
Sin eso no pueden entender porqué y cómo funcionan las subpruebas en un test, y poder ver si la prueba está bien armada o no esto es importante sobre todo porque la mayor parte de las técnicas que usamos están traducidas y revalidadas al español y no siempre muy bien. El ejemplo que me viene a la mente es la traducción casera que todos usamos alguna vez del CDI de Kovacs… un día el Dr. Castro Solano se tomó el trabajo de tratar de validar el cuestionario y se dio cuenta que todas las subescalas (pensamiento negativo, anhedonia, etc.) se superponían y que al menos en Argentina el único puntaje útil era el total.
Relación entre puntajes normatizados z, t, escalares, etc.
Hay que entender qué quiere decir un número… ¿por qué?… Supongan que un paciente llega al consultorio porque tiene problemas académicos y la mama insiste en que es “su inconsciente que no quiere crecer”. Básicamente en la universidad no da pie con bola… tiene un informe cognitivo en el que alguien dice que su inteligencia es normal. ¿se estará auto boicoteando?. Miremos mejor el numerito… dice normal, pero le da 86. Bueno, una persona con un CI de 86 es menos capaz intelectualmente que el 83% de la población… el 1% de la población tiene discapacidad intelectual, así que digamos que nuestro paciente es menos inteligente que el 84% de las personas sin discapacidad mental. Suena bastante lógico que no le vaya bien en la facultad sobre todo si se tiene en cuenta que el promedio de inteligencia de un egresado universitario no es de 100 sino de 110. Es decir que nuestro paciente tiene 24 puntos menos que la media de las personas que logran egresar.
Tamaño de efecto
Ejemplo… ¿Qué tan efectiva es una terapia? Para no pelearnos con los colegas vamos a pelearnos con los laboratorios, que queda mucho más progre… La atomoxetina es un fármaco que está aprobado para su uso en el TDAH ya que ha mostrado repetidamente que es superior al placebo… ¿Qué tan efectivo?. En adultos, tiene un tamaño de efecto promedio de d=0,4. Eso quiere decir que las personas que toman el remedio disminuyen su sintomatología 0,4 desvíos estándar… ¿eso es bueno? Veamos. Supongamos que nuestro paciente es un adulto con TDAH que ha puntuado en el percentil 99 en la escala ASRS, tiene un puntaje de 60 (lo normal es tener debajo de 35 puntos), un desvío estándar en esta prueba es de 10 puntos. Por lo que, si la medicación le hace efecto, pasará a puntuar 56 puntos. ¿sigue bastante jodido no?. Antes que se pongan a tirarle piedras a los vidrios de los laboratorios, averigüen el tamaño de efecto de la terapia que ustedes aplican para cada cosa y por ahí terminan rompiendo las ventanas de su consultorio.
Especificidad y sensibilidad de una prueba
En el episodio 4 de mi podcast, (por hacer un chivo y dar un ejemplo en un solo párrafo) expliqué el fenómeno de “la paradoja del falso positivo”, no voy a hacerlo aquí, pero por esa paradoja implica básicamente que si una persona es diagnosticada por una prueba promedio (que suelen tener un nivel de falsos positivos del 5% )y la patología con la que está siendo diagnosticado tiene una prevalencia del 1% (por ejemplo la esquizofrenia) las posibilidades de que el diagnóstico sea incorrecto es del %80. Por ello, es que el resultado de cualquier prueba, de forma aislada tiene menos peso que un neutrino (que es muy poco, créanme). Los profesores de evaluación psicológica suelen no explicar eso, no sé por qué, porque es muy relevante, sobre todo si tomamos en cuenta que en el caso de las pruebas proyectivas la sensibilidad es más alta y la especificidad baja que en las psicométricas, lo cual es un combo explosivo para llenarnos de falsos positivos: el margen de error es el doble de grande: si un paciente da respuestas “psicóticas” las posibilidades de que padezca un cuadro con síntomas psicóticos primarios no llega al 10%. Por lo que posiblemente preguntarle “¿escuchas voces?” sea mucho más efectivo que un Rorschach y bastante más rápido.
Busquen los apuntes
La lista no es exhaustiva, pero espero haberlos convencido que aunque no quieran investigar, ni enseñar estadística en la universidad, tienen que saber más o menos lo que les enseñaron en 1ro de la carrera… si no se lo acuerdan, buscan los apuntes amarillentos que nunca tiraron porque les daba cosita o buscan un libro en pdf que hay muchos gratis dando vuelta… Recuerden que, parafraseando a Hayes, sufrir es inevitable, a lo sumo podemos elegir cómo.