Si hablamos de depresión -o de cualquier otro problema psicológico- los diagnósticos se hacen en base a los síntomas que se presentan. Estos síntomas pueden ser evaluados por un clínico, pero con frecuencia, en la práctica clínica y especialmente en investigación, los problemas psicológicos suelen ser evaluados a través de escalas o cuestionarios, que evalúan con mayor precisión la presencia o ausencia de síntomas que se consideran indicativos del trastorno.
Los formatos de las escalas son variados: algunas son autoadministradas –por ejemplo, escalas en las cuales se le pide a la persona evaluada que seleccione de entre varios enunciados el que mejor se aplique en su caso, o bien se utiliza una escala de tipo Likert en la cual la persona puntúa de 1 a 5 qué tanto aplica un enunciado o síntoma determinado en su caso, o bien tiene que marcar verdadero o falso en un inciso, entre otros muchos formatos. Por ejemplo, en el conocido Inventario de Depresión de Beck (BDI, por las siglas en inglés; Beck, Steer, & Carbin, 1988), uno de los ítems implica que la persona evaluada seleccione entre varias opciones la que considera más ajustada a su situación actual:
Otra opción son heteroaplicadas, escalas administradas por el clínico, que son completadas por el psicólogo o psiquiatra de turno. El ejemplo más conocido quizá sea la escala de Hamilton para depresión (HRSD, por las siglas en inglés; Hamilton, 1960)), en la cual el clínico tiene que puntuar varios ítems según cómo se presentan, por ejemplo:
Ahora bien, hay muchos instrumentos para evaluar depresión. Durante el siglo XX, se desarrollaron literalmente centenares de herramientas para depresión: Santor y colaboradores (2006), contaron 280 instrumentos de evaluación. Si bien sólo una pequeña fracción de esos instrumentos se sigue utilizando, la situación hoy es que existen varias herramientas distintas para evaluar depresión. Las más conocidas son el ya citado BDI, el HRSD, o el CES-D (siglas en inglés de Escala de Depresión del Centro de Estudios Epidemiológicos; Radloff, 1977), pero no son las únicas.
Durante el siglo XX, se desarrollaron literalmente centenares de herramientas para depresión: Santor y colaboradores (2006), contaron 280 instrumentos de evaluación
Estas escalas son herramientas cruciales para las investigaciones. Habitualmente una investigación toma una de estas escalas como forma primaria de evaluación (suele haber herramientas secundarias también), pero no todas las investigaciones utilizan la misma escala primaria. Si bien no hay una normativa sobre qué escala utilizar, las investigaciones psicológicas, por ejemplo, suelen usar el BDI, mientras que las investigaciones farmacológicas habitualmente recurren al HRSD. Ahora bien, estas escalas difieren entre sí en los síntomas que evalúan. El BDI, por ejemplo, hace hincapié en síntomas psicológicos y emocionales (por ejemplo: “estoy decepcionado de mí mismo”, “me siento desanimado respecto al futuro”), mientras que el HDRS enfatiza síntomas físicos, con ítems que evalúan síntomas somáticos, ansiedad somática, insomnios, etc.
Pese a estas diferencias, las distintas escalas se utilizan de manera intercambiable en la literatura. Un antidepresivo que se haya investigado utilizando el HRSD se utilizará para una persona que recibió un diagnóstico de depresión evaluado por el BDI. Sin embargo, con tantas herramientas de evaluación cabe hacerse una pregunta: ¿hasta qué punto todas estas escalas miden lo mismo? ¿hasta qué punto, por ejemplo, los resultados de un antidepresivo medidos con el HRSD son generalizables a un paciente con depresión evaluada por el BDI?
La investigación
Esta es justamente la pregunta que se planteó Eiko Fried, de la Universidad de Amsterdam, en una investigación que recientemente se publicó online (Fried, 2016). Fried realizó un análisis de contenido de las 7 escalas más utilizadas para depresión, con el propósito de investigar cuál es el grado de solapamiento entre ellas, es decir, en qué grado están midiendo los mismos síntomas.
Para esto, descompuso los ítems de las siguientes escalas para depresión, las más comúnmente usadas en la literatura:
- BDI
- HRSD
- CES-D
- IDS (Inventory of Depressive Symptoms)
- QIDS (Quick Inventory of Depressive Symptoms)
- MADRS (Montgomery-Åsberg Depression Rating Scale)
- SDS (Zung Self-Rating Depression Scale)
En total, las siete escalas suman 125 ítems, que evalúan en total 52 síntomas de depresión (dado que varios de esos ítems miden los mismos síntomas, como por ejemplo, “pérdida de peso”, “abatimiento”, “pesimismo”, etc.). Los síntomas que mide cada escala están representados en este muy bonito gráfico:
De S1 a S52, la lista de la derecha, son los 52 síntomas; cada escala, la lista de siglas de arriba, está representada por un color. Si la escala evalúa específicamente ese síntoma, se marca con un círculo completo, si lo evalúa indirectamente, se marca con un círculo vacío. Por ejemplo: el síntoma S22 (en la parte izquierda del gráfico), que designa “Pérdida de Placer”, es evaluado específicamente por el IDS (círculo completo lila) y el BDI (círculo completo rojo); en cambio el HRSD (círculo amarillo vacío), y el QIDS (círculo celeste vacío), lo miden indirectamente; finalmente el SDS (círculo azul), el CESD (verde), y el MADRS (naranja), no evalúan ese síntoma en absoluto.
Cuando decimos que una escala evalúa específica o indirectamente un síntoma significa que si tomamos hipersomnia (S4), por ejemplo, el IDS evalúa específicamente ese síntoma, mientras que el BDI, en cambio, lo evalúa sólo indirectamente, ya que evalúa problemas de sueño en general (podría ser insomnio o hipersomnia).
La parte preocupante es que sólo 6 de los síntomas son evaluados por todas las escalas: ánimo triste, disminución del apetito, fatiga, y el insomnio inicial, medio y terminal (no poder conciliar el sueño, despertarse a la noche, y despertarse temprano a la mañana, respectivamente). De ellos, el ánimo triste (S5), es el único que es medido específicamente por todas las escalas, los otros 5 síntomas son medidos indirectamente en algunos casos.
Pero los datos son más interesantes aún. Algunos síntomas son idiosincráticos a una escala, es decir, son evaluados sólo por esa escala. El BDI, por ejemplo, tiene un 12% de síntomas idiosincráticos, mientras que el HDRS tiene un 9%, y el CES-D tiene un 33%. Esto significa que un 33% de lo que evalúa el CES-D no es evaluado ni compartido con ninguna otra escala.
Para evaluar la superposición de los contenidos de cada escala, se usó el índice de Jaccard, que puntúa de 0 (no hay superposición en absoluto), a 1 (la superposición es total, es decir, son iguales). Veamos qué tanto se superponen las tres escalas más comunes para evaluar depresión, el BDI, CES-D, y HRSD
BDI | CES-D | HRSD | |
BDI | 1.00 | 0.35 | 0.42 |
CES-D | 0.35 | 1.00 | 0.26 |
HRSD | 0.42 | 0.26 | 1.00 |
En este cuadro podemos ver que la superposición de contenido entre el HRSD y el BDI, es sólo de 0.42, que implica una similitud moderada, mientras que la superposición del CES-D y el BDI es de 0.35, y entre CES-D y HRSD es de 0.26, que en ambos casos representa una similitud débil. Esto significa que los contenidos de esas escalas no son muy similares. Las escalas no coinciden del todo en los síntomas que están midiendo.
¿Qué significa esto?
Si han llegado hasta aquí a pesar del bombardeo de numeritos y datos: ¡felicidades! Y si han llegado hasta aquí y además han entendido todo esto, a pesar de nuestra torpeza para escribir, considérense miembros honorarios del Club de Nerds de Psyciencia.
Ahora, veamos por qué esta investigación es importante, y para eso, pensemos en una situación del mundo real.
Supongamos que llevamos a cabo un tratamiento psicológico para depresión que evaluamos con el BDI (que mide más bien síntomas cognitivos y emocionales), y nos arroja un resultado muy positivo, digamos que un 80% de los participantes se recuperaron de la depresión; luego, en una investigación posterior, comparamos ese tratamiento psicológico con un antidepresivo, utilizando el HRSD (que mide más bien síntomas físicos), y esta vez los resultados son mediocres para el tratamiento psicológico, digamos, un 40% de los pacientes se recuperan con el tratamiento psicológico y un 80% con el antidepresivo.
necesitamos tomar en consideración cuál es el instrumento que se usó para evaluar un tratamiento, y tener en cuenta que algo que funciona para un determinado perfil de síntomas quizá no funcione para otro
Esto no necesariamente significaría que una de las dos investigaciones fue errónea, ni tampoco que el tratamiento perdió eficacia, sino que quizá la diferencia podría deberse al mero hecho de que cambiamos de escala, quizá nuestro tratamiento psicológico es muy bueno para los síntomas cognitivos y emocionales, y no tanto para los síntomas físicos. O quizá los pacientes que en el primer estudio se etiquetaron como depresivos con el BDI fueron calificados como no depresivos y excluidos del segundo estudio, según el HRSD (por supuesto, esto que decimos es una caricatura, en la realidad las cosas son más complejas y sutiles).
Esto tiene implicancias prácticas para las investigaciones y para cómo consideramos los datos. Los resultados de una investigación realizada con el CES-D, por ejemplo -que resultó ser una escala altamente idiosincrática- no serán completamente generalizables a investigaciones realizadas con el HRSD o el BDI. Significa que necesitamos tomar en consideración cuál es el instrumento que se usó para evaluar un tratamiento, y tener en cuenta que algo que funciona para un determinado perfil de síntomas quizá no funcione para otro. También proporciona un fuerte argumento empírico para que las investigaciones evalúen la eficacia de los tratamientos usando más de una escala primaria para depresión.
Y finalmente, esta investigación se suma a un cuerpo de evidencia que señala que lo que denominamos genéricamente como “depresión” refiere a un conjunto heterogéneo de fenómenos que sería mejor descripto como distintos desórdenes con distintos perfiles sintomáticos, que responderán mejor a distintos tipos de tratamiento.
El campo de la investigación en psicología es apasionante, y este tipo de investigaciones, que buscan refinar las propias herramientas que utilizamos para investigar, son siempre bienvenidas.
Nos leemos la próxima!
Referencias
Beck, A. T., Steer, R. A., & Carbin, M. G. (1988). Psychometric properties of the Beck Depression Inventory: Twenty-five years of evaluation. Clinical Psychology Review, 8(1), 77–100. http://doi.org/10.1016/0272-7358(88)90050-5
Fried, E. I. (2016). The 52 symptoms of major depression: lack of content overlap among seven common depression scales. Journal of Affective Disorders, 208, 191–197. http://doi.org/10.1016/j.jad.2016.10.019
Hamilton, M. (1960). A rating scale for depression. Journal of Neurology, Neurosurgery, and Psychiatry, 23(1), 56–62.
Radloff, L. S. (1977). The CES-D Scale: A Self-Report Depression Scale for Research in the General Population. Applied Psychological Measurement, 1(3), 385–401. http://doi.org/10.1177/014662167700100306
Santor, D. a., Gregus, M., & Welch, A. (2006). Eight Decades of Measurement in Depression. Measurement: Interdisciplinary Research & Perspective, 4(3), 135–155. http://doi.org/10.1207/s15366359mea0403_1