El estatus científico de las técnicas proyectivas * Psyciencia

Únete al canal de Psyciencia en WhatsApp y no te pierdas ninguna publicación →

Test de apercepción temática (TAT)

La prueba de apercepción temática (TAT) es una técnica de construcción (Lindzey, 1959) desarrollada por Henry Murray y su alumna Christiana Morgan para evaluar las reacciones a estímulos interpersonales ambiguos (Morgan y Murray, 1935; Murray, 1943). Murray eligió el término «apercepción» en lugar de la percepción para denotar el hecho de que los encuestados interpretan activamente los estímulos TAT de acuerdo con sus rasgos de personalidad y experiencias de vida (Anderson, 1999). El TAT consta de 31 cartas que representan situaciones ambiguas, la mayoría de ellas de naturaleza social (por ejemplo, una mujer joven que agarra los hombros de un hombre joven que parece estar intentando alejarse de ella). Una de estas tarjetas, la tarjeta 16, representa el epítome de la ambigüedad: está completamente en blanco. Aunque algunas tarjetas TAT están destinadas a hombres y otras a mujeres, ni el sexo del examinado ni el rol de género están significativamente asociados con el contenido de las historias TAT (Katz, Russ y Overholser, 1993). El TAT ha generado una variedad de pruebas de apercepción afines desarrolladas para diferentes grupos de edad, como la prueba de apercepción infantil (Bellak y Bellak, 1991), la prueba de apercepción Roberts para niños (McArthur y Roberts, 1990), las tarjetas de aperos para adolescentes (Silverton, 1993), y la prueba de apercepción senior (Bellak, 1975). Debido a que la literatura de investigación sobre estas técnicas es considerablemente menos extensa que la del TAT, estas técnicas no serán revisadas aquí (ver Hayslip y Lowman, 1986, y Kroon, Goudena y Rispens, 1998, para revisiones de técnicas de apercepción para ancianos y niños/adolescentes, respectivamente).

Con respecto a la administración del TAT, se le pide al encuestado que mire cada tarjeta y construya una historia. Cada historia debe describir qué: (a) condujo a los eventos representados en la tarjeta, (b) eventos están ocurriendo en la tarjeta, (c) eventos ocurrirán en el futuro y (d) lo que los personajes de la tarjeta están pensando y sintiendo (Murray, 1943). Murray asumió que el entrevistado generalmente se identifica con el protagonista principal que aparece en cada carta (el «héroe») y crea la historia desde el punto de vista del héroe.

Murray recomendó que los examinadores de TAT seleccionen aproximadamente 20 tarjetas cuyos temas parecen particularmente relevantes para las dificultades de presentación del entrevistado y administren estas tarjetas en dos sesiones. Sin embargo, estas recomendaciones casi nunca se siguen en la actualidad. Existe una considerable variabilidad en el número de estímulos TAT administrados por diferentes examinadores, y la mayoría administra entre 5 y 12 tarjetas y lo hace en una sola sesión (Vane, 1981). Además, las tarjetas específicas seleccionadas y el orden de administración de la tarjeta varían mucho entre los examinadores (Groth-Marnat, 1997; Worchel y Dupree, 1990). El tiempo modal necesario para administrar, puntuar e interpretar el TAT es de aproximadamente 1,5 horas (Ball, Archer e Imhof, 1994).

Descripción general de la investigación TAT: problemas y hallazgos

Aunque se han desarrollado una variedad de esquemas de puntuación cuantitativa TAT, como los de Bellak (1975), Dana (1955) y Arnold (1962; ver Vane, 1981, para una revisión), pocos clínicos usan estos esquemas con regularidad ( Rossini y Moretti, 1997). En cambio, la mayoría interpreta el TAT sobre una base impresionista utilizando el juicio clínico y la intuición. Por ejemplo, una encuesta de casi 100 psicólogos norteamericanos que practican en tribunales juveniles y familiares reveló que solo el 3% usa cualquier sistema de puntuación TAT estandarizado (Pinkerman, Haynes y Keizer, 1993; ver también Wade y Baker, 1977).

Más pertinente para la presente revisión es el hecho de que hay poca coherencia con respecto a qué tarjetas TAT se utilizan en la investigación publicada. En una revisión de 69 estudios publicados sobre el TAT durante un período de 10 años, Keizer y Prather (1990) encontraron una enorme variabilidad entre las investigaciones en las tarjetas utilizadas e incluso si estas tarjetas estaban en el conjunto TAT original. Llegaron a la conclusión de que se desconoce el grado en que los hallazgos de TAT pueden generalizarse entre las investigaciones. La amplia variedad de conjuntos de estímulos utilizados en la investigación de TAT también implica que las normas adecuadas para prácticamente todos los sistemas de puntuación TAT no están disponibles.

La mayoría interpreta el TAT sobre una base impresionista utilizando el juicio clínico y la intuición

Además de la variabilidad sustancial en los conjuntos de estímulos y los esquemas de puntuación, existen al menos dos obstáculos principales para evaluar las reclamaciones con respecto a la validez de TAT. Son en gran medida estos problemas los que convierten al TAT en «el deleite de un clínico y la pesadilla de un estadístico» (Vane, 1991, p. 319). El primer problema interpretativo se ha denominado el efecto «Walter Mitty» (Loevinger, 1987), y se refiere al hecho de que algunos encuestados pueden mostrar altos niveles de un atributo dado (p. ej., motivación de logro) en el TAT no porque posean altos niveles de este atributo, sino porque están fantaseando con poseer altos niveles de este atributo. Por el contrario, algunos defensores del TAT han mantenido que los individuos pueden exhibir niveles bajos de un atributo en el TAT no porque posean niveles bajos de este atributo, sino porque están reprimiendo o inhibiendo la expresión de este atributo. Llamamos a este supuesto fenómeno el «efecto de inhibición». Debido a que tanto el efecto Walter Mitty como los efectos de inhibición pueden invocarse como tácticas de inmunización ad hoc (Popper, 1959) para explicar los hallazgos negativos, pueden hacer que ciertas predicciones sobre la validez de TAT sean difíciles o imposibles de falsificar. Por ejemplo, Vane (1981) argumentó que:

…un individuo puede contar historias en las que hay mucha agresión, pero no muestra esto en sus acciones. Muchos clínicos no tendrían dificultades para conciliar esta discrepancia porque el protocolo se interpretaría en el sentido de que el individuo es realmente agresivo, pero teme serlo. Debido a este miedo, ha construido una defensa exitosa contra la agresión y, por lo tanto, parece manso y apacible… Por otro lado, si un individuo agresivo contara historias con muchos temas agresivos, sería considerado un individuo agresivo (págs. 332-333).

En segundo lugar, los defensores del TAT a veces han ofrecido afirmaciones contradictorias con respecto a las relaciones entre el TAT y los índices de autoinforme, que a veces se utilizan como indicadores con los que validar el TAT. Por ejemplo, Cramer (1999) argumentó que las características evaluadas por el TAT «son, por definición, inaccesibles para la conciencia» y que «los intentos de establecer la validez concurrente entre el TAT y las medidas de autoinforme probablemente no tengan éxito» (p. 85). McClelland, Koestner y Weinberger (1989) sostuvieron de manera similar que debido a que el TAT y los instrumentos de autoinforme evalúan diferentes tipos de motivos (implícitos y auto-atribuidos, respectivamente; ver la sección titulada Esquemas de calificación de necesidades basados en TAT), las correlaciones entre estos dos tipos de instrumentos deben ser muy bajas. Por el contrario, Westen y sus colegas (por ejemplo, Barends, Westen, Leigh, Silbert y Byers, 1990) han presentado correlaciones positivas entre su índice TAT de relaciones de objeto y los indicadores de autoinforme de psicopatología como evidencia de la validez de este índice de TAT. Como consecuencia, no está claro si los hallazgos (p. Ej., Emmons y McAdams, 1991) que indican correlaciones positivas significativas entre los índices TAT y los indicadores de autoinforme de los mismos constructos (p. Ej., Motivación de logro) argumentan a favor o en contra de la validez de índices anteriores.

Con respecto a la realización de una revisión sistemática de la literatura sobre el TAT, lo que la hace aún más difícil es el hecho de que se han desarrollado una gran cantidad de diferentes esquemas de puntuación para TAT para ciertos estudios, muchos de forma ad hoc (Ryan, 1985; Vane, 1981). La gran diversidad de estos esquemas, sin mencionar la diversidad de materiales de estímulo en los que se basan, impide un examen sistemático de sus propiedades psicométricas replicadas (Hunsley et al., En prensa). Con algunas excepciones notables que discutiremos, el historial de esquemas de puntaje estandarizados para el TAT ha sido, en el mejor de los casos, mixto. Por un lado, algunos investigadores han reportado resultados alentadores. Por ejemplo, Mussen y Naylor (1954) informaron que los niveles de agresión expresada en el TAT se asociaron significativamente con la agresión manifiesta en una muestra de 29 delincuentes adolescentes varones (pero vea Gluck, 1955 y Kagan, 1956, para ver los fracasos para replicar este hallazgo). Karon y O’Grady (1970) pidieron a los estudiantes graduados en psicología clínica que no conocían la identidad del paciente que hicieran valoraciones de salud emocional a partir de los TAT de pacientes esquizofrénicos hospitalizados.

Después de transformar estadísticamente estas calificaciones mediante un procedimiento de escala, Karon y O’Grady encontraron que estas calificaciones mostraban una alta validez predictiva (r = .63 y .64 en dos estudios) para el número de días que los pacientes permanecieron en el hospital durante un período de 6 meses.

A diferencia de estos hallazgos positivos bastante aislados, la mayoría de los cuales no se han replicado, la literatura del TAT está repleta de hallazgos sorprendentemente negativos. En un estudio de 150 veteranos de guerra varones estadounidenses, Eron (1950) informó que un índice TAT de tono afectivo no pudo distinguir significativamente entre individuos psicóticos, neuróticos y normales. Sharkey y Ritzler (1985) descubrieron que el TAT era incapaz de diferenciar muestras de individuos psicóticos, individuos deprimidos y normales sobre la base de distorsiones perceptivas, interpretaciones de historias inusuales o tono de afecto. De hecho, el tono afectivo de las historias de TAT no fue significativamente más positivo para las personas deprimidas que para las normales. Murstein y Mathes (1996) no encontraron esencialmente ninguna asociación (r =.03) entre un cuestionario de neuroticismo de autoinforme y una psicopatología calificada en el TAT entre una muestra no clínica. Lilienfeld, Hess y Rowland (1996) encontraron que un índice derivado de TAT de la perspectiva del tiempo futuro adaptado del trabajo de Ricks, Umbarger y Mack (1964) exhibió una perfecta confiabilidad entre evaluadores (intraclase r = 1.00), pero se correlacionó de manera insignificante y no significativamente con una gran cantidad de índices de personalidad y psicopatología, así como con índices alternativos (por ejemplo, autoinforme, proyectivos) de la perspectiva del tiempo futuro.

Validez incremental del TAT

La validez incremental del TAT por encima y más allá de la información demográfica o de la prueba generalmente no ha sido impresionante (Gallucci, 1990; Garb, 1984, 1998). Soskin (1954) descubrió que la adición de protocolos TAT no agregaba significativamente a la validez de las calificaciones de personalidad de los médicos de los participantes normales más allá de la información demográfica básica. En contraste, Golden (1964) descubrió que los juicios de los médicos sobre los rasgos de personalidad de los participantes (pacientes psiquiátricos y no psiquiátricos) aumentaron significativamente cuando se agregó el TAT a la información demográfica. Sin embargo, como Golden señaló, estos juicios probablemente aumentaron en validez simplemente porque los datos demográficos no proporcionaron información sobre si los individuos eran pacientes psiquiátricos. Agregar datos del TAT a la mezcla interpretativa puede haber aumentado la validez porque estos datos permitieron a los jueces determinar si las personas exhibían síntomas psicopatológicos (Garb, 1984). Una vez que tomaron esta determinación, pudieron describir a los participantes en términos de rasgos de personalidad que caracterizan a la mayoría o a todos los pacientes psiquiátricos (véase también Horowitz, 1962). Golden también descubrió que agregar el TAT al MMPI o al Rorschach generalmente generaba ligeros pero no significativos incrementos en la validez. En contraste, agregar el TAT tanto al Rorschach como al MMPI no condujo esencialmente a aumentos en la validez. Wildman y Wildman (1975) pidieron a un grupo de psicólogos clínicos que determinaran, sobre la base de varias combinaciones de resultados de las pruebas, si los encuestados eran pacientes psiquiátricos o no pacientes (eran enfermeras) que habían sido emparejados con los pacientes por edad y educación. Aunque agregar el MMPI al TAT resultó en un aumento en la precisión del 57% al 80%, agregar el TAT al MMPI resultó en una disminución en la precisión del 88% al 80%.

Hasta donde sabemos, sólo un estudio ha examinado la validez incremental de los juicios hechos por las reglas de decisión estadística (en los estudios descritos en el párrafo anterior, los juicios fueron hechos por los clínicos). Winch y More (1956) examinaron la medida en que la información numérica derivada del TAT contribuyó a las predicciones de los puntajes de los participantes (miembros de 25 parejas casadas) en 12 de las necesidades de Murray (1938; por ejemplo, logro, dominio, hostilidad) anteriores y más allá de la información de la entrevista. Prácticamente ninguno de los incrementos de varianza correspondientes a la entrada del TAT en ecuaciones de regresión múltiple jerárquica fue estadísticamente significativo, y todos fueron de magnitud pequeña (rango de 0 a 2%).

Debido a que la gran diversidad de estímulos TAT y esquemas de puntuación hace que una revisión exhaustiva de esta literatura sea poco práctica, hemos optado por centrarnos en tres enfoques sistemáticos de puntuación de TAT que parecen potencialmente prometedores. Estos tres enfoques son: (a) esquemas de puntuación de necesidad, (b) la evaluación de las relaciones objetales y (c) la evaluación de los mecanismos de defensa.

Esquemas de puntuación de necesidad basados en TAT

El esquema de puntuación basado en la necesidad más conocido desarrollado para el TAT es el sistema cuantitativo de McClelland, Atkinson, Clarke y Lowell (1953) para evaluar la necesidad de logro de Murray (1938). Se pide a los encuestados que escriban historias en respuesta a varias (por ejemplo, cuatro) tarjetas, algunas de las cuales se extraen del TAT original y otras (por ejemplo, una fotografía de un niño en un escritorio con un libro en frente) son extraídas de otras fuentes. Cada uno de estos estímulos fue seleccionado por Mc-Clelland et al. (1953) para «atraer» a la motivación del logro. Las historias escritas de los examinados se codifican de acuerdo con un esquema de puntuación detallado y explícito.

McClelland, Koestner y Weinberger (1989; véase también Mc-Clelland, 1980) afirmaron que el TAT (así como otras técnicas proyectivas) evalúa motivos implícitos, a saber, necesidades de las cuales el encuestado no es consciente. En contraste, sostuvieron que los instrumentos de autoinforme evalúan los motivos autoatribuidos, a saber, las necesidades de las cuales el encuestado es consciente. McClelland y sus colegas postularon que, por lo tanto, los índices de necesidades TAT y de autoinforme deberían corregirse de manera insignificante. Además, McClelland (1980) planteó la hipótesis de que el TAT y los instrumentos de autoinforme deberían correlacionarse con diferentes variables de resultado. Adaptando liberalmente la terminología introducida por Skinner (1938), McClelland sostuvo que los índices de necesidades basados en el TAT deberían predecir mejor el comportamiento operante, es decir, el comportamiento que no está muy limitado por las variables ambientales.

Los problemas serios relacionados con la fiabilidad test-retest de los índices de necesidad basados en TAT, por lo tanto, parecen estar en gran parte sin resolver

Por el contrario, los instrumentos de autoinforme deberían predecir mejor el comportamiento del encuestado, a saber, el comportamiento provocado por estímulos altamente estructurados. Por lo tanto, los índices TAT de motivación de logro deben correlacionarse más altamente con el logro a largo plazo (por ejemplo, éxito ocupacional), mientras que los índices de autoinforme de motivación de logro deben correlacionarse más altamente con el desempeño en medidas de logro de laboratorio altamente estructuradas (por ejemplo, tareas de anagrama). Finalmente, McCleland et al. (1989) distinguieron entre tareas e incentivos sociales. Los primeros (p. ej., la dificultad de la tarea) son intrínsecos a las tareas orientadas al logro, mientras que los segundos (p. ej., las instrucciones orientadas al logro de un experimentador) son extrínsecos a tales tareas. McClelland y col. hipotetizaron que los incentivos de la tarea deberían interactuar estadísticamente con motivos implícitos de logro (es decir, motivos derivados del TAT), mientras que los incentivos sociales deberían interactuar estadísticamente con motivos de logro auto-atribuidos (es decir, motivos derivados de instrumentos de autoinforme). Como veremos pronto, varios investigadores se han esforzado por probar estas hipótesis.

Fiabilidad. La confiabilidad de los índices TAT de motivación de logro ha sido una larga carga de errores para los defensores de estas técnicas. Si bien la confiabilidad interpuntuador de estas técnicas ha estado típicamente en el rango de .80 a .90 (Fineman, 1977), su consistencia interna y confiabilidad test-retest han sido notoriamente problemáticas. En una crítica influyente del TAT, Entwisle (1973) concluyó, sobre la base de numerosos estudios publicados, que la consistencia interna de McCleland et al. (1953) el esquema de puntuación (medido por el alfa de Cronbach) rara vez excedía de .30 a .40. Han habido pocos datos posteriores para cuestionar la conclusión de Entwisle, aunque algunos autores han cuestionado la relevancia de las estadísticas de consistencia interna para evaluar la confiabilidad del TAT. Por ejemplo, Cramer (1999) afirmó que “las medidas de confiabilidad basadas en la consistencia interna… no son apropiadas para el TAT. Las tarjetas TAT no son lo mismo que una serie de ítems en una escala de personalidad, todos los cuales están destinados a medir el mismo rasgo de personalidad” (p. 89). Sin embargo, este argumento socava la justificación para agregar respuestas a diferentes elementos TAT en una puntuación total, lo que supone que cada respuesta es un indicador falible pero útil del constructo latente evaluado por esta puntuación total (Epstein, 1979).

Además, las confiabilidades test-retest de los índices de rendimiento basados en el TAT durante intervalos de varias semanas generalmente han estado en el rango de .30 (Entwisle, 1973; Fineman, 1977; Winter y Stewart, 1977). Winter y Stewart (1977; véase también Cramer, 1999) sostuvieron que las bajas confiabilidades test-retest de los índices de necesidad basados en TAT son artificiales. Específicamente, sostuvieron que al volver a evaluar a los encuestados a menudo se sienten obligados a crear historias diferentes. Para examinar esta posibilidad, Winter y Stewart (1977) usaron el TAT para evaluar la confiabilidad test-retest de la necesidad de poder de los estudiantes universitarios (Winter, 1973), un motivo para ser discutido posteriormente, cuando se les dan instrucciones para escribir historias que eran únicas o lo más similares posible a sus historias anteriores. La necesidad de correlaciones test-retest de potencia fue significativamente mayor en la última condición (r = .61) que en la primera (r = .27). Sin embargo, Kraiger, Hakel y Cornelius (1984) no pudieron replicar los resultados de Winter y Stewart en una muestra de estudiantes de pregrado, sino que encontraron correlaciones más altas en la condición única (r = .52) que en la condición lo más similar posible (r = .38 ) De manera inquietante, la correlación test-retest en una condición adicional en la que los encuestados no recibieron instrucciones explícitas sobre la repetición de pruebas fue esencialmente cero (r = .02). Los problemas serios relacionados con la fiabilidad test-retest de los índices de necesidad basados en TAT, por lo tanto, parecen estar en gran parte sin resolver (cf. McClelland et al., 1989).

Validez. Muchos investigadores han examinado la validez de constructo de los índices TAT de motivación de logro. En un metaanálisis de correlaciones (n = 36) entre los índices de motivación de logro basados en el TAT y los índices de motivación de logro de autoinforme, Spangler (1992) encontró una correlación media de .09. Esta correlación, aunque estadísticamente significativa, es de baja magnitud y respalda la afirmación de McClelland (1980) de que los índices de necesidades proyectivos y de autoinforme no evalúan el mismo constructo (pero vea Emmons y McAdams, 1991, para datos que sugieren moderadas correlaciones positivas entre TAT y los índices de necesidad de autoinforme). Algunos autores, por el contrario, han argumentado que las bajas correlaciones entre los índices proyectivos y de autoinforme de la motivación de logro sugieren que los primeros poseen una validez convergente pobre (Entwisle, 1972; Fineman, 1977).

Sin embargo, varios estudios sugieren que estos dos conjuntos de instrumentos se correlacionan con diferentes variables de resultado, según lo predicho por la distinción operante-respondedor de McClelland (1980). Spangler (1992) realizó un metanálisis de 105 estudios que examinaban las relaciones entre los resultados conductuales y los índices TAT y autoinformados de motivación de logro. Las correlaciones medias entre los índices de motivación de logro de TAT y las medidas de resultado operantes (p. ej., éxito laboral, ingresos) y encuestados (p. ej., rendimiento escolar, inteligencia medida) fueron .22 y .19, respectivamente, mientras que las correlaciones medias entre el autoinforme, los índices de motivación de logro y estas dos clases de medidas de resultado fueron .13 y .15, respectivamente. Las correlaciones tanto operante como respondiente fueron leves pero significativamente más altas para los índices TAT que para los índices de autoinforme, lo que contradice las afirmaciones anteriores (por ejemplo, Fineman, 1977) de que estas últimas poseen una validez superior para los resultados relacionados con el logro. Sin embargo, todas estas correlaciones medias son de baja magnitud. Además, Spangler encontró una interacción significativa entre los índices de motivación de logro de TAT y los incentivos de tareas, según lo predicho por el modelo de McClelland et al. (1989), aunque la interacción predicha entre los índices de motivación de logro de autoinforme y los incentivos sociales no se materializaron. Varios otros hallazgos respaldan la validez de constructo de los índices de motivación de logro TAT. Por ejemplo, las puntuaciones altas en estos índices tienden a estar asociadas con la selección de tareas de dificultad moderada (véase Fineman, 1977), según lo predicho por una gran literatura teórica y empírica sobre el nivel de construcción de aspiración (McClelland, 1951).

A pesar de estos resultados modestamente alentadores, quedan preguntas sin resolver. En particular, el posible papel confuso de la inteligencia, que no se examinó en el metanálisis de Spangler (1992) y que se ha examinado en pocos estudios sobre la motivación para el logro de TAT, requiere aclaración (véase Enntisle, 1972). Debido a que los índices TAT de la necesidad de logro tienden a estar correlacionados moderada y positivamente con el coeficiente intelectual (Caplehorn y Sutton, 1965; Hundal y Jerath, 1972), y porque los resultados operantes (por ejemplo, ingresos) se correlacionan con estos índices TAT que se correlacionan positivamente con la inteligencia (Willerman, 1979), la inteligencia debe ser examinada rutinariamente como una covariable en futuros estudios de motivación de logro.

Otros esquemas de puntuación de necesidad basados en TAT. Se han desarrollado varios otros esquemas de calificación de necesidades basados en TAT, entre los cuales el sistema de Winter (1973) para evaluar la necesidad de poder ha sido el más influyente. Koestner, Weinberger, McClelland y Healey (1988; citado en McClelland et al., 1989) presentaron a estudiantes universitarios una tarea de percepción social desarrollada por Sternberg (1986) que consistía en fotografías de dos personas en un entorno relacionado con el trabajo, y les pidieron que determinen cuál de estos individuos era el jefe. Los puntajes en un índice derivado del TAT de la necesidad de poder se relacionaron significativamente con el éxito en esta tarea. También se ha encontrado que la necesidad de puntajes de poder derivados del TAT está significativamente asociada con el éxito ocupacional entre una muestra de gerentes de la American Telephone and Telegraph Company 8 y 16 años después de su contratación inicial (McClelland y Boyatsis, 1982). Winter, John, Stewart, Klohnen y Duncan (1998) informaron interacciones estadísticamente significativas entre la necesidad de poder y la extraversión en la predicción de resultados importantes de la vida (por ejemplo, la elección de carreras que ejercen influencia sobre otros) en dos estudios longitudinales de mujeres estudiantes universitarias.

Los índices TAT se han desarrollado para otras necesidades, incluida la necesidad de afiliación (Atkinson, Heyns y Veroff, 1954). En un estudio de participantes que fueron llamados al azar durante todo el día, un índice TAT de necesidad de afiliación se asoció significativamente con la frecuencia con la que los participantes hablaban con otras personas (ver McClelland, 1985). El apoyo adicional para los índices de necesidad basados en TAT deriva de investigaciones de variables biológicas. Los estudiantes con una alta necesidad de energía evaluada por TAT muestran mayores liberaciones de noradrenalina después de un examen importante, comparados con los estudiantes con poca necesidad de energía (McClelland, Ross y Patel, 1985). Además, las personas con una alta necesidad de afiliación evaluada por el TAT (pero no autoinformada) muestran aumentos en la liberación de dopamina en respuesta a una película romántica (McClelland, 1989). Este hallazgo proporciona validez de constructo para este índice TAT porque la dopamina se ha relacionado con la experiencia de la recompensa (Depue y Collins, 1999). Sin embargo, la validez incremental de TAT que mide las necesidades de poder y afiliación más allá de los índices de autoinforme ha recibido poca o ninguna investigación.

La evaluación de las relaciones objetales con el TAT

Durante la última década, Westen y sus colegas se han embarcado en un ambicioso programa de investigación diseñado para evaluar las relaciones objetales (es decir, la representación mental de otras personas) a partir de los protocolos TAT. Se han interesado especialmente en evaluar aspectos de las relaciones objetales que son relevantes para las condiciones psicopatológicas, como el trastorno límite de la personalidad (TLP), que algunos autores (p. ej., Kernberg, 1985) postulan como resultado de alteraciones tempranas en relaciones padre-hijo. Basado en un subconjunto (típicamente de cuatro a siete) de tarjetas TAT, Westen y sus colegas (por ejemplo, Westen, Lohr, Silk, Gold y Kerber, 1990) construyeron un esquema de puntuación detallado, la escala de cognición social y relaciones objetales (SCORS), que evalúa cuatro dimensiones de las relaciones objetales: (a) complejidad de las representaciones de las personas, (b) tono de afecto de las relaciones, (c) capacidad de inversión emocional en las relaciones y estándares morales, y (d) comprensión de la causalidad social. Esta última escala evalúa la comprensión de las causas de los pensamientos, emociones y comportamientos de los demás. Cada dimensión se puntúa en una escala de 1 a 5, donde 5 representa supuestamente el conjunto de respuestas más avanzado en el desarrollo. Más recientemente, Westen (1995) revisó el SCORS subdividiendo la tercera dimensión en dos dimensiones de relaciones y estándares morales y agregando tres dimensiones de agresión, autoestima e identidad y coherencia del ser. En la última versión de SCORS, las respuestas se califican en una escala de 1-7. Parece haber una considerable variabilidad en las tarjetas TAT administradas en distintas investigaciones publicadas de SCORS (por ejemplo, Barends et al., 1990; Ordnuff y Kelsey, 1996), lo que dificulta las generalizaciones entre los estudios porque las SCORS pueden ser útiles cuando un conjunto de tarjetas se administra pero no otro. Del mismo modo, los puntajes óptimos de corte pueden diferir según el subconjunto de tarjetas que se use. Además, todavía no se dispone de normas adecuadas para el SCORS en muestras de población general.

Fiabilidad. Aunque la fiabilidad entre evaluadores para las dimensiones de los SCORS ha sido alta (por ejemplo, Westen, Ludolph, Lerner, Ruffins y Wiss, 1989, informaron correlaciones intraclase de aproximadamente 0,90 para la mayoría de las dimensiones), sus consistencias internas han sido menos impresionante. Westen, Lohr, Gold y Kerber (1990), por ejemplo, informaron consistencias internas (alfas de Cronbach) que van desde .59 a .77 en varias muestras clínicas. En una muestra de 96 estudiantes universitarios, se informó que la consistencia interna de la escala de tono de afecto era de .56 (Barends et al., 1990). Aunque las cuatro escalas de los SCORS originales están positivamente correlacionadas (por ejemplo, Ornduff, Freedenfeld, Kelsey y Critelli, 1994, informaron interrelaciones significativas en la escala que van desde .30 a .73), no se sabe si en el total de SCORS la puntuación corresponde a una sola dimensión de orden superior.

No conocemos los estudios de confiabilidad de test-retest publicados en SCORS. Por lo tanto, los estudios de fiabilidad test-retest de este método de puntuación, que idealmente deberían incluir formas alternativas, parecen justificados.

Validez. Las dimensiones SCORS han demostrado gran validez de constructo en varias investigaciones de diagnóstico diferencial. Westen, Lohr y col. (1990) utilizaron el SCORS para comparar 35 pacientes diagnosticados con TLP, 25 pacientes diagnosticados con trastorno depresivo mayor y 30 normales; todos los grupos fueron emparejados por sexo. Los pacientes con TLP obtuvieron puntuaciones significativamente más bajas en las cuatro escalas SCORS originales, comparados con los sujetos normales, y significativamente más bajas que el grupo depresivo mayor en el tono de afecto (lo que sugiere representaciones de objetos más malévolos) y la comprensión de las escalas de causalidad social. Westen, Ludolph y col. (1990) extendió estos hallazgos a un estudio de 33 pacientes adolescentes con TLP, 21 pacientes psiquiátricos adolescentes con diagnósticos mixtos y 31 normales; todos los grupos fueron emparejados por edad, sexo y raza. Como se predijo, los pacientes con TLP obtuvieron puntajes significativamente más bajos que los otros grupos en la escala de tono de afecto, con diferencias en el rango medio a grande (d = .55 para la diferencia de los pacientes psiquiátricos no limítrofes, d = .68 para la diferencia de los normales). Además, los pacientes con TLP obtuvieron puntuaciones significativamente más bajas que el grupo normal, pero no el grupo psiquiátrico mixto, en las escalas de capacidad para la inversión emocional y la comprensión de la causalidad social. Las diferencias entre los pacientes con TLP y los sujetos normales estaban en el rango medio (ds = .60 y .59, respectivamente). Sin embargo, al contrario de lo previsto, los pacientes con TLP obtuvieron puntuaciones significativamente más altas que el grupo psiquiátrico mixto, pero no el grupo normal, en la escala de complejidad de representaciones. Además, esta diferencia era de magnitud media (d = .59). Este hallazgo pone en tela de juicio la validez de constructo de la escala de complejidad de representaciones, aunque Westen y sus colegas han argumentado que este hallazgo podría apuntar a la presencia de un subconjunto de pacientes con TLP con representaciones de objetos altamente diferenciados. Curiosamente, Westen, Lohr, et al. (1990) habían encontrado una marcada heterogeneidad en esta variable entre los pacientes con TLP, con aproximadamente la mitad exhibiendo representaciones de objetos complejos en al menos una tarjeta TAT. La capacidad de los SCORS para diferenciar a los pacientes con TLP de pacientes normales u otros pacientes psiquiátricos ha sido replicada por investigadores no afiliados al equipo de investigación de Westen (por ejemplo, Gutin, 1997; Malik, 1992).

Los hallazgos de apoyo para la versión revisada de SCORS se informaron en una investigación reciente de 58 pacientes con TLP, trastorno de personalidad antisocial (TPA), trastorno de personalidad narcisista (TNP) y trastornos de personalidad del grupo C (ansioso, temeroso; Ackerman, Clemence, Weatherill y Hilsenroth, 1999). Como se predijo, los pacientes con TLP exhibieron las puntuaciones de tono de afecto más bajas de los 4 grupos, y las diferencias con respecto a los pacientes con TNP y trastornos del grupo C alcanzaron significación. Además, los pacientes con TLP obtuvieron puntajes significativamente más bajos en la variable Identidad y la variable Coherencia del Self que los pacientes con TNP, lo cual es consistente con la perturbación de identidad que a menudo se cree que es central para TLP (Kernberg, 1985). Sin embargo, varias diferencias grupales plantean serias dudas sobre la validez de constructo de ciertos índices derivados del SCORS. Por ejemplo, los pacientes con TPA obtuvieron puntajes que no eran significativamente más altos que el grupo TLP en la variable estándares morales y no difirieron significativamente de ninguno de los otros grupos en esta variable, a pesar del hecho de que los individuos con TPA generalmente se caracterizan por una debilidad o ineficacia de conciencia. Del mismo modo, se encontraron resultados paradójicos para la variable agresión, a pesar de la centralidad de la agresión para el diagnóstico de TPA (American Psychiatric Association, 1994).

Varios investigadores han examinado la validez de los SCORS utilizando otros criterios externos. En una muestra de 96 estudiantes universitarios, Barends et al. (1990) encontraron que la escala de tono de afecto SCORS se correlacionó significativamente pero modestamente (r = .23) con el tono de afecto según lo evaluado en una entrevista semiestructurada, así como con un índice autoinformado que evalúa la fe en las personas (r también = .23). Sin embargo, otros correlatos predichos de la escala de tono de afecto SCORS, como un indicador de Rorschach de la malevolencia percibida de otros (Blatt, Wein, Chevron y Quinlan, 1979) y un índice de ajuste social de autoinforme, no fueron estadísticamente significativo. También hay cierto apoyo para el uso de los SCORS en la evaluación del impacto de los primeros eventos ambientales adversos. En una muestra de 36 mujeres adolescentes hospitalizadas, Westen, Ludolph, Block, Wixom y Wiss (1990) encontraron que la escala de tono afectivo estaba correlacionada negativa y significativamente (r = −.46) con el número de madres sustitutas. Además, la proporción de respuestas pobremente diferenciadas en la escala de Complejidad de representaciones se correlacionó positiva y significativamente (r = .70) con la duración autoinformada de abuso sexual entre los 12 pacientes de esta muestra que habían informado antecedentes de tal abuso. Sin embargo, una serie de correlaciones predichas entre las dimensiones de SCORS y varios factores de riesgo de la primera infancia (p.ej., número de movimientos iniciales) no fueron significativas, aunque el bajo poder estadístico puede haber impedido la detección de algunas asociaciones genuinas. Ordnuff y col. (1994) examinaron la capacidad de SCORS para detectar abuso sexual en una muestra de 17 niñas con antecedentes documentados de abuso sexual y 25 niñas sin antecedentes de abuso. Los niveles medios de SCORS fueron significativamente más bajos en el primero que en el último grupo (r = .40), aunque no se informaron pruebas de significación separadas para las dimensiones individuales de SCORS.

Por lo tanto, el SCORS parece estar significativamente asociado con ciertas condiciones psicopatológicas, particularmente TLP, y tal vez el impacto de las primeras experiencias adversas. Sin embargo, varios problemas relacionados con la validez de SCORS justifican un examen más detallado. Primero, varias de las correlaciones predichas de las dimensiones SCORS van en contra de la predicción. En particular, los hallazgos sugieren (a) representaciones de objetos más complejas entre los pacientes con TLP que otros pacientes y (b) los hallazgos sobre niveles relativamente bajos o poco notables de inmoralidad y agresión entre los pacientes con TPA comparados con los pacientes con otros trastornos de la personalidad requieren replicación. Si estos hallazgos se pueden replicar, será necesario que Westen y sus colegas demuestren que los pacientes con TLP y los pacientes con TPA demuestran estos atributos en otros instrumentos psicológicos, o que ofrezcan una revisión de las conceptualizaciones actuales de estas afecciones.

En segundo lugar, se ha encontrado que la inteligencia medida se correlaciona positiva y significativamente con la escala de Complejidad de Representaciones (r = .33), mientras que el recuento de palabras SCORS (es decir, el número total de palabras producidas por los encuestados) se correlacionan positiva y significativamente (r = .34 y .29) con las escalas de tono afectivo y comprensión de la causalidad social, respectivamente (Ordnuff et al., 1994; pero ver Ordnuff y Kelsey, 1996, para un patrón diferente de correlaciones). La extensión en la que estas covariables explican los resultados positivos en el SCORS no está clara. Ornduff y col. (1994) encontraron que las diferencias en SCORS entre los niños maltratados y no maltratados seguían siendo significativas después de controlar la inteligencia general y el recuento de palabras. En contraste, Westen, Ludolph, et al. (1990) descubrieron que controlar tanto el recuento de palabras como la inteligencia verbal eliminó diferencias significativas entre el grupo de TLP y otros grupos en dos de las tres escalas SCORS, aunque el control del recuento de palabras no lo hizo (los autores no informaron los análisis que controlaban sólo la inteligencia verbal). Por lo tanto, las medidas de inteligencia verbal y el recuento de palabras deben examinarse rutinariamente como covariables en los estudios de SCORS para que se pueda aclarar el posible papel confuso de la capacidad verbal.

La evaluación de los mecanismos de defensa con el TAT

Basándose en el trabajo de Vaillant (1977) y otros sobre la progresión del desarrollo de los mecanismos de defensa, Cramer (1991) construyó el Manual de Mecanismos de Defensa (DMM), un índice basado en TAT de los mecanismos de defensa de negación, proyección e identificación. Según Vaillant, los mecanismos de defensa pueden agruparse a lo largo de un continuo de madurez de desarrollo, con algunos mecanismos (por ejemplo, negación) inmaduros, otros (por ejemplo, proyección) más avanzados y otros (por ejemplo, identificación) aún más avanzado.

En el enfoque de Cramer, a los participantes se les administran varias tarjetas TAT, y sus historias se califican por la presencia de numerosas características hipotetizadas para reflejar la presencia de uno de estos tres mecanismos de defensa (ver Cramer, 1991). Como en el caso de SCORS, existe una considerable variabilidad entre los estudios publicados en el número de tarjetas TAT y las tarjetas específicas utilizadas, con algunos estudios basados en solo dos tarjetas (una de las cuales no está en el conjunto TAT original; ver Cramer, 1997) y otros estudios basados en seis tarjetas del TAT original (por ejemplo, Porcerelli, Thomas, Hibbard y Cogan, 1998). Como resultado, la generalización entre los estudios es potencialmente problemática y las normas de población para el DMM no están disponibles.

Fiabilidad. La fiabilidad entre evaluadores para las defensas DMM ha sido adecuada, aunque no extremadamente alta. En 17 muestras diferentes, la confiabilidad mediana entre administradores evaluada por las correlaciones de Pearson fue de .81, .80 y .64 para negación, proyección e identificación, respectivamente (ver Cramer y Block, 1998). La fiabilidad relativamente baja entre evaluadores para la identificación puede reflejar la mayor complejidad involucrada en la puntuación de este mecanismo de defensa (Cramer, 1991).

También vale la pena señalar que, a diferencia de las correlaciones intraclase, las correlaciones de Pearson pueden sobreestimar la magnitud del acuerdo entre evaluadores porque pueden ser elevadas incluso cuando los evaluadores difieren notablemente en las evaluaciones absolutas de sus calificaciones. La consistencia interna y la fiabilidad test-retest del DMM han sido aún más problemáticas. Cramer (1991) informó los alfa de Cronbach de .57, .63 y .83 para las escalas de negación, proyección e identificación, respectivamente, en una muestra de 40 estudiantes universitarios. Además, informó confiabilidades de prueba-prueba de forma alternativa (en un intervalo de 2 a 3 semanas) de .07, .30 y .41 para estas tres escalas, respectivamente, en una muestra de 32 estudiantes de sexto grado. Las correspondientes correlaciones test-retest (nuevamente durante un intervalo de dos a tres semanas) para una muestra de 32 estudiantes de 2º grado fueron .46, .24 y .24. Sin embargo, debido a que los niños en ambas muestras se sometieron a retroalimentación de éxito o fracaso después de la administración inicial de la prueba, estas cifras pueden subestimar la confiabilidad típica de descanso de prueba del DMM. Es claramente necesaria una mayor investigación de la confiabilidad de forma alternativa del DMM.

Existe un apoyo modesto para la validez de constructo de varios esquemas de puntuación TAT, particularmente aquellos que evalúan la necesidad de logros y relaciones objetales

Validez. Cramer y sus colegas han examinado la validez de constructo del DMM de varias maneras. Primero, han explorado la capacidad del DMM para diferenciar entre individuos a diferentes edades. Cramer (1987) administró el DMM a cuatro grupos de escolares con edades medias de 5.8, 9.1, 14.6 y 16, respectivamente. Como predijo el curso de desarrollo hipotético de los mecanismos de defensa (Valliant, 1977), hubo disminuciones significativas en la negación desde el primer grupo de edad en adelante y aumentos significativos en la identificación desde el segundo grupo en adelante. Además, la proyección alcanzó un pico significativo en los grupos de segunda y tercera edad. En un estudio de alumnos de 2º, 5º, 8º y 11º grado y estudiantes universitarios, Hibbard et al. (1994) encontraron igualmente disminuciones en la negación a partir del segundo grado en adelante. Sin embargo, hubo un aumento no anticipado y significativo en la negación en el 11º grado. Al contrario de las hipótesis de desarrollo de Cramer (1991, p. 34), que predicen un aumento en la proyección de las edades de 7 a 10 años, la proyección mostró un patrón de disminución en todos los niveles de grado. Finalmente, como se predijo, la identificación aumentó en todos los niveles de grado. Los hallazgos de Hibbard et al. brindan un soporte mixto para la validez de constructo del DMM, aunque en cambio es posible que las hipótesis de desarrollo de Cramer estén parcialmente en error.

Cramer y Block (1998) ampliaron el trabajo previo de Cramer sobre el desarrollo de mecanismos de defensa al examinar la validez del DMM en una muestra de 90 niños de preescolar evaluados a los 3 y 4 años y nuevamente a los 23 años. Las calificaciones de Personalidad en la guardería fueron completadas por un conjunto de maestros utilizando el conjunto Q de California (Block & Block, 1980), y las puntuaciones DMM se obtuvieron de los participantes aproximadamente 2 décadas más tarde. Los análisis revelaron que el uso inapropiado de la negación en la edad adulta temprana se predijo por mal humor, reactividad al estrés y control deficiente de los impulsos en la guardería, pero solo entre los hombres. Hubo pocos o ningún pronosticador infantil consistente del uso de la proyección o identificación de adultos en ambos sexos. Los hallazgos de Cramer y Block son difíciles de interpretar dado que hicieron pocas predicciones explícitas sobre los correlatos específicos de clasificación Q de las puntuaciones de DMM (ver p. 160).

Hibbard y col. (1994) examinaron la capacidad del DMM para diferenciar a 29 pacientes psiquiátricos en un hospital de Administración de Veteranos realizadas por 40 estudiantes universitarios. A diferencia de los métodos utilizados en los estudios de Cramer, los puntajes de los participantes para cada defensa se calcularon como un porcentaje de sus puntajes totales de defensa. Las diferencias entre los grupos en su uso de negación o proyección no fueron significativas y su magnitud fue insignificante. La identificación, en contraste, fue significativamente mayor entre los estudiantes universitarios. Estos hallazgos proporcionan evidencia mixta y en gran medida negativa de la validez de constructo del DMM, aunque el método ipsativo de Hibbard et al. para calcular las puntuaciones de defensa, que eliminó las diferencias entre sujetos en el uso total de los mecanismos de defensa, puede haber atenuado las diferencias entre los grupos.

Finalmente, Cramer y sus colegas han examinado hasta qué punto los puntajes de DMM aumentan después de las experiencias estresantes, como lo predecirían los modelos psicodinámicos de los mecanismos de defensa (ver Cramer, 1999, para una revisión). Por ejemplo, Cramer y Gaul (1988) asignaron al azar a 64 niños de primaria (en los grados 2º y 6º) para recibir retroalimentación de éxito o fracaso después de una tarea perceptual-motora. Por razones que no están claras, los autores administraron dos tarjetas TAT antes de la retroalimentación y tres tarjetas TAT después de la retroalimentación. Como se predijo, el uso de la negación y la proyección, pero no la defensa de identificación más avanzada en el desarrollo, fue significativamente mayor en la falla que en la condición de éxito. Sin embargo, la inspección de los medios revela que, aunque el uso de la negación aumentó después de la retroalimentación de falla, el uso de la proyección en realidad disminuyó ligeramente. La diferencia significativa en el uso de la proyección entre las condiciones de éxito y fracaso parece deberse a una marcada disminución en el uso de la proyección después de la retroalimentación de éxito.

Dollinger y Cramer (1990) examinaron el uso de mecanismos de defensa en una muestra de 29 varones adolescentes que habían sido testigos de un rayo que mató a un niño e hirió a varios otros. Descubrieron que los niños que obtuvieron puntajes más altos en los tres mecanismos de defensa DMM, particularmente la proyección, exhibieron niveles significativamente más bajos de síntomas psicológicos (p. ej., miedos, quejas somáticas) que otros niños. Estos hallazgos fueron interpretados por Dollinger y Cramer (véase también Cramer, 1999) en el sentido de que los niños más defensivos podían protegerse mejor del impacto psicológico del trauma. Sin embargo, las implicaciones de estos resultados para la validez de constructo del DMM no está clara. Debido a que Cramer (1991) argumentó que una variedad de formas de psicopatología están positivamente asociadas con el uso de mecanismos de defensa, parecería que casi cualquier patrón de hallazgos (p. ej., mayor o menor uso de mecanismos de defensa asociados con la psicopatología) podría ser interpretado como soporte de la validez del DMM.

En resumen, la evidencia de la validez de constructo del DMM es, en el mejor de los casos, mixta. La progresión hipotética del desarrollo de los mecanismos de defensa de Cramer (1991) se ha apoyado solo en parte, la relación entre los problemas de personalidad de la infancia y el uso de defensas en la edad adulta temprana no se ha corroborado entre los sexos, y las asociaciones entre el uso de la defensa y la psicopatología se han confirmado. inconsistente o difícil de interpretar. Además, con la posible excepción de un estudio que examina el curso de desarrollo de los mecanismos de defensa (Porcerelli et al., 1998), parece que no hay réplicas de los correlatos del DMM por parte de investigadores independientes. Las investigaciones adicionales del DMM deberían centrarse en generar predicciones más claramente falsificables sobre las relaciones entre el uso del mecanismo de defensa y las variables de resultado relevantes. Además, se debe desarrollar y utilizar un conjunto estandarizado de tarjetas DMM en todos los estudios para que los resultados se sinteticen de manera más significativa en diferentes investigaciones y se puedan desarrollar normas adecuadas.

Resumen y discusión

Existe un apoyo modesto para la validez de constructo de varios esquemas de puntuación TAT, particularmente aquellos que evalúan la necesidad de logros y relaciones objetales. Sin embargo, una serie de cuestiones no resueltas, particularmente posibles confusiones con inteligencia y falta de estandarización de estímulos entre los estudios, requieren atención adicional. El uso del TAT para evaluar los mecanismos de defensa ha recibido un apoyo limitado e inconsistente. En los últimos años se han desarrollado otros esquemas de puntuación TAT potencialmente útiles. Por ejemplo, Ronan y sus colegas (Ronan, Colavito y Hammontree, 1993; Ronan et al., 1996) han derivado un índice de resolución de problemas personales del TAT que se correlaciona significativamente con una medida de desempeño que involucra la generación de medios y fines para soluciones a problemas, y eso distingue significativamente a los pacientes psiquiátricos de los normales. Además, se ha encontrado que los puntajes en este índice aumentan significativamente después de la capacitación en la generación de soluciones alternativas (Ronan, Date y Weisbrod, 1995).

Sin embargo, incluso los pocos sistemas de puntuación TAT prometedores aún no son apropiados para el uso clínico de rutina. Para todos estos sistemas, (a) no hay normas adecuadas disponibles, (b) la confiabilidad test-retest es cuestionable o desconocida, (c) la confiabilidad de campo (Wood et al., 1996a) no ha sido probada, y (d) casi no hay investigaciones para garantizar que dichos sistemas no estén sesgados contra uno o más grupos culturales. Además, no hay evidencia convincente de que los esquemas de puntuación TAT para relaciones de objeto o los mecanismos de defensa poseen una validez incremental más allá de los índices de autoinforme de estos constructos.

Aunque existe un apoyo modesto para la validez de constructo de varios esquemas de puntuación de TAT, la relevancia de estos hallazgos para la práctica clínica es dudosa

Se necesitan normas TAT adecuadas para que los clínicos no sobrediagnostiquen la psicopatología. En un estudio clásico, Little y Schneidman (1959) pidieron a los psicólogos que calificaran a individuos normales en una escala de desajuste 1-9, con 9 indicando psicopatología severa. Los psicólogos tenían más probabilidades de percibir la psicopatología en individuos normales cuando las calificaciones se basaban en el TAT (media = 4.8) que cuando las calificaciones se basaban en un historial de casos (media 1.6) o en el MMPI (media 3.3). Más recientemente, Murstein y Mathes (1996) encontraron que una medida del vocabulario estaba significativamente correlacionada (r = .36) con la patología calificada por TAT en una muestra no clínica. Otros análisis en esta muestra y en una muestra de pacientes psiquiátricos revelaron correlaciones positivas entre el vocabulario y un índice de proyección derivado de TAT, que evaluó la medida en que los encuestados revelaron material personalmente relevante. Aunque estos hallazgos están abiertos a varias interpretaciones, una posibilidad es que los encuestados detallados tenderán a ser juzgados como más patológicos. Este sesgo puede ser especialmente pronunciado cuando se utiliza la puntuación impresionista del TAT, que por definición se realiza sin referencia a datos normativos.

Aunque existe un apoyo modesto para la validez de constructo de varios esquemas de puntuación de TAT, la relevancia de estos hallazgos para la práctica clínica es dudosa, porque una abrumadora mayoría de los clínicos confían únicamente en interpretaciones impresionistas del TAT (Hunsley et al., 2000). Como observó Ryan (1985),es probable que los profesionales que interpretan el TAT usen diferentes sistemas, una combinación idiosincrásica de sistemas o ningún sistema. Esta es la ruina del psicometrista, y también sugiere que, en el uso común, la interpretación del TAT se basa en estrategias de confiabilidad y validez desconocidas y no probadas, un resultado potencialmente peligroso (p. 812).

Por último, un importante problema no resuelto se refiere a lo que podría denominarse la fungibilidad de diferentes métodos proyectivos. Hemos visto que varios esquemas de codificación estandarizados para el TAT probablemente pueden caracterizarse por poseer una modesta validez de constructo. Al mismo tiempo, una considerable cantidad de literatura indica que se pueden utilizar materiales de estímulo distintos al TAT para calificar las dimensiones evaluadas por el TAT. Por ejemplo, la necesidad de medidas de logro obtenidas de una variedad de materiales escritos ha demostrado validez para los resultados relacionados con el logro (McClelland, 1961). Westen y otros han descubierto que los índices de relaciones de objetos con el patrón después de SCORS se pueden obtener de varias fuentes distintas de TAT, incluidos los primeros recuerdos e historias contadas durante la administración de la subprueba de arreglo de imagen WAIS-R. Además, al igual que los SCORS, se ha encontrado que estos métodos de puntuación de las relaciones entre objetos distinguen a los pacientes con TLP de los no pacientes y otros pacientes psiquiátricos (ver Barends et al., 1990; Nigg, Lohr, Westen, Gold y Silk, 1992). Como Zeldow y McAdams (1993) concluyeron en su breve revisión de la validez comparativa del TAT y las muestras de discurso libre, «varias formas de muestras de discurso narrativo pueden estar altamente correlacionadas, siempre y cuando se utilicen categorías de contenido de orden superior y psicológicamente significativas» (p 181). Por lo tanto, aunque los resultados revisados aquí ofrecen un apoyo alentador para la validez de per se ciertos sistemas de calificación derivados del TAT, dejan abierta la pregunta de si el TAT (o incluso cualquier técnica proyectiva formal) es necesaria per se para lograr tal validez.

Relacionado

Psyciencia Pro

Si te gusta lo que hacemos,
considera apoyar Psyciencia

Con tu membresía sostienes este proyecto y accedes a contenido exclusivo pensado para profesionales de la salud mental.

📩 Columnas los lunes y viernes — análisis y reflexiones sobre psicología clínica 📄 Recurso clínico en PDF cada miércoles — guías y protocolos basados en ACT y DBT 🗂️ Directorio de profesionales — publica tu perfil y date a conocer entre la comunidad 🎓 Webinar mensual en vivo, con grabación disponible 🎙️ Podcast Watson — conversaciones sobre los desafíos reales de la profesión 🎟️ Descuentos en cursos y talleres de formación

Plan anual — recomendado $80 / año Ahorras $16 — 2 meses gratis Plan mensual $8 / mes

¿Estudiante? Plan especial a $5/mes. · ¿Ya eres miembro? Inicia sesión.

El estatus científico de las técnicas proyectivas

Test de apercepción temática (TAT)

Descripción general de la investigación TAT: problemas y hallazgos

Validez incremental del TAT

Esquemas de puntuación de necesidad basados en TAT

La evaluación de las relaciones objetales con el TAT

La evaluación de los mecanismos de defensa con el TAT

Resumen y discusión

Relacionado

Si te gusta lo que hacemos,
considera apoyar Psyciencia

Equipo de Redacción

3 comentarios

Test de apercepción temática (TAT)

Descripción general de la investigación TAT: problemas y hallazgos

Validez incremental del TAT

Esquemas de puntuación de necesidad basados ​​en TAT

La evaluación de las relaciones objetales con el TAT

La evaluación de los mecanismos de defensa con el TAT

Resumen y discusión

Relacionado

Si te gusta lo que hacemos,considera apoyar Psyciencia

Equipo de Redacción

3 comentarios

Esquemas de puntuación de necesidad basados en TAT

Si te gusta lo que hacemos,
considera apoyar Psyciencia