Die Einschätzung der Rückfallrisiken erneuter schwerer Delikte ist eine zentrale Aufgabe forensischer Sachverständigentätigkeit von Psycholog:innen im Jugendstrafvollzug. Allgemein umfasst das Jugendgerichtsgesetz (JGG) zwar im Vergleich zum erwachsenen Strafrecht (StGB) weniger obligatorische Anlässe zur Einholung von Prognosegutachten (z. B. bei der Aussetzung des Strafrestes zur Bewährung, § 88 JGG und § 57 StGB in Verbindung mit § 454 Strafprozessordnung). Aber gerade für junge Straftäter sind valide Kriminalprognosen von besonderer Bedeutung, da sie geeignete Maßnahmen und Interventionen zielgerecht steuern und dadurch frühzeitig zur Verringerung persönlicher, sozialer und ökonomischer Kosten einer drohenden langfristig persistierenden Delinquenz beitragen sollen (Cohen et al.
2010). Bei Jugendlichen und Heranwachsenden stehen Prognosen jedoch u. a. vor der Herausforderung, Täter mit der Erwartung einer auf die Jugendzeit begrenzten delinquenten Lebensphase – die also auch ohne intensive Interventionen mit Eintritt ins Erwachsenenalter delinquente Verhaltensweisen beenden („adolescence limited offender“; vgl. Moffitt
1993) – von Tätern mit drohender persistierender Straftäterkarriere („life course persistent offender“) zu einem Zeitpunkt zu differenzieren, bevor sich die Entwicklungspfade getrennt haben. Weiterhin ist die Jugendzeit eine Phase des physischen, psychischen sowie sozialen Wandels und viele der jungen Menschen sind noch auf der Suche nach einem passenden Lebensplan (Havighurst
1953; Hurrelmann und Quenzel
2016). Nicht zuletzt ist die Aussagekraft von empirisch bewährten Risikofaktoren (Bonta und Andrews
2017), wie eine dissoziale Persönlichkeit oder eine Vorgeschichte antisozialen und delinquenten Verhaltens, bei Jugendlichen und Heranwachsenden durch das junge Lebensalter eingeschränkt. Die Frage, ob und wie zuverlässig die Prognose bei Jugendlichen und Heranwachsenden gelingt, ist Gegenstand der vorliegenden Arbeit.
Statistisch-nomothetische Prognose
Nomothetische Methoden zeichnen sich durch ihren Bezug auf empirisches Erfahrungswissen und ein regelgeleitetes bzw. an vorgegebenen Kriterien orientiertes Vorgehen aus. Diese steuern dabei die Auswahl und Erfassung der benötigten Informationen sowie deren Verrechnung zu einem Risikoscore. Dieser Risikoscore wird dann auf der Grundlage von Referenzgruppen mit bekannten Rückfallquoten mit der Wahrscheinlichkeit eines Rückfalls des zu beurteilenden Täters in Verbindung gesetzt (Dawes et al.
1989; Meehl
1954). Diesem Ansatz folgend wurde in den letzten Jahrzehnten eine Vielzahl von strukturierten und standardisierten Prognoseinstrumenten entwickelt, die sich hinsichtlich ihrer Entwicklung, Zielsetzung und Item-Komposition in mehrere Generationen
1 einteilen lassen (Bonta und Andrews
2017).
Einige relativ einfache Instrumente beschränken sich auf die Abschätzung des statistischen Ausgangsrisikos. Instrumente der sog. zweiten Generation umfassen mehrheitlich statische Risikofaktoren, die keine theoretische Basis haben. Diese werden rein kriteriumsbezogen (z. B. Rückfall) nach der bloßen Maßgabe gruppenstatistischer Durchschnittszusammenhänge zwischen Tat- und Tätermerkmalen einerseits und der Rückfallwahrscheinlichkeit andererseits entwickelt. Die kriteriumsbezogene Differenzierung der Täter erfolgt daher meist auf der Grundlage einiger weniger prognostisch bedeutsamer demografischer Eckdaten und einiger Merkmale der strafrechtlichen Vorgeschichte. Einige Verfahren verrechnen diese Informationen dabei unmittelbar zu einer Rückfallwahrscheinlichkeitsschätzung (z. B. Offender Group Reconviction Scale Version 3 [OGRS3]; dt. Version: Breiling et al.
2022; Howard et al.
2009), die meisten beschränken sich jedoch auf eine einfache Aufsummierung (z. B. Risk Matrix 2000; Thornton et al.
2003) oder eine gewichtete Verrechnung (z. B. Violence Risk Appraisal Guide [VRAG]; Harris et al.
1993; dt. Version: Rossegger et al.
2009) der im Einzelfall festgestellten Risikomerkmale zu einem Risikoscore. Momentan sind den Autoren keine Verfahren der zweiten Generation, welche explizit für jugendliche Straftäter als Zielgruppe entwickelt wurden, bekannt.
Instrumenten der dritten Generation geht es darum festzustellen, ob im vorliegenden Fall komplexere kriminogene Risikofaktoren kumulieren und in welchem Ausmaß den Risiken Schutzfaktoren gegenüberstehen. Sie beziehen zumeist sowohl statische als auch dynamische (also potenziell veränderbare) Risiko- und Schutzfaktoren mit ein und wurden für verschiedene Zwecke und Zielgruppen, so auch für jugendliche Straftäter, entwickelt. Eines der verbreitetsten Verfahren dieser Art ist das Level of Service Inventory – Revised (LSI‑R; Andrews und Bonta
1995; dt. Version: Dahle et al.
2012), das sich in vielen Untersuchungen als valides Verfahren zur allgemeinen Rückfallvorhersage erwiesen hat. Mit dem Youth Level of Service/Case Management Inventory (YLS/CMI; Hoge und Andrews
2002) liegt hierfür auch eine speziell für jugendliche Straftäter adaptierte Version vor, die bislang aber noch nicht offiziell ins Deutsche übersetzt wurde
2.
Neben den Verfahren der dritten Generation sind hier auch Instrumente zur strukturiert-professionellen Risikobeurteilung („structured professional judgement“, SPJ), die häufig mehr oder weniger umfangreiche Sammlungen empirisch belegter Risiko- und Schutzfaktoren enthalten, zu nennen. In Abgrenzung zum eigentlichen nomothetischen Ansatz werden die Faktoren beim SPJ jedoch nicht zu einer quantifizierten Risikoeinschätzung verrechnet, sondern sollen die individuelle Fallbeurteilung durch die systematische Vorgabe von bewährten und potenziell relevanten Beurteilungskriterien strukturieren (Hart und Logan
2011). Insofern erhebt der SPJ-Ansatz den Anspruch, eine Brücke zwischen dem nomothetischen und einem einzelfallbezogenen Ansatz zu schlagen. Werden die in den Instrumenten aufgeführten Risiko- und Schutzfaktoren zu einem Gesamtscore aufsummiert (wie in der vorliegenden Arbeit der Fall), können diese Verfahren jedoch den statistisch-nomothetischen Methoden angenähert werden, indem die prognostische Validität dieses Scores untersucht und ggf. entsprechende Risikolevel entwickelt werden („mechanical method“; Hanson und Morton-Bourgon
2009). Studien deuten darauf hin, dass ein solcher aktuarischer Gebrauch dem Vorgehen nach SPJ überlegen ist (Challinor et al.
2021).
Das Historical-Clinical-Risk-Management-20-Schema (dt. Version: Müller-Isberner et al.
1998; HCR-20; Webster et al.
1997) ist ein solches SPJ-Instrument zur Vorhersage zukünftiger Gewalttaten, das insbesondere in seiner Version 2 umfassend untersucht wurde (Douglas et al.
2014). Mit dem Structured Assessment of Violence Risk in Youth (SAVRY; Borum et al.
2003; dt. Version: Rieger et al.
2006) existiert ein ähnlich aufgebautes SPJ-Verfahren zur Beurteilung des Gewaltrisikos speziell bei Jugendlichen. Demgegenüber zielt das Structured Assessment of Protective Factors for violence risk (dt. Version: Spehr und Briken
2010; SAPROF; de Vogel et al.
2007) als SPJ-Verfahren auf die strukturierte Erfassung protektiver Faktoren bei Personen ab, die ein Risiko für gewalttätiges Verhalten aufweisen. Auch dieses Verfahren liegt in einer Jugendversion vor (dt. Version: Spehr und Boonmann
2018; SAPROF-YV; de Vries Robbé et al.
2014).
Bei schweren Gewalttaten und einer biographisch erkennbaren, anhaltend dissozialen Lebensführung geht es auch um die gezielte Prüfung einer möglichen Zugehörigkeit zu einer bekannten Hochrisikogruppe. Bei Gewaltstraftätern bietet sich hier die Prüfung psychopathischer Persönlichkeitsmerkmale mittels der Psychopathy Checklist – Revised an (PCL‑R; Hare
2003; dt. Version: Mokros et al.
2017), da höhere PCL-R-Werte mit einer erhöhten Gefährlichkeit und Gewaltbereitschaft assoziiert sind (Gillespie et al.
2023; Salekin et al.
1996). Auch dieses Verfahren liegt in einer Version für jugendliche Probanden vor (PCL:YV; Forth et al.
2003; dt. Version: Sevecke und Krischer
2014). Es gilt zu beachten, dass es sich, streng genommen, um kein Prognoseinstrument handelt, sondern ein Instrument zur Erfassung eines klinischen Konstrukts (Mokros et al.
2017).
Zahlreiche Metaanalysen unterstreichen die prädiktive Validität dieser Prognoseinstrumente in erwachsenen (Campbell et al.
2009; Coid et al.
2013; Fazel et al.
2022; Helmus et al.
2013; Olver et al.
2014; Olver und Wong
2015; Walters
2006; Yang et al.
2010) und etwas seltener in jugendlichen Stichproben (Dickens und O’Shea
2018; Edens et al.
2007; Olver et al.
2009; Schwalbe
2007). Diese Metaanalysen weisen zum einen darauf hin, dass sich die Vorhersagegenauigkeit der verschiedenen Arten bzw. Generationen von Prognoseinstrumenten kaum unterscheidet und meist im Bereich von AUC
3 = 0,67–0,75 liegt (Dahle und Lehmann
2023). Wenn es nur um die Vorhersage zukünftiger Rückfälligkeit geht, scheinen die Instrumente im Wesentlichen austauschbar zu sein (Yang et al.
2010). Zum anderen zeigen sie, dass die Vorhersagegenauigkeit von Prognoseinstrumenten für Jugendliche mit der von Erwachsenen vergleichbar ist. Mit Blick auf junge Menschen, die Straftaten begangen haben, untersuchte beispielsweise Schwalbe (
2007) in seiner Metaanalyse 28 Prognoseinstrumente (z. B. YLS/CMI und PCL:YV) in 28 unabhängigen Studien mit 53.405 jungen Straftätern und Straftäterinnen und fand einen mittleren Zusammenhang mit Rückfälligkeit (AUC = 0,64, 95 %-Konfidenzintervall [0,56, 0,73]; YLS/CMI: AUC = 0,64 [0,51, 0,78] und PCL:YV: AUC = 0,70 [0,49, 0,90]). Olver et al. (
2009) berichten für 8746 jungen Straftäter und Straftäterinnen aus 42 unabhängigen Studien einen der Größe nach vergleichbaren Zusammenhang für die Instrumente YLS/CMI, PCL:YV und SAVRY mit allgemeiner Rückfälligkeit (AUC ≅ 0,68, AUC ≅ 0,66 bzw. AUC ≅ 0,68)
4 und Gewaltrückfällen (AUC ≅ 0,65, AUC ≅ 0,64 bzw. AUC ≅ 0,67).
Die bisherige Forschung hat in jugendlichen Stichproben in der Regel die altersspezifischen Varianten untersucht. Seltener wurde die prognostische Güte der Erwachsenenvarianten in jugendlichen Stichproben untersucht (bzw. beide Varianten in diesen Stichproben verglichen). Diese Fragestellung ist nicht trivial. Von allen in Deutschland zu einer Jugendstrafe verurteilten männlichen Strafgefangenen waren 2020 lediglich 10,8 % jünger als 18 Jahre (Statistisches Bundesamt
2020). Die überwiegende Mehrheit war zwischen 18 und 21 Jahre (45,5 %) oder älter als 21 Jahre (43,7 %). Unter anderem angesichts der begrenzten Ressourcen im Jugendstrafvollzug stellt sich die Frage, inwieweit sich der Einsatz (und der damit verbundene Aufwand, z. B. Schulungen) der jugendspezifischen Versionen bei diesem vergleichsweisen geringen Anteil an Strafgefangenen überhaupt „lohnt“
5. Hinzu kommt, dass für einige Jugendinstrumente noch keine für den deutschen Sprachraum normierten und validierten Übersetzungen vorliegen (z. B. YLS/CMI). Eine vergleichbare Vorhersagegenauigkeit würde den (nichtvorgesehenen) Einsatz der Erwachsenenversion (z. B. LSI-R) zumindest für prognostische Zwecke auch bei Jugendlichen stützen. Die empirische Überprüfung dieser Frage ist ein Ziel der vorliegenden Arbeit.
Klinisch-idiographische Prognose
Mittels der systematischen Bezugnahme auf empirisches Erfahrungswissen ist eine wissenschaftlich fundierte Einschätzung des Ausgangsniveaus der Rückfallrisiken, auf dem sich der Proband bewegt, möglich. Da sich jedoch im deutschen Strafrechtssystem eine „allein abstrakte, auf statistische Wahrscheinlichkeiten gestützte Prognose verbietet“ (Boetticher et al.
2019, S. 312) und vielmehr eine dezidierte Einzelfallbetrachtung gefordert wird, muss die Risikoprognose mittels eines idiographischen Ansatzes erfolgen (Dahle und Lehmann
2018). Diese Individualisierung zu gewährleisten, beansprucht der oben genannte SPJ-Ansatz für sich (Hart und Logan
2011). Befürworter und Kritiker betonen bei der Vorhersagegenauigkeit die Gleichwertigkeit (z. B. Douglas und Otto
2020) bzw. Unterlegenheit des SPJ-Ansatzes gegenüber standardisierten Instrumenten (z. B. Hanson und Morton-Bourgon
2009). Fest steht indes, dass die alleinige Verwendung der SPJ-Instrumente die gesetzliche Forderung nach einer streng einzelfallbasierten Beurteilung nicht erfüllen kann. Mit dem Prozessmodell zur Urteilsbildung in der klinisch-idiographischen Kriminalprognose von Dahle (
2005) wurde ein Modell entwickelt, welches eine konsequente idiographische Ausrichtung für sich beansprucht und im Fokus der vorliegenden Arbeit steht.
Das Prozessmodell der kriminalprognostischen Urteilsbildung von Dahle (
2005) geht zwar wie der statistisch-nomothetische und der SPJ-Ansatz ebenfalls regelgeleitet vor (im Gegensatz zu einem unstrukturiert-intuitiven Vorgehen), orientiert sich aber bei der Auswahl und Verknüpfung diagnostischer Daten zunächst streng an den spezifischen Gegebenheiten des Einzelfalls. Der prognostische Beurteilungsprozess wird hier v. a. durch die Definition diagnostischer Teilaufgaben, Leitlinien, Prinzipien und Zielvorgaben strukturiert und durch Kontrollprozeduren abgesichert. Ziel des klinisch-idiographischen Ansatzes ist die Begründung einer individuellen Delinquenztheorie (im Sinne eines Systems der spezifisch relevanten Delikthypothesen), die eine psychologische Erklärung für die Entwicklung und Dynamik eines Anlasstatgeschehens und seiner Vorgeschichte bietet und sich auf biographische Fakten und die Analyse der Anlasstat stützt. Die eigentliche kriminalprognostische Einschätzung besteht dann in der Fortschreibung dieses Delinquenzmodells unter Berücksichtigung etwaiger seit der Anlasstat eingetretener Veränderungsprozesse individueller kriminogener und potenziell protektiver Faktoren sowie der zu erwartenden Lebenssituation bei Entlassung. Mit dem klinisch-idiographischen Prozessmodell liegt insoweit ein methodisch ausgearbeitetes Konzept für das Vorgehen einer streng individualisierten Fallbetrachtung vor, das den Anspruch erhebt, ein allgemeines (also nicht auf bestimmte Täter- oder Altersgruppen beschränktes) Vorgehen bei der idiographischen Einschätzung der individuellen Rückfallwahrscheinlichkeit von Straftätern zu beschreiben. Auf die Beschreibung dieses Ansatzes soll hier nicht näher eingegangen werden, er ist jedoch an anderer Stelle ausführlich dargestellt worden (Dahle
2005; Dahle und Lehmann
2018,
2023).
Untersuchungen zur prognostischen Validität des klinisch-idiographischen Prozessmodells zeigten vielversprechende Ergebnisse in einer unselektierten Stichprobe des deutsches Strafvollzugs (Dahle
2005) und bei Gewalt- und Sexualstraftätern (Dahle und Lehmann
2018). Beispielsweise weisen die Ergebnisse von Dahle und Lehmann (
2018) auf einen starken (und den meisten untersuchten Prognoseinstrumenten überlegenen) Effekt der klinisch-idiographischen Prognose zur Vorhersage allgemeiner und einschlägiger Rückfälligkeit mit Gewalt- und Sexualdelikten hin (jeweils AUC ≅ 0,70; Dahle und Lehmann
2018).
Integration des statistisch-nomothetischen und klinisch-idiographischen Ansatzes
Beide Ansätze haben methodenimmanente Vor- und Nachteile, die an anderer Stelle ausführlich besprochen wurden (z. B. Dahle und Lehmann
2023). Zentrale Vorteile des statistisch-nomothetischen Vorgehens sind die systematische Bezugnahme auf empirisches Erfahrungswissen, der hohe Standardisierungsgrad und die Nachvollziehbarkeit. Der größte Nachteil besteht darin, dass statistisch-nomothetische Methoden die Besonderheiten und Unterschiede zwischen einzelnen Personen nicht berücksichtigen (können). Die gesetzliche Forderung nach einem streng einzelfallbasierten Vorgehen wird letztlich nur durch eine klinisch-idiographische Prognose erfüllt, was insoweit der wichtigste Vorteil dieses Vorgehens ist. Allerdings hat der idiographische Ansatz auch Nachteile, z. B. das offensichtliche Problem der Komplexität der Urteilsbildung und die damit einhergehenden hohen Anforderungen an den Anwender. Um die Stärken beider Ansätze zu nutzen und die Schwächen zu reduzieren, sollten für Prognosen im strafrechtlichen Kontext idealerweise beide wissenschaftlichen Ansätze genutzt werden (Dahle
2005).
Es wurden verschiedene Vorschläge zur Integration des nomothetischen und idiographischen Ansatzes, die sich mitunter im Verständnis eines idiographischen Vorgehens unterscheiden, gemacht. So liegen mittlerweile einige Studien zur international häufig als „clinical override“ diskutierten Korrekturprozedur vor. Dabei handelt es sich um eine nachträgliche Anpassung eines mit einem standardisierten Prognoseinstrument ermittelten Risikolevels, die in einigen Instrumenten vorgesehen ist (z. B. in den LS-Instrumenten). Dieses zumeist klinisch-intuitive Vorgehen (1. Generation) führt allerdings zu keiner Verbesserung, sondern eher zu einer Verschlechterung der Prognosegüte von Prognoseinstrumenten (z. B. Hanson und Morton-Bourgon
2009; Orton et al.
2021). Ein weiterer Vorschlag betrifft die kombinierte Anwendung von standardisierten und strukturiert-professionellen Einschätzungen (Singer et al.
2017). In einer neueren Studie wurde eine Verbesserung der Vorhersagegenauigkeit durch die Kombination von standardisierten Instrumenten und SPJ-Instrumenten
6 festgestellt (Wertz et al.
2023). Es sind weitere Untersuchungen erforderlich, um zu überprüfen, ob die Vorhersagegenauigkeit durch die Kombination tatsächlich verbessert werden kann. Mit Blick auf die oben beschriebene klinisch-idiographische Prognose ist schließlich die integrative Beurteilung von Dahle (
2005) zu erwähnen. In der Untersuchung von Dahle und Lehmann (
2018) zeigte die klinisch-idiographische Prognose inkrementelle Validität in Ergänzung zu den untersuchten standardisierten Prognoseinstrumenten (Dahle und Lehmann
2018). Die Ergebnisse sprechen dafür, dass die Integration beider Ansätze einen Zugewinn an Prognosezuverlässigkeit ergeben kann (zumindest, wenn die idiographische Einschätzung einem strukturierten Vorgehen folgt). Für jugendliche und heranwachsende Gewalt- und Sexualstraftäter im Jugendstrafvollzug steht dieser Beleg noch aus und ist Gegenstand der vorliegenden Arbeit.