Validität der Feststellung des Beschäftigungspotenzials anhand von AMS- und HV-Verbleibsdaten

Themenbereiche: Arbeitswelt
Textsorte: Bericht
Releaseinfo: AMS-Report 118: Medieninhaber, Herausgeber und Verleger: Arbeitsmarktservice Österreich, Abt. Arbeitsmarktforschung und Berufsinformation, www.ams-forschungsnetzwerk.at.
Copyright: © Arbeitsmarktservice Österreich 2016

Einleitung

Seit zehn Jahren bietet move-ment im Auftrag des AMS Beratung und Betreuung für arbeitsuchende Personen an. Der Schwerpunkt liegt in der Unterstützung arbeitsuchender Personen 45+ mit Integrationshemmnissen, es werden jedoch auch Projekte für Kurz- und Langzeitarbeitslose unterschiedlichen Alters durchgeführt.

Im Jahre 2005 arbeitete move-ment in Kooperation mit Prof. Dr. Juhani Ilmarinen, Prof. Dr. Rainer Tielsch (Bergische Universität Wuppertal), Prof. Dr. med. Dipl.-Soz. Thomas Elkeles, Dr. Peter Kuhnert, Mag.a Bettina Hooshmandi-Robia und Mag.a Monika Rauscher (move-ment) an der Entwicklung eines Instrumentes zur Messung der Beschäftigungsfähigkeit. 2008 wurde anhand der wissenschaftlichen Vorarbeiten im Rahmen eines Projektes von move-ment die Testbatterie »Beschäftigungspotenzial« für arbeitslose Personen fertiggestellt. Seither befindet sich das Instrument in Verwendung und hat sich in der Praxis als wertvolles Beratungstool bewährt.

Nun stellt sich die Frage der testtheoretischen Güte des Instrumentes und, damit verbunden, der Notwendigkeit und Richtung seiner Weiterentwicklung, um letztlich einen erweiterten Einsatz im Rahmen von AMS-finanzierten Projekten anzuleiten. Die zentrale Frage für die Anwender_innen ist, ob das Instrument tatsächlich jenes psychische Merkmal misst, welches es zu messen behauptet. Wenn das Instrument tatsächlich die Beschäftigungsfähigkeit der Teilnehmer_innen misst, sollte es in der Lage sein, deren Beschäftigungsvolumen in den darauffolgenden ein bis zwei Jahren zumindest teilweise vorherzusagen. Dieser prognostische Wert des Instrumentes kann anhand der prognostischen Validität überprüft werden. In der vorliegenden Studie im Auftrag der Landesgeschäftsstelle des AMS Steiermark, die unter der Federführung des sozialwissenschaftlichen Forschungs- und Beratungsinstitutes abif in Kooperation mit L&R Sozialforschung im Jahr 2015 umgesetzt wurde, wird also untersucht, welchen prognostischen Wert einzelne Testverfahren des Beschäftigungspotenzials und das gesamte Instrument hinsichtlich des Verbleibs von Personen am Arbeitsmarkt bzw. hinsichtlich ihrer beruflichen Wiedereingliederung haben. Dabei wird auf die Personengruppe 45+ abgestellt, die im Rahmen von Maßnahmen des AMS Steiermark von move-ment betreut wurde.

Zusätzlich ist zu beantworten, ob die von move-ment, so u. a. aufgrund des festgestellten Beschäftigungspotenzials, empfohlenen Maßnahmen auch vom AMS umgesetzt werden. Dabei ist auch zu überprüfen, wie sich die Umsetzung der Empfehlungen auf das Beschäftigungsvolumen der Teilnehmer_innen auswirkt.

Die psychologisch diagnostischen Verfahren, die in das Beschäftigungspotenzial einfließen, werden außerdem ganzheitlich anhand ihrer Manuale hinsichtlich ihrer Aktualität und Testgüte beurteilt.

Zusammenfassend wird durch diese Vorgehensweise ermöglicht, die Güte des Instrumentes zur Messung des Beschäftigungspotenzials umfassend darzustellen und einen konkreten Maßnahmenvorschlag zu seiner Weiterentwicklung zu formulieren.

1 Methode

1.1 Untersuchungsgegenstand

In Anlehnung an den Arbeitsbericht von Blancke, Roth und Schmid (2000) definiert move-ment das Beschäftigungspotenzial einer Person als ihre Fähigkeit, ihre Arbeitskraft anbieten zu können, ihre Arbeitsstelle zu halten oder, wenn nötig, sich eine neue Erwerbsbeschäftigung zu suchen.

Das Instrument zur Erfassung des Beschäftigungspotenzials dient daher der Analyse der Ausgangsvoraussetzungen der Teilnehmer_innen sowie der Kompetenz- und Potenzialanalyse. Auf dieser Basis werden anschließend Perspektiven und Lösungswege bei Integrationshemmnissen entwickelt.

Ein Kernstück des Instrumentes stellen sechs standardisierte psychologische Tests dar. Diese umfassen:

  • den »Stressverarbeitungsfragebogen (SVF-78[1], der solche Strategien im Umgang mit Stressoren darstellt, die stressreduzierend wirken (»Positiv-Strategien«, wie Ablenkung von Situationen) und solche, die stressvermehrend wirken (»Negativ-Strategien«, wie z. B. Resignation);

  • die »Skalen zur Erfassung von Hoffnungslosigkeit (H-Skalen)« zur Feststellung, ob die Betroffenen negative Erwartungen über sich selbst, ihre Umwelt und ihr künftiges Leben (»kognitive Triade der Depression«) sowie herabgesetzte Zielvorstellungen haben;

  • das »Freiburger Persönlichkeitsinventar in revidierter Fassung (FPI-R[2] zur Feststellung der Leistungsorientierung, Gehemmtheit, Beanspruchung, Emotionalität und Offenheit der Teilnehmer_innen;

  • das »Leistungsmotivationsinventar (LMI)« als Indikator für das Engagement, die Flexibilität, die Lernbereitschaft, die Selbständigkeit, die Selbstkontrolle, die Furchtlosigkeit und die Beharrlichkeit der Teilnehmer_innen;

  • den »Fragebogen zu Kompetenz- und Kontrollüberzeugungen (FKK)«, im Zuge dessen das generalisierte Selbstkonzept eigener Fähigkeiten dargestellt sowie erfasst wird, inwiefern Ereignisse als Konsequenzen des eigenen Handelns (»internale Kontrollüberzeugung«), des Handelns anderer Personen (»sozial-externale Kontrollüberzeugung«) oder des Zufalls (»fatalistisch-externale Kontrollüberzeugung«) angesehen werden; sowie

  • den »Fragebogen zur Lebensorientierung (SOC-29-Skala)«, in welchem erfasst wird, inwiefern Teilnehmer_innen das Gefühl haben, Situationen und Umstände zu verstehen und bewältigen zu können sowie inwiefern sie diese als sinnhaft betrachten.

Zusätzlich zu den normierten psychologischen Tests wurde den Teilnehmer_innen der »Arbeitsbewältigungsindex (ABI)« vorgegeben, der in den 1980er-Jahren aus dem »Work Ability Index« (WAI) entstanden war. Der ABI gibt den Teilnehmer_innen die Möglichkeit, ihre subjektive Beanspruchung sowie die entsprechenden Beanspruchungsfolgen darzustellen. Auf der Basis von Fragen, die die Arbeitsanforderungen, den Gesundheitszustand und die Leistungsreserven der Teilnehmer_innen betreffen,[3] wird ein Gesamt-Punktewert ermittelt, aufgrund dessen eine kritische, mittelmäßige, gute oder sehr gute Arbeitsbewältigungsfähigkeit konkludiert wird. Je nachdem, wie diese grobe Einschätzung der Arbeitsbewältigungsfähigkeit ausfällt, wird vorgeschlagen, Maßnahmen zur Wiederherstellung, Verbesserung, Unterstützung oder Erhaltung der Arbeitsbewältigungsfähigkeit zu ergreifen. Zusätzlich stehen empirische Beispielwerte zur Verfügung, die, in Ermangelung ausführlicher Normtabellen, aber nur für eine vage Interpretation genutzt werden können. Obwohl der ABI entwickelt wurde, um die Arbeitsbewältigungsfähigkeit von beschäftigten Personen zu messen und etwaigen Handlungsbedarf zum Erhalt deren Arbeitsfähigkeit anzuzeigen, ist es eine gängige Praxis, den ABI auch arbeitsuchenden Personen vorzugeben.

Ferner wurde die psychologische Testung durch nicht-normierte Zusatzfragen danach ergänzt, …

  • wie der_die Klient_in seine_ihre derzeitigen Chancen (in den nächsten Jahren) auf dem Arbeitsmarkt einschätzt und inwiefern er_sie der Meinung ist, dass die Tätigkeiten, die er_sie anbieten kann, derzeit auf dem Arbeitsmarkt gefragt sind;

  • ob er_sie Interesse daran hat, so rasch wie möglich wieder eine Stelle zu finden;

  • wie sich die Arbeitslosigkeit auf die Stimmung und den strukturierten Tagesablauf der Teilnehmer_innen auswirkte;

  • was (Erwerbs-)Arbeit für die Teilnehmer_innen bedeutet und impliziert; sowie

  • inwiefern und in welcher Art in Aus- und Weiterbildungen für die berufliche Zukunft investiert wird.

Zusätzlich werden persönliche Daten betreffend die Lebens-, Ausbildungs- und Arbeitssituation der Teilnehmer_innen erhoben, die helfen, ihr Beschäftigungspotenzial betreffend den gegenwärtigen Arbeitsmarkt besser einzuschätzen.

In Summe produziert das Instrument auf Einzelitemebene rund 400 Variablen. Nach Reduktion auf Scores (Punkte) in den psychologischen Verfahren, beschreiben immer noch rund 50 Variablen eine Person. Alle diese Variablen gemeinsam, inklusive weiterer Beobachtungen aus den persönlichen Gesprächen, stellen das »Beschäftigungspotenzial« einer Person dar. Durch die facettenreiche Auswahl an Testverfahren und Fragen wird angestrebt, das Beschäftigungspotenzial der Teilnehmer_innen ganzheitlich einzuschätzen.

1.2 Fragestellungen

1.2.1 Fragestellung I: Prognostische Validität

Die vorrangig zu beantwortende Fragestellung lautet: Welchen prognostischen Wert haben einzelne Skalen des Beschäftigungspotenzials hinsichtlich des Verbleibs von Personen am Arbeitsmarkt? Diese Frage soll unter Berücksichtigung der Umsetzung von Empfehlungen für AMS -Maßnahmen geklärt werden. Da die prognostische Validität jedoch nur von tatsächlich durchgeführten AMS-Interventionen beeinflusst werden kann, wurden lediglich diese in den Modellberechnungen zur Prognostischen Validität berücksichtigt. Die Fragestellung wird über Regressionsanalysen und ein Strukturgleichungsmodell beantwortet.

1.2.2 Fragestellung II: Weitere Gütekriterien

Ferner interessiert, inwiefern die Skalen des Beschäftigungspotenzials weitere gängige Gütekriterien für standardisierte Verfahren erfüllen. Gemäß dem State-of-the-Art wird hierbei neben den Hauptgütekriterien der Objektivität, Reliabilität und Validität auch die Fairness, Skalierung, Unverfälschbarkeit, Zumutbarkeit und Ökonomie der Verfahren begutachtet.

Die Fragestellung wird über eine umfassende Literaturrecherche in Testmanualen und psychologischen Datenbanken beantwortet. Für die Leistungsmotivation (verwendete Skalen des LMI ) wurde auch eine faktoren- und regressionsanalytische Überprüfung durchgeführt.

1.2.3 Fragestellung III: Umsetzung der move-ment-Empfehlungen

Die dritte Fragestellung, die im Projektverlauf hinzukam, lautete: Werden die von move-ment empfohlenen Maßnahmen vom AMS umgesetzt? Die Fragestellung wird über eine Kreuztabellierung der empfohlenen mit den durchgeführten Maßnahmen durchgeführt. Auf Basis der bestehenden Daten kann jedoch keine Aussage darüber getroffen werden, ob andernfalls keine oder eine Maßnahme außerhalb der AMS-Verantwortung getroffen wurde, wie z. B. das Aufsuchen einer Suchtberatung.

1.3 Datenbasis

Insgesamt 2.046 Personen wurden mit dem Instrument zur Feststellung des Beschäftigungspotenzials in der Steiermark von Mai 2010 bis Anfang September 2013 getestet.[4] Die umfassenden Daten wurden von move-ment bereitgestellt und unter strengster Wahrung der Anonymität mit Längsschnittdaten des Hauptverbandes und des AMS verschnitten. Hierdurch konnten die Ergebnisse des Beschäftigungspotenzials in Beziehung zu den Erwerbskarrieredaten der beiden darauffolgenden Jahre gesetzt werden.

Die finale Stichprobe zur Berechnung umfasste jene n=1.936 Personen im Alter von 45 oder mehr Jahren, deren angegebener Pensionsantritt noch mehr als ein Jahr entfernt lag[5] und deren Daten verwertbar waren.[6] Die Berechnungen zur prognostischen Validität wurden mit einer reduzierten Stichprobe von 1.509 Personen durchgeführt, da nur für diese eine vollständige Zählung der Beschäftigungstage im Beobachtungsjahr (15 bis 27 Monate nach der Testung bei move-ment) möglich war. Für die restlichen Fälle lagen noch keine Hauptverbandsdaten vor, bzw. war noch nicht genug Zeit zwischen der Erhebung des Beschäftigungspotenzials und der Stichprobenziehung vergangen. Die letzten Testungen erfolgten im September 2013, die Verschneidung der Daten im August 2015.

Männer und Frauen schienen in der Stichprobe gleichverteilt. Die Personen befanden sich im Alter von 45 bis 67 Jahren; jedoch war etwa die Hälfte der Teilnehmer_innen bis zu 50 Jahre alt.[7] Das durchschnittliche Alter der Frauen liegt dabei mit 50 Jahren etwas unter dem der Männer mit 52 Jahren. Rund die Hälfte der Personen befindet sich in einer Lebensgemeinschaft oder Ehe. Etwa jede zehnte der Personen weist Migrationshintergrund auf.

1.4 Design

Nach der Erhebung des Beschäftigungspotenzials erfolgen eine Rückmeldung mittels Gutachten inklusive Empfehlung sowie drei bis vier Einzelberatungen innerhalb der darauffolgenden zwei Wochen. Danach erhält das AMS einen zwei- bis dreiseitigen Perspektivenplan mit den wichtigsten Ergebnissen und den Empfehlungen zur Integration in den Arbeitsmarkt.

Die nachfolgende Zeit wurde in dem Studiendesign, das schematisch in Abbildung 1 zu sehen ist, nach theoretischen Überlegungen folgendermaßen strukturiert: In den ersten drei Monaten nach der Testung kommen die Teilnehmer_innen zum Coaching, suchen womöglich Arbeit, erledigen Termine, beginnen manchmal bereits einen Kurs. Üblicherweise werden die ersten drei Monate nach einem Maßnahmenabschluss als »Moratorium« bezeichnet, eine Zeit, in der noch keine Wirkungsmessung einsetzt. Im vorliegenden Studiendesign wird den Personen noch ein weiteres Jahr Zeit gegeben, in dem viele der Personen an Maßnahmen teilnehmen oder auch Arbeit finden. Erst im zweiten darauf folgenden Jahr wird das Beschäftigungsausmaß gemessen, das zur Bestimmung der prognostischen Validität des Instrumentes herangezogen wird. Dadurch wird vermieden, dass die prognostische Validität überschätzt wird: Wenn Personen eine Maßnahme aufgrund ihres kritischen Beschäftigungspotenzials absolvieren, können sie gleichzeitig keine Beschäftigungstage im statistischen Modell produzieren. Das Instrument »Beschäftigungspotenzial« wird also hinsichtlich der langfristigen Prognosefähigkeit von nachhaltiger Beschäftigung untersucht. Da des Weiteren davon ausgegangen werden kann, dass sich Maßnahmen in dem sechszehnmonatigen Interventionszeitraum lediglich neutral oder positiv auf die Beschäftigungsfähigkeit auswirken, keinesfalls aber negativ, kann die prognostische Validität des Instrumentes nur unterschätzt werden. Personen mit kritischem Beschäftigungspotenzial erhalten Maßnahmen zu dessen Erhöhung, was zumindest theoretisch dazu führen wird, dass sie trotz schlechter Prognose mehr Beschäftigungstage im Beobachtungszeitraum erreichen. Um diese Annahme zu überprüfen, wurde ein zusätzliches Modell mit der Berücksichtigung der Teilnahme an AMS-Maßnahmen berechnet.

Abbildung 1. Darstellung der Segmentierung der Zeitlinie

1.Phase: Feststellung des Beschäftiugungspotenzials, 2.Phase: Moratorium,
                     3.Phase: Keine Umsetzung der Empfehlungen als AMS-Maßnahme, 4.Phase: Berechnung
                     des Beschäftigungsvolumens

Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Grundsätzlich basiert das Design vorliegender Studie, wie in Abbildung 2 ersichtlich, daher auf der Annahme eines Zusammenhanges zwischen der unabhängigen Variable des Beschäftigungspotenzials (X) und der abhängigen Variable des Beschäftigungsvolumens (Y). Die Kontrollvariablen »Alter«, »Geschlecht« und »Dauer der bisherigen Arbeitslosigkeit« werden berücksichtigt. Die Kontrollvariablen sind zwar Teil des Instrumentariums »Beschäftigungspotenzial «, werden in dieser Studie aber so bezeichnet, um sie von den psychologischen Skalen abzugrenzen.

Abbildung 2. Prozessmodell der studienrelevanten Variablen

Grafische Darstellung zum darauffolgendemText.

Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Unabhängige Variable (Erklärungsfaktoren): Beschäftigungspotenzial

Das »Beschäftigungspotenzial« als Instrument von move-ment liefert keinen einzelnen Zahlenwert. Es ist vielmehr ein Profil aus verschiedenen Test- und Befragungsergebnissen mit zum Teil auch biographischen Elementen. Von abif wird dies so interpretiert, dass mit verschiedenen Fragestellungen und Verfahren die latente (nicht direkt messbare) Dimension »Beschäftigungspotenzial« festgestellt wird.

Die einzelnen messbaren Elemente, mit denen auf die latente Dimension geschlossen wird, sind die Ergebnisse aus den psychologischen Verfahren und dem Arbeitsbewältigungsindex.

Sie machen einerseits einen erheblichen Aufwand bei der Erfassung notwendig, andererseits wurden die psychologischen Verfahren nicht speziell für Fragestellungen im Arbeitsmarktkontext konzipiert. Daher wird es als wesentlich erachtet, vorrangig diese Test- bzw. Indexwerte als Variablen in ein möglichst vollständiges Modell aufzunehmen.

Hierzu wurden zunächst, wie in Tabelle 9 (siehe Anhang) dokumentiert, die Interkorrelationen zwischen den Testverfahren und, gegebenenfalls, Subskalen überprüft. Wären die systematischen Zusammenhänge zwischen den Bestandteilen des Instrumentes hoch, wären diese als redundant zu interpretieren. Obwohl die Interkorrelationen zum Teil durchaus hoch waren[8], lagen sie durchgehend unter r=0,80. Daher war es akzeptabel, sämtliche (Sub-)Skalen in das Regressionsmodell aufzunehmen. Da ferner ein Residuen-Plot Aufschluss darüber gab, dass eine Normalverteilung der Residuen und keine systematischen Abweichungen vorliegen, erschienen die regressionsanalytischen Modelltests zulässig.

Wenn es aus testtheoretischen Überlegungen (unter Berücksichtigung der Angaben in den Manualen) und / oder der Überprüfung der statistischen Voraussetzungen (Eindimensionalität, Interkorrelationen) heraus zulässig war, einen Gesamtscore über die Items eines Tests zu berechnen, wurde dieser als Variable verwendet; andernfalls wurden die einzelnen Subtestergebnisse herangezogen. Betreffend die Zusatzfragen aus dem von move-ment selbst entwickelten Fragebögen konnten nur wenige Fragen schlussendlich in die Modellberechnungen einfließen, da viele aufgrund zu hoher Interkorrelationen, unklarer Kodierung und systematischen Ausfällen nicht aufgenommen werden konnten.

Teilweise wurden solche Items probeweise aufgenommen, kategorisiert[9] oder dichotom kodiert[10] inkludiert. Doch obwohl regressionsanalytisch festgestellt werden konnte, dass einzelne der Items einen Einfluss auf das Beschäftigungsvolumen im zweiten Jahr nach der Testung hatten,[11] hatten sie keinen Erklärungswert, der über jenen der standardisierten Testverfahren und, insbesondere, des ABI hinausging. Letzterer steht den nicht-normierten Fragen inhaltlich sehr nahe, weshalb eine Ähnlichkeit betreffend die Vorhersagekraft erwartungsgemäß ist.

Abhängige Variable (erklärter Faktor): Relatives Beschäftigungsvolumen

Das relative Beschäftigungsvolumen wurde über die relativen Zeitanteile operationalisiert, die die Teilnehmer_innen im zweiten Jahr nach dem Testzeitpunkt in einer nicht-geringfügigen Beschäftigung am Ersten oder Zweiten Arbeitsmarkt zubrachten.[12] Grundsätzlich wurde die relative Beschäftigungsdauer als der Anteil der Beschäftigungstage an den gültigen Tage definiert; wenn jedoch, etwa im Sterbefall, in weniger als 80 Prozent der Tage ein valider Eintrag in das Versicherungsregister möglich war, wurde der entsprechende Fall ausgeschieden. Die relativen Zeitanteile wurden mit 100 multipliziert. Somit gibt das relative Beschäftigungsvolumen die Prozent der Tage an, die in dem Jahr in Beschäftigung verbracht wurden.

Kontrollvariablen: Geschlecht, Alter, Arbeitslosigkeit

Bei der Berechnung der prognostischen Validität wurden Variablen in das Modell einbezogen, die potenziell einen moderierenden oder mediierenden Effekt auf die Interaktion haben könnten. Konkret wurden Alter, Geschlecht und die Anzahl der Wochen, die die Personen sich bereits in Arbeitslosigkeit befinden, beachtet. Diese sind zwar einerseits Teil des Beschäftigungspotenzials und werden von move-ment erhoben, andererseits sollten zumindest Alter und Dauer der Arbeitslosigkeit das spätere Arbeitsvolumen jedoch zum Teil auch unabhängig vorhersagen. Die Frage ist, welchen zusätzlichen Erklärungswert die psychologischen Verfahren und Befragungen zu diesen erwarteten Effekten haben.

Mediierende Variable: AMS-Intervention

Als mediierende Variable wurde jegliche AMS-Maßnahme, in der Folge oft AMS-Intervention genannt, gezählt. Darunter fallen alle Förderungen im Interventionszeitraum, wie in Tabelle 1 ersichtlich:

Tabelle 1: AMS-Maßnahmen im Interventionszeitraum

AMS-Maßnahmen

Aktivierungsmaßnahmen

Kombilohnförderungen

Berufsorientierungsmaßnahmen

Geförderte Beschäftigung (SÖB, GBP)

Aus- und Weiterbildungen

Kinderbetreuungsbeihilfen

Trainingsangebote

Kurskostenförderungen

BBE-Maßnahmen

Weiterbildungsgeld

Eingliederungsbeihilfen

Teilnahme Arbeitsstiftung

Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Die AMS-Kategorisierung umfasst ferner ÜBA- und IBA-Maßnahmen, die jedoch für die vorliegende Stichprobe keine Relevanz haben. Da keine der Personen an einer solchen teilnahm, finden sie auch im Folgenden keine Erwähnung mehr.



[1] Bei dem Stressverarbeitungsfragebogen SVF-78 handelt es sich um eine Kurzform des Stressverarbeitungsbogens SVF-120. Die Verringerung der Anzahl der Subtests von 20 auf 13, mit jeweils sechs Items, erhöht die Ökonomie und Zumutbarkeit des Tests.

[2] Die aktuell gültigen Fassungen des FPI-R erschienen 2001, und zwar als Weiterentwicklung der Originalfassung des FPI-G aus 1970.

[3] Konkret werden die derzeitige Arbeitsfähigkeit (im Vergleich zur besten je erreichten Arbeitsfähigkeit sowie in Relation zu den Anforderungen der Arbeitstätigkeit), die Anzahl der aktuellen, ärztlich diagnostizieren Krankheiten, die geschätzte Beeinträchtigung der Arbeitsleistung durch die Krankheiten, die Krankenstandstage im vergangenen Jahr, die Einschätzung der eigenen Arbeitsfähigkeit in zwei Jahren und die psychischen Leistungsreserven in Arbeit und Freizeit erfragt.

[4] Die Anamnesetage/ Testtage der Personen liegen konkret zwischen dem 3.5.2010 und dem 9.9.2013.

[5] Die konkrete Frage im move-ment-Fragebogen lautet: »Wie viele Jahre brauchen Sie noch bis zum Pensionsantritt?«

[6] 32 Personen, für die move-ment-Daten vorlagen, konnten in den AMS- oder HV-Daten nicht identifiziert werden.

[7] Konkret liegt der Median des Alters der Teilnehmer_innen bei=51.

[8] So liegt die Interkorrelation der FPI-Skala »Emotionalität« mit den LMI-Skalen »Furchtlosigkeit« und »Beharrlichkeit« sowie jene der FKK-Tertiärskala mit den H-Skalen und mit der LMI-Skala »Furchtlosigkeit« über |r|=0,60. Selbiges gilt für mehrere der LMI-Skalen untereinander.

[9] Der höchste abgeschlossene Bildungsgrad wurde vierstufig kategorisiert.

[10] Konkret wurden die Fragen danach, ob die eigenen Fähigkeiten am Arbeitsmarkt als gefragt und die Erwerbsarbeit als bewältigbar eingeschätzt werden, dichotom kodiert. Ferner wurde als relevant erachtet, ob die Teilnehmer_innen Betreuungs- oder Unterhaltspflichten haben.

[11] Dies wurde in einer multiplen Regressionsanalyse mit dem Beschäftigungsvolumen, operationalisiert über die Anzahl der Tage in Beschäftigung, im zweiten Jahr nach der Testung festgestellt. Das Beschäftigungsvolumen erwies sich, auf einem Signifikanzniveau von=0,01, als signifikant höher, wenn die Teilnehmer_innen die Items »Für mich gibt es derzeit gute Chancen am Arbeitsmarkt.« und »Ich kann die Herausforderungen einer Erwerbsarbeit bewältigen.« bejahten.

[12] Insgesamt waren nur 186 Personen am Zweiten Arbeitsmarkt im Beobachtungsjahr beschäftigt. Sie produzierten durchschnittlich 105 Beschäftigungstage gegenüber allen anderen, die im Durchschnitt 143 Tage arbeiteten. Eine getrennte Berechnung für Ersten und Zweiten Arbeitsmarkt war nicht möglich bzw. nicht zielführend zur Klärung der prognostischen Validität des Instrumentariums.

2 Ergebnisse

2.1 Fragestellung I: Prognostische Validität

Die zentrale Frage, ob das Beschäftigungsvolumen durch die von move-ment erhobenen Daten vorhergesagt werden kann, die Instrumente also prognostische Validität hinsichtlich der Erwerbstätigkeit haben, wird statistisch mithilfe eines multivariaten Regressionsmodells geklärt. Das Ziel dabei war, das vorhandene Datenmaterial so weit wie möglich in die Modelle aufzunehmen, um das »Beschäftigungspotenzial«, so wie es von move-ment erhoben wird, abzubilden. Es ging nicht (wie üblicherweise) darum, ein möglichst einfaches, ökonomisches Modell zu erstellen.

In das Modell (Modellschätzung I), dargestellt in Tabelle 2, wurden sämtliche Skalenwerte der psychologischen Verfahren sowie die Arbeitsbewältigungsindizes aufgenommen, die move-ment zur Verfügung gestellt hat.13[13] Dabei werden bei jenen Inventaren, die vollständig vorgeben wurden, die summierten Testwerte verwendet, beim FKK die Tertiärskala.[14] Beim Stressverarbeitungsfragebogen wurden aus inhaltlichen Gründen nur die Skalen für die positiven Copingstrategien berücksichtigt. Zusätzlich werden die Variablen »Alter«, »Geschlecht« und »Dauer der Arbeitslosigkeit« aufgenommen, um deren Vorhersagekraft zu berücksichtigen bzw. diese zu »kontrollieren«. Grundsätzlich werden in dem multivariaten Regressionsmodell die Erklärungsanteile jeder einzelnen Skala bzw. Kontrollvariable jeweils unter Berücksichtigung jeder anderer Variablen dargestellt. Da dieses Modell ein sehr umfassendes ist, ist der Erklärungsanteil jeder einzelnen Variable erwartungsgemäß gering. Selbiges gilt für die Vorhersagekraft des Gesamtmodells mit R²=0,1668. »Nur« rund 17 Prozent der Varianz werden durch das Gesamtmodell erklärt. Unter Berücksichtigung dessen, dass das Beschäftigungsvolumen von sehr vielen Faktoren, die hier nicht berücksichtigt werden, wie Stellenangebot, Wirtschaftslage etc., beeinflusst wird, ist es durchaus bemerkenswert, dass dieser Wert überhaupt zustande kommt.

Vor allem beachtlich ist, dass eines der Instrumentarien immer einen signifikanten Erklärungsanteil liefert. Auch wenn das Regressionsmodell schrittweise aufgebaut wird und wenn andere psychologische Skalen im Modell weg- oder hinzugenommen werden, liefert der Arbeitsbewältigungsindex (ABI) stabil signifikante Erklärungsanteile für die Beschäftigung.

Tabelle 2: Einflussfaktoren auf das relative Beschäftigungsvolumen im zweiten Jahr (Modellschätzung I)

Modell I

Regressions-koeffizient

Standardfehler

T-Wert

P-Wert

Arbeitsbewältigungsindex***

1,2849

0,1679

7,6520

0,0000

Stressverarbeitung: positiv

0,1249

0,4220

0,2960

0,7673

H-Skalen (Hoffnungslosigkeit)

-0,1869

0,1070

-1,7470

0,0809

SOC Sense of Coherence

0,2416

0,1491

1,6200

0,1054

FKK Tertiärskala

-0,1567

0,0854

-1,8350

0,0667

LMI Engagement

0,1391

0,1229

1,1320

0,2579

LMI Flexibilität

-0,0778

0,1511

-0,5150

0,6069

LMI Lernbereitschaft*

-0,3165

0,1505

-2,1030

0,0357

LMI Selbständigkeit

-0,1732

0,1536

-1,1270

0,2598

LMI Selbstkontrolle*

0,3372

0,1701

1,9830

0,0476

LMI Furchtlosigkeit

-0,1757

0,1365

-1,2880

0,1981

LMI Beharrlichkeit

0,0970

0,1785

0,5430

0,5869

FPI Leistungsorientierung

-0,1454

0,5073

-0,2870

0,7744

FPI Gehemmtheit

0,0974

0,5306

0,1840

0,8543

FPI Beanspruchung

0,0751

0,5100

0,1470

0,8830

FPI Emotionalität

0,1554

0,5943

0,2620

0,7937

FPI Offenheit

0,5351

0,4413

1,2130

0,2255

Alter ***

-2,5495

0,2824

-9,0290

0,0000

Geschlecht männlich

-1,6157

2,2719

-0,7110

0,4771

Arbeitslosigkeit in Wochen ***

-0,0238

0,0072

-3,3040

0,0010

N=1.509 (fehlende Testwerte ergeben ein kleineres n), *für p<0,05, **für p<0,01 bzw. ***p<0,001. Modellpassung multiple R²=0,1668. Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Die Lernbereitschaft[15] und die Selbstkontrolle[16] des LMIhingegen zeigen in dem vollständigen Modell zwar einen signifikanten, zusätzlichen kleinen Erklärungswert (Beta kann wiederum in Testpunkten gelesen werden), allerdings bleibt dieser bei verschiedenen Modellvarianten im schrittweisen Aufbau nicht stabil: Die Wechselwirkungen ändern sich. Daher wird davon abgeraten, auf die Interpretation zu schließen, dass weniger Lernbereitschaft und mehr Selbstkontrolle mit mehr Beschäftigungstagen einhergingen.

Unter Berücksichtigung all dieser Variablen und Wechselwirkungen zeigt sich, dass lediglich der ABI noch zusätzlich zum Alter und zur Dauer der Arbeitslosigkeit – auf einem für die Anzahl von 1.509 Fällen annehmbaren Signifikanzniveau unter einem Prozent – zur Erklärung des Beschäftigungsvolumens beiträgt. Je höher der Arbeitsbewältigungsindex, umso mehr Beschäftigungstage weisen die Personen im zweiten Jahr nach der Testung auf. Da das relative Beschäftigungsvolumen (in Prozent) als abhängige Variable im Modell verwendet wird, lässt dies den Schluss zu, dass nur 1,28 Punkte mehr im Arbeitsbewältigungsindex mit einem Beschäftigungsplus von einem Prozent einhergehen (bei 365 Tagen also 3,65 Tage mehr an Beschäftigung im zweiten Jahr), sofern alle anderen Variablen konstant gehalten werden.

Abbildung 3 illustriert, wie die im ABI gemessene Arbeitsbewältigungskonstellation mit den Tagen in Beschäftigung im zweiten Jahr nach der Testung in Verbindung steht. Die erreichbaren Punktezahlen im ABI reichen von 7, minimale Arbeitsfähigkeit, bis 49, maximale Arbeitsfähigkeit – innerhalb dieser Range implizieren die Scores eine kritische (7–27 ABI-Punkte), mäßige (28–36 ABI-Punkte), gute (37–43 ABI-Punkte) oder sehr gute (44–49 ABI-Punkte) Arbeitsbewältigungskonstellation. Je besser diese nun auf Basis des ABI eingeschätzt wird, desto mehr Tage verbrachten die Teilnehmer_innen im zweiten Jahr nach der Testung durchschnittlich in Beschäftigung.

Abbildung 3. Vorhersagbarkraft ABI auf Tage in Beschäftigung

Balkendiagramm zur Vorhersagbarkeit des Zusammenhanges zwischen
                     Arbeitsbewältigungsindex und Tage in Beschäftigung.

N=1.908.[17] Dargestellt ist die Anzahl der Tage, die im zweiten Jahr nach der Testung durchschnittlich in Beschäftigung verbracht wurden, auf ganze Tage gerundet. Als Durchschnittsmaß wurde das arithmetische Mittel herangezogen. Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Exkurs: Um zu erkennen, ob dieses Ergebnis in Bezug auf den ABI tatsächlich plausibel ist, wurde, wie in Tabelle 3 dargestellt, dasselbe Modell auch für die Vorhersage von Krankenstandstagen herangezogen. Hier wurde, gleich wie beim Beschäftigungsvolumen, berechnet, wie viel Prozent an (validen) Tagen die Personen im zweiten Jahr nach der Testung im Krankenstand verbrachten. Die Ergebnisse scheinen plausibel: Ein niedrigerer Wert im ABI, also ein schlechterer Arbeitsbewältigungsindex, sagt eine höhere Zahl an Krankenstandstagen zwei Jahre später voraus. Dass in diesem Modell auch einige psychologische Skalen bzw. Scores signifikanten Erklärungsanteil haben, ist für die Forschungsfrage nicht weiter relevant, ergibt aber durchaus Sinn: Höhere Hoffnungslosigkeit und schlechtere Selbstkontrolle gehen mit vermehrten Krankenstandstagen im zweiten Jahr nach der Anamnese einher. Die Schlussfolgerung aus diesem Exkurs ist, dass der ABI durchaus plausible Ergebnisse liefert.

Tabelle 3: Einflussfaktoren auf das relative Beschäftigungsvolumen im zweiten Jahr (Modellschätzung II)

Modell II Krankenstandstage

Regressionskoeffizient

Standardfehler

T-Wert

P-Wert

Arbeitsbewältigungsindex***

-0,1589

0,0420

-3,7820

0,0002

Stressverarbeitung: positiv

0,0440

0,1056

0,4160

0,6772

H-Skalen (Hoffnungslosigkeit)*

0,0602

0,0268

2,2480

0,0247

LMI Engagement

0,0361

0,0307

1,1750

0,2401

FKK Tertiärskala

-0,0100

0,0373

-0,2680

0,7887

SOC Sense of Coherence

0,0146

0,0214

0,6850

0,4934

LMI Flexibilität

0,0112

0,0378

0,2970

0,7665

LMI Lernbereitschaft

0,0058

0,0377

0,1550

0,8768

LMI Selbständigkeit

-0,0160

0,0384

-0,4170

0,6766

LMI Selbstkontrolle*

-0,0938

0,0425

-2,2060

0,0276

LMI Furchtlosigkeit

0,0555

0,0341

1,6240

0,1046

LMI Beharrlichkeit

-0,0347

0,0447

-0,7780

0,4366

FPI Leistungsorientierung

0,1813

0,1269

1,4290

0,1533

FPI Gehemmtheit

-0,1085

0,1327

-0,8180

0,4137

FPI Beanspruchung

-0,0019

0,1276

-0,0150

0,9879

FPI Emotionalität

0,0112

0,1487

0,0750

0,9400

FPI Offenheit

-0,1252

0,1104

-1,1340

0,2569

Alter

-0,0298

0,0706

-0,4210

0,6736

Geschlecht männlich

0,7875

0,5684

1,3860

0,1661

Arbeitslosigkeit in Wochen

-0,0008

0,0018

-0,4350

0,6639

N=1.509, *für p<0,05, **für p<0,01 bzw. ***p<0,001. Modellpassung multiple R²=0,04. Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Um zu sehen, ob die psychologischen Verfahren einen Erklärungswert liefern würden, wenn keine ABI -Ergebnisse vorhanden wären, wurde, wie in Tabelle 4 zu erkennen, der ABI aus dem Modell genommen. Es zeigt sich, dass dadurch die Modellpassung schlechter wird. Sie sinkt von 0,1668 auf 0,1311 (multiple R2), was den Wert des ABI für die Vorhersage des Beschäftigungsvolumens unterstreicht. Die Skala für Hoffnungslosigkeit »übernimmt« einen Erklärungsanteil: Je höher die Hoffnungslosigkeit, umso weniger Beschäftigungstage werden im zweiten Jahr erreicht (p<0,01). Zieht man auch jene Verfahren noch in Betracht, die auf einem Signifikanzniveau von p<0,05 Varianz erklären, so scheinen die Kontrollüberzeugungen von Person[18] und die Beharrlichkeit (Leistungsmotivation)[19] eine Rolle zu spielen.

Tabelle 4: Einflussfaktoren auf das relative Beschäftigungsvolumen im zweiten Jahr (Modellschätzung III – ohne ABI)

Modell III ohne ABI

Regressionskoeffizient

Standardfehler

T-Wert

P-Wert

Stressverarbeitung: positiv

0,1893

0,4291

0,4410

0,6591

H-Skalen (Hoffnungslosigkeit)**

-0,2881

0,1079

-2,6700

0,0077

SOC Sense of Coherence

0,2819

0,1511

1,8650

0,0623

FKK Tertiärskala*

-0,1892

0,0866

-2,1830

0,0292

LMI Engagement

0,1639

0,1245

1,3170

0,1882

LMI Flexibilität

-0,0033

0,1529

-0,0220

0,9825

LMI Lernbereitschaft

-0,1998

0,1520

-1,3140

0,1889

LMI Selbständigkeit

-0,2717

0,1557

-1,7450

0,0812

LMI Selbstkontrolle

0,3162

0,1728

1,8300

0,0675

LMI Furchtlosigkeit

-0,2150

0,1387

-1,5500

0,1213

LMI Beharrlichkeit*

0,3823

0,1780

2,1480

0,0319

FPI Leistungsorientierung

-0,2857

0,5162

-0,5530

0,5800

FPI Gehemmtheit

0,2576

0,5394

0,4770

0,6331

FPI Beanspruchung

-0,5525

0,5126

-1,0780

0,2813

FPI Emotionalität

-0,6593

0,5923

-1,1130

0,2659

FPI Offenheit

0,7875

0,4461

1,7650

0,0777

Alter ***

-2,8739

0,2817

-10,2010

0,0000

Geschlecht männlich

-1,3586

2,3062

-0,5890

0,5559

Arbeitslosigkeit in Wochen ***

-0,0269

0,0073

-3,6810

0,0002

N=1.509, *für p<0,05, **für p<0,01 bzw. ***p<0,001. Modellpassung multiple R²=0,1311. Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Zuletzt wird überprüft, ob die prognostische Validität durch die Umsetzung von AMS-Maßnahmen verschlechtert wird, indem die Maßnahmen das Beschäftigungspotenzial und infolge das Beschäftigungsvolumen erhöhen. Dazu wurde Modell I um die Anzahl der Maßnahmen ergänzt, die die Personen im Interventionszeitraum, im ersten Jahr nach der Testung und dem Moratorium, besuchten (Modellschätzung IV).

Die Ergebnisse in Tabelle 5 zeigen, dass sich nichts an der Vorhersagekraft des ABI und der psychologischen Verfahren ändert. Die signifikante Vorhersagekraft des ABI, der LMI -Skalen zu Selbstkontrolle und Lernbereitschaft, des Alters und der Dauer der bisherigen Arbeitslosigkeit bleiben erhalten. Hinsichtlich der Interpretation der Skala »Lernbereitschaft« wird nochmals darauf hingewiesen, dass diese im schrittweisen Modellaufbau im Unterschied zum ABI nicht stabil bleibt.

Insgesamt verbessert sich die Modellpassung durch das Hinzufügen der Interventionsvariable, der Blick auf den Zusammenhang zwischen ABI und Beschäftigungsvolumen wird dadurch nochmals geschärft. Der Arbeitsbewältigungsindex in der von move-ment leicht adaptierten Kurzversion ist prognostisch valide. Dass das Geschlecht in keinem der Modelle signifikante Erklärungsanteile hat, könnte eventuell damit zu tun haben, dass einzelne psychologische Verfahren nicht genderfair messen, wie in dem Kapitel zu den übrigen Gütekriterien dargestellt wird, und die nicht normierten Testwerte für die Modelle verwendet wurden.

Verschiedene andere Erklärungsmöglichkeiten sind ebenfalls denkbar: Selektion am Arbeitsmarkt über den Zeitverlauf, Ausscheiden von Frauen ohne Beschäftigung, tatsächlich kein Einfluss des Geschlechts in dieser Altersgruppe.

Tabelle 5: Einflussfaktoren auf das Beschäftigungsvolumen im zweiten Jahr unter Berücksichtigung von AMS-Maßnahmen (Modellschätzung IV)

Modell IV mit Maßnahme

Regressionskoeffizient

Standardfehler

T-Wert

P-Wert

Arbeitsbewältigungsindex***

1,3572

0,1669

8,1320

0,0000

Stressverarbeitung: positiv

0,1165

0,4181

0,2790

0,7806

H-Skalen (Hoffnungslosigkeit)

-0,1648

0,1061

-1,5530

0,1206

LMI Engagement

0,0959

0,1220

0,7860

0,4320

SOC Sense of Coherence

0,2376

0,1478

1,6080

0,1081

FKK Tertiärskala

-0,1586

0,0846

-1,8750

0,0610

LMI Flexibilität

-0,0729

0,1497

-0,4870

0,6263

LMI Lernbereitschaft*

-0,2652

0,1494

-1,7750

0,0761

LMI Selbständigkeit

-0,2023

0,1523

-1,3280

0,1843

LMI Selbstkontrolle*

0,3414

0,1685

2,0260

0,0429

LMI Furchtlosigkeit

-0,1978

0,1353

-1,4620

0,1441

LMI Beharrlichkeit

0,1280

0,1769

0,7230

0,4696

FPI Leistungsorientierung

-0,1581

0,5026

-0,3150

0,7532

FPI Gehemmtheit

0,1748

0,5259

0,3320

0,7396

FPI Beanspruchung

0,0373

0,5053

0,0740

0,9412

FPI Emotionalität

0,1891

0,5889

0,3210

0,7481

FPI Offenheit

0,6360

0,4376

1,4530

0,1463

Alter***

-2,5912

0,2799

-9,2580

0,0000

Geschlecht männlich

-1,4952

2,2510

-0,6640

0,5067

Arbeitslosigkeit in Wochen ***

-0,0235

0,0071

-3,3040

0,0010

Anzahl der AMS-Maßnahmen im ersten Jahr***

-4,4193

0,8228

-5,3710

0,0000

N=1.509, *für p<0,05, **für p<0,01 bzw. ***p<0,001. Modellpassung multiple R²=0,1826 (zum Vergleich mit Modell 1: adjusted R²=0,1711). Auch wenn die AMS-Maßnahmen dichotom kodiert werden (hat stattgefunden/ hat nicht stattgefunden) ändert dies nichts in den Signifikanzen. Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Bisher konnte für den ABI als Teil des Instrumentariums »Beschäftigungspotenzial« eine prognostische Validität in Bezug auf das spätere, tatsächliche Beschäftigungsausmaß gefunden werden. Das Alter, die Umsetzung von AMS-Maßnahmen und die erhobenen Wochen an Arbeitslosigkeit vor dem Eintritt bei move-ment sagen ebenfalls teilweise das Beschäftigungsvolumen vorher. Für die restlichen psychologischen Verfahren im Einzelnen ist eine prognostische Validität hinsichtlich des Beschäftigungsvolumens nicht eindeutig erkennbar. Da aber das Gesamtverfahren, inklusive aller Testungen, das »Beschäftigungspotenzial« beschreibt, wird im Folgenden für das Gesamtverfahren die prognostische Validität (unter Berücksichtigung der erklärenden Faktoren Alter, Geschlecht und Dauer der Arbeitslosigkeit) geschätzt.

2.1.1 Prognostische Validität des latenten Konstruktes »Beschäftigungspotenzial«

Da das Beschäftigungspotenzial mit zahlreichen Variablen und Instrumenten erfasst wird, stellt sich die Frage, ob ein latentes Konstrukt »(Psychische) Beschäftigungsfähigkeit« existiert und die Testskalen unterschiedliche Facetten des Konstrukts erfassen, ohne dabei austauschbar zu sein.

Als erster Schritt zur Analyse wird überprüft, ob die einzelnen Skalen miteinander korrelieren. Die Interkorrelationsmatrix der Testverfahren und Subskalen des Beschäftigungspotenzials in Tabelle 9 (siehe Anhang) zeigt durchaus Zusammenhänge zwischen den Verfahren. Dies weist bereits darauf hin, dass die Verfahren ähnliche Konstrukte messen.

Als zweiter Schritt wird mittels Fakten- und Hauptkomponentenanalyse überprüft, wie viele dahinterliegende Faktoren es gibt, auf wie viele unterschiedliche Faktoren die Daten also reduziert werden können. Es stellt sich heraus, dass fast eine einfaktorielle Lösung erreicht wird. Dieses Ergebnis ist insofern überraschend, da die psychologischen Skalen durchaus Unterschiedliches erheben.

Die Abbildung 4 zeigt zwar, dass bei der Faktorenanalyse das Eigenwertkriterium »kleiner als 1« nicht ganz erreicht wurde. Es liegt jedoch nahe, dass bei einer gezielten Konstruktion bzw. Zusammensetzung der Erhebungsinstrumente vermutlich leicht eine tatsächlich einfaktorielle Lösung erzielt werden könnte (was nicht Forschungsgegenstand der Studie war.) Eine einfaktorielle Lösung bedeutet, dass die Varianzen auf einen latenten Faktor zurückführbar sind, der grob als (psychische) Beschäftigungsfähigkeit der Teilnehmer_innen umschrieben werden kann.

Abbildung 4. Eigenwert der Faktorenanalyse aller Skalen- und Indexwerte

Kurve zur Faktorenanalyse.

N=1.826. Explorative Faktorenanalyse nach Hauptkomponentenmethode. Alle Werte der psychologischen Verfahren und des ABI wurden einbezogen. Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

In einem dritten Schritt wurde versucht, die Daten in einem Strukturgleichungsmodell abzubilden, in dem auch die Variablen »Alter«, »Geschlecht« und »Dauer der Arbeitslosigkeit« und das Beschäftigungsvolumen aufgenommen werden. Hypothetischen Überlegungen nach könnte es so sein, dass die psychologischen Tests und der ABI eine latente Dimension »Beschäftigungsfähigkeit« abbilden, die wiederum in einem bestimmten Ausmaß das Beschäftigungsvolumen erklären kann. (Im Unterschied dazu: Bei den Regressionsmodellen wurde direkt von jedem einzelnen Score/Testkennwert auf die Beschäftigungsfähigkeit geschlossen.) Den höchsten Model-Fit wies dabei das in Abbildung 5 dargestellte Modell auf.

Abbildung 5. Strukturgleichungsmodell "Beschäftigungsfähigkeit"

Grafische Darstellung des Strukturgleichungsmodell
                        "Beschäftigungsfähigkeit".

N=1.509. Dargestellt sind die Regressionskoeffizienten. Das lineare Strukturgleichungsmodell besteht aus erstens einer konfirmatorischen Faktorenanalyse, in der hinter den manifesten, empirischen Beobachtungen der LMI-Skalen der latente Faktor der Leistungsmotivation festgestellt wurde; zweitens einer konfirmatorischen Faktorenanalyse, in der hinter den manifesten, empirischen Beobachtungen der Testverfahren des Beschäftigungspotenzials der latente Faktor der Beschäftigungsfähigkeit festgestellt wurde; und drittens einer Regressionsanalyse der Beschäftigungsfähigkeit und der moderierenden Variablen »Alter«, »Geschlecht« und »Dauer der Arbeitslosigkeit« auf die abhängige Variable des Beschäftigungsvolumens. Quelle: abif / L&R 2015/2016, im Auftrag des AMS Steiermark

Da nicht alle Skalen des Leistungsmotivationsinventars LMI vorgegeben wurden, musste überprüft werden, ob Leistungsmotivation als eine Dimension gesehen werden kann. Die faktorenanalytische Überprüfung ergab, dass auch bei dieser gekürzten Version des LMI eine eindimensionale Lösung (im aktuellen Datensatz) vorliegt. Während daher die Skalen »Engagement«, »Flexibilität«, »Lernbereitschaft«, »Selbständigkeit«, »Selbstkontrolle«, »Furchtlosigkeit« und »Beharrlichkeit« des LMI die latente Dimension »Leistungsmotivation« bilden, sind die verschiedenen FPI-R-Skalen als faktoriell unterschiedlich anzusehen und gingen daher einzeln in das Modell ein. Zusätzlich wurden erneut der SOC-Gesamtwert, die Positiv-Strategien des SVF-78 , die FKK-Tertiärskala und der ABI -Gesamtwert inkludiert.[20] Diese bilden gemeinsam, wie faktorenanalytisch festgestellt werden kann, die latente Dimension der »(psychischen) Beschäftigungsfähigkeit« bzw. des Beschäftigungspotenzials ab.

Die (psychische) Beschäftigungsfähigkeit wiederum sagt teilweise, gemeinsam mit dem Alter und dem Geschlecht der Teilnehmer_innen sowie der bisherigen Dauer ihrer Arbeitslosigkeit, das relative Beschäftigungsvolumen voraus (s. o.). So erweist sich das Beschäftigungsvolumen als tendenziell höher, wenn die Teilnehmer_innen jünger und weiblich sind, die Dauer ihrer bisherigen Arbeitslosigkeit geringer ist und ihr Beschäftigungspotenzial hoch ist.

2.2 Fragestellung II: Weitere Gütekriterien

Die Validität eines Instrumentes stellt dar, inwiefern dieses erfasst, was es zu erfassen vorgibt, und wird daher als das wichtigste Testgütekriterium beschrieben. Daneben jedoch wurden andere Haupt- und Nebengütekriterien definiert, die beeinflussen, inwiefern die Verwendung eines Instrumentes angemessen ist und zu akkuraten Ergebnissen führt.

Die essenziellsten dieser Kriterien, namentlich Objektivität, Reliabilität, Fairness, Skalierung, Verfälschbarkeit, Ökonomie und Zumutbarkeit, werden im Folgenden betreffend die verschiedenen Bestandteile des Instrumentes zur Erfassung des Beschäftigungspotenzials diskutiert. Zusätzlich wird die in der vorliegenden Studie zentrale Berechnung der prognostischen Validität durch die Darstellung weiterer Facetten des Validitätskonzeptes ergänzt. Die dargestellten Angaben und Kennwerte entspringen dabei, sofern nicht anders angegeben, den aktuellen Testmanualen der jeweiligen Verfahren.

Betreffend die nicht-normierten Fragen wurden bisher keine Gütekriterien quantifiziert. Aufgrund der inhaltlichen Nähe zum ABI ist aber davon auszugehen, dass die Kennwerte des standardisierten und teil-normierten ABI die Obergrenzen für die Kennwerte der nicht-normierten Fragen darstellen.

Während die psychologischen Tests dabei häufig einzeln betrachtet werden, ist zu beachten, dass die Güte des gesamten Instrumentes von der Güte jedes einzelnen Bestandteils beeinflusst wird.

2.2.1 Objektivität

Objektivität meint die Unabhängigkeit der Testwerte der Teilnehmer_innen von den Testleiter_innen.[21] Durchführung, Auswertung und Interpretation eines Instrumentes müssen also unbeeinflusst durch die individuelle Person des Testleiters oder der Testleiterin bleiben.

Den Ansprüchen für standardisierte, psychologische Persönlichkeitsfragebögen folgend enthalten FPI-R, LMI, FKK, SOC, SVF-78 und die H-Skalen exakte Instruktionen für die Durchführung der Tests. Durch leicht verständliche Angaben zum Ausfüllen der Fragebögen wird zudem die Wahrscheinlichkeit von Nachfragen durch die Teilnehmer_innen, was unstandardisiertes Reagieren der Testleiter_innen erforderlich machen würde, minimiert. Um die (Durchführungs-)Objektivität zusätzlich zu erhöhen, ist zudem eine computerunterstützte Umsetzung möglich.

Ferner stehen eindeutige Auswertungsregeln sowie Normen zum Vergleich bzw. zur Interpretation der resultierenden Testwerte zur Verfügung. Die Gefahr von Übertragungsfehlern kann, trotz der insgesamt sehr großen Itemzahl, als vernachlässigbar angesehen werden. Betreffend dem SVF-78 ist zudem zu beachten, dass zu seiner Interpretation lediglich die Normtabellen des SVF-120 vorliegen, wobei nie überprüft wurde, ob die Kennwerteverteilung in den beiden SVF-Versionen voneinander abweicht.[22]

Grundsätzlich leicht eingeschränkt ist zudem die Objektivität des ABI, da die Instruktionen zur Testvorgabe lückenhaft sind[23]. Das Testleiter_innenverhalten und die situativen Bedingungen können daher variieren und das Antwortverhalten der Teilnehmer_innen beeinflussen. move-ment begegnet dem durch eigene, in Form von mind-maps verschriftlichten Testleiter_inneninstruktionen. Da zudem die adäquate Interpretation der Ergebnisse (arbeits-)medizinisches Vorwissen erfordert, kann nur dann von weitgehender Objektivität ausgegangen werden, wenn der ABI von Personen mit ärztlicher Erfahrung durchgeführt, ausgewertet und/ oder interpretiert wird. Dies gilt insbesondere, da dem Test keine standardisierten Normtabellen geeigneter Vergleichsstichproben zur Veranschaulichung der Testwerte beiliegen. Jedoch wird versucht, die Interpretation der Ergebnisse durch anschauliche Darstellungen dessen, was die Antworten bedeuten können, zu erleichtern.

Die dargestellten Einwände gelten selbstredend auch für die nicht-normierten Fragen zur eigenen Einschätzung der Beschäftigungsfähigkeit der Teilnehmer_innen.[24] Auch hier fehlen unmissverständliche Hinweise zur Durchführung, Auswertung und Interpretation möglicher Antworten.

Mit Vorsicht betrachtet sollte ferner die FPI-R-Skala »Offenheit« werden, die, da sie mittelbar ebenso wie unmittelbar von der tatsächlichen Offenheit der Teilnehmer_innen abhängig ist, nur uneindeutig zu interpretieren ist.

Die leicht eingeschränkte Objektivität des ABI, der nicht-normierten Fragen und der FPI-R-Skala »Offenheit« ist bei der Beurteilung der Gütekriterien der Tests und der Testbatterie zu beachten, da die Höhe der Reliabilität und, in weiterer Folge, der Validität eines Tests stets von jener der Objektivität abhängt.

Die (Durchführungs-)Objektivität des gesamten Instrumentes wird nicht zuletzt auch davon beeinflusst, wann, in welcher Reihenfolge und in welchem Kontext die einzelnen Testverfahren vorgegeben werden. Der Wunsch nach einer standardisierten Vorgabe der sieben einzelnen Verfahren ist jedoch gegen die Vorteile der Flexibilität im Beratungskontext abzuwägen.

2.2.2 Reliabilität

Die Reliabilität beschreibt die Zuverlässigkeit und Messgenauigkeit eines Instrumentes.[25] Sie wird als gewährleistet angenommen, wenn die Testergebnisse zu späterer Zeit (»Stabilität«) wiederholbar sind. Zudem sollen die Items einer Skala das gleiche Konstrukt messen (»Interne Konsistenz«, »Split-Half-Reliabilität«, »Paralleltest-Reliabilität«), während die Testskalen unabhängig voneinander interpretierbar sein sollen (»Profilreliabilität«).

Die Angaben zu mehreren der in den Tests erfassten Konstrukte sind situationsabhängig und veränderungssensitiv, weshalb die Berechnung der Stabilität der Testwerte vorwiegend über kurze Zeiträume hinweg sinnvoll ist. Über kurze Perioden von zwei bis vier Wochen zeigten der WAI, der dem ABIzugrunde liegt, und die H-Skalen[26] akzeptable Retest-Reliabilitäten.[27] Über mehrere Monate und sogar Jahre hinweg annähernd stabil erwiesen sich insbesondere der SOC-29[28] sowie ferner der LMI,[29] der FKK[30] und das FPI-R .[31] Die Stabilität des SVF-78 wird, in Anlehnung an die Retest-Reliabilitäten des äquivalenten Fragebogens für Kinder und Jugendliche (SVF-KJ), als akzeptabel angenommen, während für die verwendete Version des SVF-78 die Berechnung der Retest-Reliabilität ausständig ist.

Zu beachten ist, dass einige der Fragebögen, etwa der SVF-78, vergleichsweise kurz ausfallen, was Gedächtnis- und Lerneffekte erleichtert. Das konsistente Antwortverhalten könnte zum Teil also auch hierauf zurückgeführt werden.

Die interne Konsistenz eines Instrumentes, gemessen über Cronbachs α, gibt hingegen an, wie sehr die einzelnen Items eines Tests miteinander zusammenhängen. Insgesamt befinden sich die meisten internen Konsistenzen der Tests und Subtests über α=0,8, viele sogar über dem weniger liberalen Kriterium von α=0,9. Dies gilt, wenn überprüft, sowohl für männliche als auch für weibliche Teilnehmer_innen.

Die Spannbreite der internen Konsistenzen des SVF-78 liegt dabei zwischen α=0,77 und α=0,94, die der FPI-R-Skalen zwischen α=0,73 und α=0,83. Der Gesamtwert der H-Skalen weist eine interne Konsistenz von α=0,92 auf, während der LMI-Gesamtwert mit α=0,89 gleichfalls höchst konsistent ist. Ebenso liegen die internen Konsistenzen der Langform sowie der Kurzformen des SOC-29 durchgehend über α=0,8, betreffend die Langform sogar über α=0,91.

Während für den deutschsprachigen ABI, der sich aus dem WAI abgeleitet hat, keine Reliabilitätsberechnungen dokumentiert sind, werden betreffend den WAI in verschiedenen Studien akzeptable interne Konsistenzen im Bereich von α=0,72 bis α=0,83 angegeben[32]. Diese bestehen länder- und sprachübergreifend und wurden auch für den deutschsprachigen Bereich bestätigt.

Kritischer ist der FKK einzuschätzen, für den unterschiedliche Studien zur internen Konsistenz vorliegen. Die Ergebnisse dieser schwanken stark; es werden Kennwerte von α=0,65 bis α=0,90 angegeben. Dass die Items der vier Subskalen hier jeweils das gleiche Konstrukt messen, scheint also unzureichend gesichert zu sein. Als problematisch sind darüber hinaus nur wenige Subtests der Bestandteile des Instrumentes zu betrachten, so etwa die SVF-78-Skalen zu Situationskontrolle und Ablenkung, sowie mehrere Subskalen des LMI, die im Extremfall eine interne Konsistenz von nur α=0,68 aufweisen.

Analog zu den internen Konsistenzen können Split-Half-Reliabilitäten über die Testhalbierungsmethode berechnet werden. Hierbei wird überprüft, inwiefern die beiden Hälften eines Tests zusammenhängen, indem zwei vergleichbaren Stichproben jeweils nur das halbierte Instrument vorgegeben wird.

Nicht für alle der psychologischen Tests wurden bereits Split-Half-Reliabilitäten berechnet. Ausständig sind diese noch für den ABI bzw. den WAI.

Der SVF-78, der LMI, der SOC-29 und die H-Skalen erreichen auch hier durchgehend Werte von r>0,8. Die Split-Half-Reliabilitäten des SVF-78 etwa weisen Werte von bis zu r=0,95 auf, wobei der Subtest mit der niedrigsten Reliabilität immer noch r=0,74 erreicht. Der Gesamtwert der H-Skalen zeigt eine Split-Half-Reliabilität von r=0,85, der LMI-Gesamtwert eine solche von r=0,94 und der SOC-29 eine solche von r=0,9.

Problematisch hingegen erscheinen FKK und FPI-R. Die Split-Half-Reliabilitäten der FKK-Subtests übersteigen nur selten |r|=0,8. Der niedrigste Wert liegt gar bei r=0,63. Für den neueren FPI-R liegen keine Split-Half-Reliabilitäten vor. Betreffend den FPI-G von 1970, aus dem der FPI-R entstanden war, sind aber bereits Split-Half-Reliabilitäten festgestellt worden, die zum Teil sehr niedrig erschienen. Insbesondere erwies sich die Skala »Offenheit« als kritisch, die regelmäßig Split-Half-Reliabilitäten von r<0,7 zeigte.

Darüber hinaus kann die Genauigkeit eines Tests über die Paralleltestreliabilität beschrieben werden. Hierbei füllen die Teilnehmer_innen zwei Parallelformen eines Tests oder zwei verschiedene Tests, die sehr ähnliche Konstrukte messen, aus, woraufhin die Ergebnisse auf systematische Zusammenhänge überprüft werden. Die Paralleltestreliabilität beträgt für den Gesamtwert der H-Skalen r=0,89 und wurde für sämtliche anderen Testverfahren des Instrumentes bisher nicht berechnet.

Um Profil- bzw. Differenzenreliabilität sicherzustellen, ist außerdem eine möglichst niedrige Interkorrelation zwischen den einzelnen Skalen erforderlich. Nur dann können die Skalen getrennt voneinander interpretiert werden.

Die Interkorrelationen der LMI-Skalen streuen in der vorliegenden Studie über die Range von r=0,14 (Engagement gegen Furchtlosigkeit) bis r=0,70 (Furchtlosigkeit gegen Beharrlichkeit), sind überwiegend jedoch akzeptabel.

Mehrere der Interkorrelationen der Subtests des SVF-78 liegen hingegen über r=0,5.

Auch beim FPI-R bestehen deutliche Interkorrelationen zwischen verschiedenen Skalen, die aber insgesamt geringer ausfallen als in der älteren Version des FPI-G. Die gemeinsame Varianz zweier Skalen beträgt im FPI-R maximal 20 Prozent (Erregbarkeit gegen Aggressivität). In der vorliegenden Studie reicht die Range der Beträge der Interkorrelationen von |r|=0,03 (Leistungsorientierung gegen Offenheit) bis |r|=0,74 (Beanspruchung gegen Emotionalität). Insbesondere die Interkorrelationen der Emotionalitäts-Skala mit sämtlichen anderen Skalen sind als kritisch anzusehen.

Auch die Items aus den vier Primärskalen des FKK zeigen oftmals Interkorrelationen, die über |r|=0,5 liegen. Der höchste Zusammenhang besteht zwischen der Skala der sozialen und jener der fatalistischen Externalität (r=0,57). Da aber keine Interkorrelationen zwischen internalistischen und externalistischen Konzepten besteht, kann inhaltlich auf eine akzeptable Profilreliabilität geschlossen werden.

Hierauf aufbauend wurde auch überprüft, inwiefern die Testverfahren, aus denen das Instrument zur Messung der Beschäftigungsfähigkeit besteht, interkorrelieren. Starke Zusammenhänge würden bedeuten, dass die entsprechenden Testskalen austauschbar und redundant sind. Die Interkorrelationen der Skalen des LMI und des FPI-R miteinander sowie mit dem ABI-Gesamtwert, den Positiv-Strategien der Stressverarbeitungsweisen, der Hoffnungslosigkeitsskala, der Testung zum Kohärenzgefühl und der FKK-Skalen lagen nur selten über |r|=0,6.

Insgesamt erweisen sich die Tests als stabil und reliabel, obwohl FKK , LMIund FPI-R immer wieder durch eine geringe interne Konsistenz auffallen.

2.2.3 Validität

Die Validität eines Tests beschreibt seine Eigenschaft zu messen, was er zu messen vorgibt (»Gültigkeit«). Dies kann »nach Augenschein« überprüft werden, aber auch indem ein Außenkriterium zum Vergleich herangezogen oder das der Testlogik zugrundeliegende Konstrukt überprüft wird.

Die gängigste Möglichkeit, die Validität eines Instrumentes zu überprüfen, ist, ein geeignetes Außenkriterium zu wählen (»Kriterienvalidität«). Wenn theoriegeleitet festgelegt werden kann, womit die Testwerte in Gegenwart oder Zukunft (nicht) zusammenhängen sollten, kann die Gültigkeit des Konzepts über dessen Zusammenhang mit der Varianz der Außenkriterien quantifiziert werden. Hierfür muss selbstredend ein Kriterium gewählt werden, das beobachtbar und messbar ist.

Kern der vorliegenden Studie war die Feststellung der prognostischen Validität des Instrumentes, die eine Variante einer solchen Kriterienvalidität darstellt, bei der die Testwerte eine zukünftige Maßzahl (i. d. F. das Beschäftigungsvolumen) vorherzusagen versuchen. Die prognostische Validität des Instrumentes erwies sich dabei als grundsätzlich gegeben. Betreffend die Einzelverfahren zeichnete sich ab, dass insbesondere die prognostische Validität des ABI sowohl in der Vergangenheit als auch in der vorliegenden Studie hoch gewesen war. Bereits in den früheren Studien zeigte sich, dass der WAI, der dem ABI zugrundeliegt, vorzeitigen Berufsausstieg, den Gedanken an einen Berufsausstieg und längere Perioden der Arbeitsunfähigkeit vorhersagen kann.[33]

Eine Variante der Kriterienvalidität stellt die Übereinstimmungsvalidität bzw. diagnostische Validität dar. Hierbei wird ein Außenkriterium gewählt, das gegenwärtig besteht und messbar ist. Insbesondere betreffend instabile Konstrukte ist die Übereinstimmungsvalidität eine die prognostische Validität ergänzende Möglichkeit des Erkenntnisgewinns.

So spricht es für die Validität des ABI, dass Teilnehmer_innen, die laut dem ABI bzw. dem WAI eine hohe individuelle Arbeitsfähigkeit aufweisen, auch eher physische und psychische Gesundheit sowie Arbeitszufriedenheit angeben und seltener Stress oder Depressivität empfinden[34]. Der ABI ist grundsätzlich für Personen in Arbeit konstruiert und der ermittelte Punktwert stellt das Verhältnis von aktueller Leistungsfähigkeit zu gestellter Arbeitsanforderung dar. Daher ist der Einsatz des ABI bei arbeitsuchenden Personen nicht zulässig. Allerdings hat move-ment die Kurzversion des ABI leicht adaptiert, sodass Fragen nicht mehr hinsichtlich der konkreten, aktuellen Arbeitssituation sondern allgemein hinsichtlich »einer Arbeit« gestellt werden. Das adaptierte Instrument wurde nach mündlicher Auskunft von move-ment mehrfach überprüft und mit dem Entwicklerteam des ABI abgesprochen.

In vergleichbarer Weise bestehen theoriekonforme Zusammenhänge der FPI-R-Testwerte mit der beruflichen Situation, der Lebenssituation, dem Gesundheitszustand, dem Gesundheitsverhalten, dem Berufsstatus und der beruflichen Belastung der Teilnehmer_innen.

Die H-Skalen hingegen weisen zu erwartende Zusammenhänge mit klinischen und Persönlichkeitsmerkmalen sowie mit entwicklungsbezogenen Korrelaten auf. Hoffnungslose Personen zeigen eher Anzeichen von Depressivität und Suizidalität, geringere Lebenszufriedenheit, größere Belastung, mehr kritische Lebensereignisse und pessimistischere Zukunftsaussichten. Nicht zuletzt beeinflussen hohe Werte auf den H-Skalen alltagsnahe Verhaltenstendenzen, hängen sie doch mit einer geringeren Behandlungsbereitschaft von Alkoholiker_innen, mit einer verminderten Anzahl der Alltagsaktivitäten und mit seltenerem politischen oder sozialen Engagement zusammen.

Auch die Zusammenhänge des LMI-Gesamtwertes mit Bildungsabschlüssen, Noten, den Motiven bei der Bildungswahl, der Leistungszufriedenheit und -erwartung, dem Jahreseinkommen, der Statusorientierung der Befragten, der Wochenarbeitszeit, der Stellung in der Hierarchie und den Einstellungen gegenüber Schule und Bildung entsprechen den Erwartungen. Ferner geht hohe Leistungsmotivation mit der Teilnahme an Wettbewerben, einer größeren Menge der Hobbies und einer höheren Anzahl an wahrgenommenen Funktionen, so z. B. in Vereinen, einher.

Personen mit externaler Kontrollüberzeugung gemäß FKK zeigen häufiger Hinweise auf Depressivität und starke Schüchternheit. Hingegen zeigen Proband_innen mit internaler Kontrollüberzeugung und positivem Selbstkonzept optimistischere Zukunftsaussichten und höhere Lebenszufriedenheit und erweisen sich in unterschiedlicher Hinsicht als (politisch) aktiver.

Während ursprünglich davon ausgegangen war, dass das Kohärenzgefühl, gemessen über den SOC-29, mit der körperlichen Gesundheit von Personen zusammenhängt, weist die heutige Kenntnislage darauf hin, dass es sehr viel eher mit der psychischen Gesundheit korreliert. Aufgrund des gegenwärtigen Forschungsstandes ist dieser Zusammenhang unmittelbar einsichtig; dass er bei der Konzeption des SOC-29 nicht berücksichtigt wurde, wird jedoch oftmals kritisiert.

Für den SVF-78 ist die Quantifizierung der so zentralen Übereinstimmungsvalidität noch ausständig.

Versuche, die Änderungssensitivität der Testverfahren für Effekte psychologischer Interventionen festzustellen, können zusätzlich Hinweise darauf liefern, dass die Tests gemessen haben, wogegen letztlich therapeutisch vorgegangen wurde. Dass die H-Skalen, trotz prinzipiell bestehender Stabilität, negativ auf eine therapeutische Intervention reagierten, zeugt daher von der Zuverlässigkeit der Daten. Selbiges gilt für den FKK, dessen Werte durch autogenes Training ebenso wie durch die Therapie depressiver Störungen verbessert werden können. In Anlehnung an den SVF-KJ für Kinder und Jugendliche ist auch betreffend den SVF-78 für Erwachsene von Änderungssensitivität nach therapeutischen Interventionen auszugehen.

Eine weitere Variante, die Kriterienvalidität abzuschätzen, stellt die Berechnung der differenziellen Validität dar. Hypothesengeleitet werden hierbei Personengruppen verglichen, von denen anzunehmen ist, dass sie sich hinsichtlich der Testwerte unterscheiden.

Der ABI wurde in Anlehnung auf den WAIentwickelt, welcher wiederum external konstruiert wurde. Da die Items also demnach ausgewählt wurden, inwiefern sie zwischen den Personengruppen mit unterschiedlich hohem Beschäftigungsvolumen diskriminieren konnten, erfüllt der ABI automatisch das Kriterium, dass Personen mit geringerer Fähigkeit zur Arbeitsbewältigung geringere Scores erreichen.

Ferner unterscheiden sich die FPI-R-Testwerte theoriekonform zwischen Personengruppen, die aufgrund von klinisch-psychologischen, beruflichen und anderen psychosozialen sowie soziodemographischen Merkmalen gebildet wurden. So wird etwa die höchste Lebenszufriedenheit von verheirateten, berufstätigen oder pensionierten Personen angegeben, während die meisten körperlichen Beschwerden von alleinstehenden Hausfrauen sowie von Pensionist_innen berichtet werden.

In ähnlicher Weise konnte gezeigt werden, dass klinische Gruppen deutlich höhere Werte auf den H-Skalen aufweisen als nicht-klinische Gruppen. Insbesondere gilt dies für suizidale und depressive Personen sowie Alkoholiker_innen. Generell konnte unter (nicht nur) psychiatrischen Krankenhauspatient_innen größere Hoffnungslosigkeit festgestellt werden.

Der FKK ist ebenfalls dazu in der Lage, zwischen verschiedenen Personengruppen zu unterscheiden. Dies gilt etwa entlang von Differenzierungsmerkmalen betreffend die berufliche Situation und den Arbeitsplatz der Personen, etwa hinsichtlich unterschiedlicher Strukturiertheit und Beeinflussbarkeit der Arbeitsabläufe. Stärker noch differenziert der FKK zwischen klinischen Gruppen. Insbesondere Personen mit Sucht- und depressiven Erkrankungen weisen auffällige FKK-Profile mit hoher Externalität auf. Ebenso zeigen Häftlinge mit einiger Regelmäßigkeit ein spezifisches FKK-Profil, das ebenfalls vor allem auf hohe Gefühle (fatalistischer) Externalität hinweist.

Zwischen klinischen Gruppen zu unterscheiden vermag auch der SOC-29. Personen, die innerhalb der zwölf Monate vor der SOC-29-Testung eine psychiatrische Diagnose erfüllten, weisen im Vergleich das niedrigste Kohärenzgefühl auf; Personen, die noch nie eine solche Diagnose erfüllten, das höchste[35]. Jedoch stellte sich heraus, dass der SOC-29 wenig dazu geeignet ist, zwischen Personen mit und ohne körperlichen Erkrankungen zu differenzieren.

Konfirmatorische Faktorenanalysen verhelfen darüber hinaus, die faktorielle Validität eines Instrumentes zu messen. In diesen wird festgestellt, inwiefern die Einteilung der Testitems in Subskalen statistisch begründet ist.

Die Überprüfung der faktoriellen Validität der H-Skalen etwa legte eine 4-Faktoren-Lösung nahe. Jedoch schien auch eine Einfaktorenlösung akzeptabel, zumal die Reliabilitätsüberprüfung der Gesamtskala sehr vielversprechend war. Daher wurde auf die Bildung von Subskalen verzichtet.

Die einzelnen Skalen des LMIhängen korrelativ relativ stark zusammen, was die Verwendung eines Gesamtwertes rechtfertigt.[36] Wird eine Faktorenanalyse nach der Hauptkomponentenmethode über alle Items umgesetzt und eine erzwungene 17-faktorielle Lösung gesucht, wird die Zuordnung der Items zu den Skalen relativ gut reproduziert.

Die FKK-Faktorenanalyse nach der Hauptkomponentenmethode mit anschließender Varimax-Rotation bestätigt die vierfaktorielle Lösung. Die Faktoren können, wie theoretisch angenommen, als Selbstkonzept eigener Fähigkeiten, soziale Externalität, fatalistische Externalität und Internalität operationalisiert werden.

Betreffend den SVF-78 weist eine Faktorenanalyse nach der Hauptkomponentenmethode und anschließender Varimax-Rotation auf die Gültigkeit einer 5-Faktoren-Lösung hin, wobei die Negativ-Strategien in einem Faktor subsumieren, die drei Positivbereiche jeweils einen Faktor darstellen und das Unterstützungsbedürfnis einen eigenen Faktor darstellt. Weitgehend kann damit die deduktive Einteilung der Items in Skalen bestätigt werden.

In analoger Weise wurde für den FPI- faktorenanalytisch eine 10-Faktoren-Lösung gefunden. Eine Clusteranalyse offenbarte eine kleinteiligere Struktur, die jedoch, aufgrund der geringeren Ökonomie, den 10 Faktoren unterlegen zu sein scheint.

Hingegen ließen sich die auf theoretischen Vorüberlegungen basierenden SOC-29-Subskalen, namentlich Verstehbarkeit, Handhabbarkeit und Sinnhaftigkeit problematischer Situationen, bisher nicht in annehmbarer Weise faktoriell reproduzieren. Es gilt zu vermuten, dass die Konstrukte konzeptuell so ähnlich sind, dass methodisch kaum zwischen ihnen unterschieden werden kann.

Betreffend den ABI erscheint die Einteilung in unabhängige Subskalen und die Berechnung der faktoriellen Validität nicht sinnvoll.

Grundsätzlich können darüber hinaus Aussagen über die Konstruktvalidität eines Instrumentes getroffen werden, wenn profunde Kenntnisse über das dem Instrument zugrundeliegende Konstrukt vorhanden sind bzw. das Instrument direkt aus dem Konstrukt abgeleitet wurde. Wenn dies der Fall ist, können aus dem Konstrukt begründete Prämissen hergeleitet und statistisch überprüft werden.

Der LMI etwa wurde in Anlehnung an verschiedene Theorien der Leistungsmotivation und an persönlichkeitstheoretische Konzepte konstruiert. Die Formulierung der Skaleninterpretation folgt den Iteminhalten.

Auch der FPI-R basiert auf althergebrachten persönlichkeitspsychologischen Konzepten, vor allem dem Persönlichkeitskonzept nach Eysenck, wurde aber durch Eigenschaften ergänzt, die in einem personalpsychologischen Kontext von Bedeutung sind.

Bei der Konstruktion des FKKwurde auf eine hohe phänomenologische Relevanz jedes Items für das jeweilige Konstrukt und damit eine hohe inhaltliche Validität geachtet. Die Skalenwerte stimmen zudem erwartungsgemäß mit den Selbst- und den Fremdeinschätzungen durch nahestehende Personen überein.

Für die allgemeine Konstruktvalidität der H-Skalen hingegen spricht, dass Laien, denen das Konzept der Hoffnungslosigkeit erläutert worden war, die Items zur Hoffnungslosigkeit und Items zu verwandten Bereichen[37] den jeweiligen Themenkreisen korrekt zuordnen können.[38]

Die Konstruktvalidität eines Instrumentes kann ferner mithilfe von Konvergenz- und Diskriminanzvaliditäten festgestellt werden. Dabei wird überprüft, inwiefern die Testwerte des Instrumentes mit jenen verwandter Tests übereinstimmen (»Konvergenzvalidität«) bzw. inwiefern sie unabhängig von den Werten nicht-verwandter Tests sind (»Diskriminanzvalidität«).

So bestehen, zum Teil sehr deutliche, theoriekonforme Zusammenhänge des WAI, der dem ABI zugrunde liegt, mit Ergebnissen aus anderen klinischen und Gesundheitsfragebögen.[39]

Der FPI-R dagegen bewies sich im Vergleich zu verwandten Persönlichkeitsfragebögen, Fremdbeurteilungen betreffend die Selbstsicherheit und Selbstbeurteilungen betreffend die Gehemmtheit, Extraversion, Lebenszufriedenheit und Leistungsorientierung.

Wie der Vergleich der H-Skalen- und der SVF-78-Testwerte bestätigt, neigen darüber hinaus hoffnungslose Personen auch eher zu negativen Stressbewältigungsmechanismen.

Wie dies bereits in der Vergangenheit festgestellt wurde, zeigt ein Vergleich der Ergebnisse des LMI mit denen des NEO-FFI enge Zusammenhänge der Leistungsmotivation mit Neurotizismus und Gewissenhaftigkeit. Ferner hängt der LMI mit dem Sozialen Erwünschtheitsmaß von Crowne-Marlowne zusammen.

Der FKKhängt erwartungsgemäß mit Skalen zu generalisierten sowie bereichsspezifischen Kontrollüberzeugungen sowie zu generalisierten sowie bereichsspezifischen Selbstkonzeptmerkmalen, namentlich mit dem LOC-E (»Locus-of-Control-Event«), dem IPC-Fragebogen (»Internal, Powerful Others, and Chance Scales«) und den FSKN (»Frankfurter Selbstkonzeptskalen«) zusammen. Dahingegen sind keine nennenswerten Korrelationen mit allgemeinen Persönlichkeitsinventaren wie dem FPI-R, dem Eysenck-Persönlichkeitsinventar und den 16 PF-Fragebögen festzustellen, was darauf hinweist, dass der FKK zusätzliche, von den bereits messbaren Persönlichkeitseigenschaften unabhängige Konstrukte misst.

Die Konvergenz- und Diskriminanzvaliditäten der meisten der verwendeten Testverfahren verhalten sich also erwartungsgemäß. Dass der SOC-29 außerordentlich hoch mit Skalen zu Ängstlichkeit, Depressivität, Neurotizismus und negativer Affektivität korreliert, obwohl die Skala ein qualitativ abweichendes Konstrukt messen sollte, wurde jedoch immer wieder als Kritikpunkt herangezogen.

2.2.4 Fairness

Die verwendeten Testverfahren sind allgemein als fair zu beurteilen, da sie für die Teilnehmer_innen nicht mit einer systematischen Benachteiligung einhergehen und diskriminierende Formulierungen durchgehend vermeiden.

Betreffend Geschlecht, Alter, Bildungsgrad und Einkommensgruppe wurden betreffend einiger Tests Haupteffekte, seltener auch Wechselwirkungseffekte, gefunden. Dies gilt insbesondere für den SVF-78 , den FPI-R , den SOC-29 und den LMI. Die entsprechenden Effekte waren mehrheitlich jedoch bereits in anderen Tests festgestellt worden und verhielten sich theoriekonform.

Eine allgemeine Schwäche von schriftlichen Persönlichkeitsfragebögen jedoch ist, dass sie an die sprachliche Kompetenz der Teilnehmer_innen gebunden sind. Eine geringe Ausprägung der Lesekompetenz oder des Verständnisses der deutschen Sprache kann dazu führen, dass die Fragebögen nicht vollständig oder nicht akkurat ausgefüllt werden können.[40] Dass etwa der ABIbereits in 25 Sprachen übersetzt wurde, vermindert zumindest die Voraussetzungen, die an die Kenntnis der deutschen Sprache gestellt werden.

Eine Möglichkeit, mit dem Problem der Sprachabhängigkeit umzugehen, liegt in Tests, die culture-fair bzw. sprachunabhängig sind. Dies gilt in der Regel für objektive Persönlichkeitstests. Hierbei aber muss beachtet werden, dass diese computerbasiert funktionieren und nur dann als fair angesehen werden können, wenn davon ausgegangen werden kann, dass sämtliche Teilnehmer_innen bereits grundlegende Erfahrungen im Umgang mit Computern gesammelt haben.

2.2.5 Skalierung und Verfälschbarkeit

Ein Test erfüllt das Gütekriterium Skalierung, wenn die laut Verrechnungsvorschriften resultierenden Testwerte die empirischen Verhaltensrelationen adäquat abbilden.[41] In diesem Zusammenhang kann als problematisch angesehen werden, dass das Instrument zum Messen der Beschäftigungsfähigkeit ausschließlich aus Persönlichkeitsfragebögen sowie aus nicht-normierten Fragen besteht. Die Verfälschbarkeit ist daher groß und Effekte des Antwortens gemäß sozialer Erwünschtheit und der Akquieszenz möglich. Insofern misst das Instrument stets nicht nur die Beschäftigungsfähigkeit, sondern, gerade bei sehr persönlichen Fragen, die als zudringlich empfunden werden können, auch die Tendenz der Teilnehmer_innen, offen und aufrichtig zu antworten.

Da es sich jedoch um eine Beratungssituation handelt, könnte prinzipiell davon ausgegangen werden, dass das Bedürfnis der Teilnehmer_innen, wahrheitsgemäß zu antworten, einigermaßen groß ist. Nicht außen vor gelassen werden darf aber auch, dass die Teilnehmer_innen unter Umständen gar nicht in der Lage sind, sich selbst adäquat einzuschätzen.

Den insofern miteinander assoziierten Problemen der Skalierung und der Verfälschbarkeit kann durch den Einsatz objektiver Persönlichkeitstests begegnet werden. Da bei diesen das Verhalten während der Erfüllung von Leistungsaufgaben gemessen wird, ist die Messintention oftmals nicht unmittelbar einsichtig, wodurch es beinahe verunmöglicht wird, das Ergebnis zu verfälschen.

2.2.6 Zumutbarkeit

Ein Test wird dann als zumutbar angesehen, wenn die psychische und körperliche Belastung, die von ihm ausgeht, seine Nützlichkeit nicht übertrifft.[42] Insofern der psychische und körperliche Allgemeinzustand und die Lesefähigkeit der Teilnehmer_innen das Ausfüllen eines Fragebogens generell gestattet, kann daher von allgemeiner Zumutbarkeit der Testverfahren ausgegangen werden. Einige der Fragen betreffen die Privatsphäre der Teilnehmer_innen, was jedoch, angesichts der Zielsetzung, durchaus zu rechtfertigen ist.

Hiermit einher geht auch die prinzipiell gegebene Akzeptanz der Tests durch die Teilnehmer_innen. So wurde etwa für den FPI-R festgestellt, dass der Fragebogen in Evaluationen als interessant eingestuft wurde und dass nur wenige Items nicht beantwortet worden waren. Die Formulierung einzelner Items der Testverfahren kann jedoch bemängelt werden.

2.2.7 Ökonomie

Die Ökonomie eines Tests meint seine Kosten-Nutzen-Relation. Relevante diesbezügliche Aspekte sind etwa die Durchführungszeit, die Möglichkeit zur Durchführung in der Gruppe, der Materialaufwand, die Notwendigkeit der Schulung der Testleiter_innen sowie der Auswertungsaufwand.[43]

Die einzelnen Tests können als relativ ökonomisch angesehen werden; die Itemanzahl ist oftmals vergleichsweise gering. Dass der Materialaufwand niedrig, die Anwendung in der Gruppe und am PC prinzipiell möglich, die Handhabbarkeit gut und die Auswertung einfach und schnell ist, spricht zusätzlich für eine hohe Ökonomie der einzelnen Testverfahren.

Thematische Überschneidungen des ABI mit den nicht-normierten Zusatzfragen sind jedoch evident. Es könnte daher überlegt werden, die Zusatzfragen zu reduzieren.

Für die Durchführung sämtlicher psychologischer Tests müssen in Summe etwa 120 Minuten eingerechnet werden. Der ABI, der mit Abstand den höchsten Prognosewert betreffend das zukünftige Arbeitsvolumen hat, beläuft sich hierbei auf nur fünf Minuten. Die anderen Tests einzusetzen ist also nur dann als ökonomisch zu betrachten, wenn diese auch eine andere als eine prognostische Funktion erfüllen, etwa wenn sie den Beratungseinstieg oder Beratungsverlauf unterstützen.

2.2.8 Zusammenfassende Beurteilung der psychologischen Tests

Die einzelnen Testverfahren erwiesen sich als grundsätzlich objektiv, reliabel und valide mit zum Teil bemerkenswerten empirischen Übereinstimmungsvaliditäten. Mehrheitlich entsprachen die Verfahren zudem dem aktuellen State-of-the-Art.

Nur selten ist Kritik an den verwendeten Persönlichkeitsfragebögen zu äußern. Wiederholt problematisch erscheint lediglich der SOC-29, dessen konzeptuelle Konstruktion auf überholten theoretischen Annahmen basiert und sich empirisch nicht bestätigen lässt.[44] In Reaktion auf die Kritikpunkte an den SOC-29-Skalen wurde die Leipziger Kurzform von Schumacher und Brähler[45] sowie die SOC-HD-Skala[46] entwickelt, deren Verwendung alternativ angedacht werden kann. Betreffend die Erfüllung der Gütekriterien wurden aber keine Unterschiede zwischen diesen Skalen und dem vorliegenden SOC-29 festgestellt.

Um die Objektivität, und damit auch die darauf basierende Reliabilität und Validität, weiterhin sicherzustellen, ist zudem auf eine standardisierte und einheitliche Durchführung des gesamten Instrumentes zu achten. Zur Erhöhung der (Durchführungs-)Objektivität kann zudem eine computerunterstützte Anwendung der Tests angedacht werden. Dies würde zusätzlich die Ökonomie des Instrumentes erhöhen, ginge jedoch zulasten der Fairness, insofern nicht davon ausgegangen werden kann, dass sämtliche Teilnehmer_innen über basale Computerkenntnisse verfügen.

Selbiges gilt für die Möglichkeit, die verfälschbaren Persönlichkeitsfragebögen, wo möglich, durch kaum verfälschbare objektive Persönlichkeitstests zu ersetzen und dadurch eine niedriger dimensionierte Skalierung und potenziell höhere Validität zu erreichen. Dies kann insbesondere für den LMI angedacht werden, der konzeptuell einfach durch den OLMT[47] (»Objektiver Leistungsmotivationstest«) sowie durch Subskalen des AHA[48] (»Arbeitshaltungen«) ersetzt werden könnte. Da objektive Persönlichkeitstests nur am Computer vorgegeben werden können, müssen aber begleitende Überlegungen zu Ökonomie und Fairness gestellt werden.

Insgesamt können Ökonomie und Zumutbarkeit des Instrumentes durch eine Reduktion der Anzahl der Testverfahren verbessert werden. Dies mag alleine angesichts der hohen prognostischen Validität des ABI gerechtfertigt erscheinen, ist aber davon abhängig zu machen, inwiefern die weiteren Tests und Skalen die Beratung unterstützen.

2.3 Fragestellung III: Umsetzung der move-ment-Empfehlungen

Auf den Informationen aufbauend wird ein Perspektivenplan erstellt, in dem, neben der Darstellung des Status Quo der Person und der Schwerpunkte der Beratung, vor allem die empfohlene Vorgehensweise zur Zielerreichung dargestellt ist. Die Empfehlungen folgen nicht automatisiert aus einzelnen Testergebnissen, sondern basieren auf deren Analyse in Zusammenhang mit den weiteren Beobachtungen.

Die Empfehlungen der move-ment-Mitarbeiter_innen beziehen sich auf Maßnahmen, die in- sowie außerhalb der Verantwortung des AMS liegen, und können wie in Tabelle 6 klassifiziert werden.

Tabelle 6: Klassifikation der Empfehlungen durch move-ment

AMS-Interventionen

Andere Empfehlungen

Aktivierung

Physische Abklärung/ Behandlung

Arbeitsstiftung

Psychische Abklärung/ Behandlung

Beratungs- und Betreuungseinrichtungen

Maßnahme für psychische Erkrankungen

Beratung

Schuldner_innenberatung

Gemeinnützige Beschäftigungsprojekte

Suchtberatung

Berufsorientierung

Männerberatungsstelle

Orientierung

Übergangsgeld

Qualifizierung

Pensionsantrag

Sozialökonomische Betriebe

Selbständige Arbeitsuche

Unternehmensgründungsprogramm

Einstellzusage/ Abmeldung vom AMS

Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Ferner konnte ein Abbruch der Inanspruchnahme des move-ment-Angebotes dazu führen, dass keine Empfehlungen formuliert werden konnten. Dies war bei rund fünf Prozent der Personen (n=92) der Fall.

Von Interesse war, ob die aufgezeigten Lösungswege für Integrationshemmnisse nachfolgend auch umgesetzt wurden. Tabelle 7 stellt dar, wie häufig AMS-Interventionen im ersten Jahr nach der Testung umgesetzt wurden, wenn diese empfohlen worden waren. Ebenso ist der Tabelle zu entnehmen, ob AMS-Interventionen gesetzt wurden, wenn empfohlen worden war, keine oder primär AMS-externe Maßnahmen zu ergreifen.

Tabelle 7: Häufigkeit von AMS-Interventionen, nach Art der Empfehlung

Umsetzung Empfehlung

AMS-Intervention

Keine oder andere Intervention

Summe

AMS-Intervention

72,23% (866)

27,77% (333)

1199

AMS-externe Intervention

43,62% (335)

56,38% (433)

768

Summe

1201

766

N=1.976. Dargestellt sind Prozentwerte der Zeilensummen und absolute Werte. Empfehlung zum Zeitpunkt der Testung (Mehrfachzuordnungen nicht möglich, da die primär bedeutsamen Empfehlungen herangezogen wurden); Umsetzung im zweiten Jahr nach der Testung (AMS-Intervention als binär kodierte Variable, Mehrfachzuordnungen nicht möglich). Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Es zeigt sich deutlich, dass die Empfehlung, eine AMS-Intervention zu setzen, oftmals eine solche nach sich zog: Wurde eine entsprechende Empfehlung geäußert, wurde, auf einem Niveau von p<0,00, hochsignifikant häufiger eine AMS-Intervention gesetzt als nicht. Wurde primär eine Maßnahme außerhalb der Verantwortung des AMS angeraten, wurden hingegen nur in weniger als der Hälfte der Fälle dennoch AMS-Interventionen gesetzt. Mit den zur Verfügung stehenden Daten kann jedoch nicht abgebildet werden, ob die verbleibenden rund 56 Prozent der Personen mit der Empfehlung einer AMS-externen Intervention keine Maßnahme ergriffen oder die Empfehlung einer Maßnahme außerhalb der AMS-Verantwortung umsetzten.

Tabelle 8 macht ferner deutlich, dass bei einer bestehenden Einstellzusage sowie nach der Empfehlung, einen Pensionsantrag zu stellen, mehrheitlich keine AMS-Interventionen ergriffen wurden. War eine selbständige Arbeitsuche empfohlen worden, wurde diese schon häufiger durch AMS-Interventionen unterstützt. Personen, die die Testung abgebrochen und daher keine Empfehlung erhalten hatten, erhielten etwa gleich häufig eine AMS-Intervention wie keine oder AMS-externe Interventionen.

Tabelle 8: Häufigkeit der AMS-Interventionen, nach Art der AMS-externen Empfehlung

Umsetzung Empfehlung

AMS-Intervention

Keine oder andere Intervention

Summe

Kein Ergebnis

52,69% (49)

47,31% (44)

93

Dienstverhältnis

33,33% (63)

66,67% (126)

189

Pensionsantrag

30,56% (22)

69,44% (50)

72

Selbständige Arbeitsuche

47,68% (72)

52,32% (79)

151

Summe

206

299

N=505. Dargestellt sind Prozentwerte der Zeilensummen und absolute Werte. Empfehlung zum Zeitpunkt der Testung (Mehrfachzuordnungen nicht möglich, da die primär bedeutsamen Empfehlungen herangezogen wurden); Umsetzung im zweiten Jahr nach der Testung (AMS-Intervention als binär kodierte Variable, Mehrfachzuordnungen nicht möglich). Quelle: abif/ L&R 2015/2016, im Auftrag des AMS Steiermark

Der Anhang der Studie enthält eine detaillierte Gegenüberstellung der Empfehlungen für AMS-Maßnahmen und der vom AMS de facto gesetzten Maßnahmen in den ersten drei Monaten (Tabelle 10) nach der Testung ebenso wie für das darauffolgende Jahr (Tabelle 11) in absoluten und relativen Zahlen.



[13] Betreffend die nicht-normierten Zusatzfragen wurde kein über den ABI hinausgehender prognostischer Erklärungswert festgestellt.

[14] Das Manual erlaubt die Verwendung der Tertiärskala als aggregierten Wert für wissenschaftliche Zwecke in multivariaten Modellen. Eine inhaltliche Interpretation ist jedoch schwer möglich.

[15] Lernbereitschaft kennzeichnet das Bemühen, neues Wissen aufzunehmen, also seine Kenntnisse zu erweitern. Personen mit hohen Werten sind wissbegierig und interessiert. Sie investieren aus eigenem Antrieb Zeit und Mühe, um Neues dazuzulernen und sich im eigenen Fachgebiet weiterzuentwickeln. Sie schätzen den Wissensgewinn, auch ohne dass damit ein unmittelbarer Nutzen verbunden sein muss.

[16] Selbstkontrolle bezieht sich auf die Art der Organisation und Durchführung von Aufgaben. Personen mit hohen Werten sind dadurch gekennzeichnet, dass sie sich im Allgemeinen langfristig gut organisieren. Sie schieben die Erledigung ihrer Pflichten nicht auf. Es fällt ihnen leicht, sich auf ihre Aufgaben zu konzentrieren. Sie sind in der Lage, sich zu disziplinierter und konzentrierter Arbeit zu zwingen; sie nehmen auch Entbehrungen in Kauf, um langfristige Ziele zu erreichen.

[17] Hier wurde auf die gesamte Stichprobe zurückgegriffen, obwohl für 399 Personen noch kein ganzes Beobachtungsjahr vorlag. Eine systematische Verzerrung wird dadurch nicht erwartet, der Jahresdurchschnitt aber unterschätzt.

[18] Aus diesen Primärskalen werden die zwei Sekundärskalen FFK-SKI (generalisierte Selbstwirksamkeit) sowie FKK-PC (generalisierte Externalität) abgeleitet. Die Differenz zwischen den Skalen FFK-SKI und FKK-PC bildet eine Tertiärskala, die als globale, bipolare Dimension der generalisierten Internalität versus Externalität in Kontrollüberzeugungen (FKK-SKI-PC) bezeichnet wird.

[19] Mit Beharrlichkeit sind Ausdauer und Kräfteeinsatz zur Bewältigung selbst- oder fremdgestellter Aufgaben gemeint. Personen mit hohen Werten sind dadurch charakterisiert, dass sie konzentriert und unter Aufrechterhaltung eines ausreichenden Energieniveaus an ihren Aufgaben arbeiten. Auftretenden Schwierigkeiten begegnen sie mit hohem Kräfteeinsatz und erhöhter Anstrengung. Sie sind im Stande, ihre volle Aufmerksamkeit auf das Geschehen zu richten, und sie lassen sich nicht leicht davon abbringen, eine wichtige Aufgabe zu erledigen.

[20] Die H-Skalen unterscheiden sich faktoriell von den anderen Testverfahren. Sie aus dem Modell zu nehmen, erhöhte den Model-Fit.

[21] Vgl. Kubinger 2009.

[22] Vgl. Krohne / Hock 2007.

[23] Vgl. Elsner 2005.

[24] Vgl. Kubinger 2009.

[25] Vgl. Kubinger 2009.

[26] Die H-Skalen wurden als Gesamtversion auf unterschiedliche Personengruppen angewandt. Die Retest-Reliabilitäten, die sich dabei ergaben, lagen zwischen r=0,81 und r=0,90.

[27] Vgl. Abdolalizadeh et al. 2012; Yang et al. 2013; Zwart/ Frings-Dresen/ van Duivenbooden 2002.

[28] Die Retest-Reliabilität des SOC-29 betrug über ein Jahr hinweg bis zu r=0,86.

[29] Über drei Monate hinweg weist der Gesamtwert des LMIeine Stabilität von r=0,86 auf. Die Stabilitäten der einzelnen Subskalen liegen zwischen r=0,66 und r=0,82.

[30] Über zwei Wochen hinweg weisen die Subskalen des FKK Stabilitäten von r=0,70 bis r=0,91 auf. Über drei Monate hinweg beträgt ihre Stabilität immerhin noch r=0,68 bis r=0,85.

[31] Über mehrere Jahre hinweg veränderten sich einige der Subskalen, etwa zur Offenheit und zur Aggressivität der Teilnehmer_innen, des FPI zwar statistisch signifikant, aber praktisch irrelevant. Die Veränderungen überschreiten Effektgrößen von 0,10 nicht und können daher nicht einmal als gering angesehen werden.

[32] Vgl. Abdolalizadeh et al. 2012; Bethge/ Radoschewski/ Gutenbrunner 2012; Carel/Weinstein 2013; da Silva Junior, S.H.A./ Vasconcelos/ Griep/ Rotenberg 2011; Martinez et al. 2009; Peralta/ Godoi Vasconcelos/ Haerter Griep/ Miller 2012.

[33] Vgl. Derycke et al. 2012; Ebener/ Hardt/ Galatsch/ Hasselhorn 2011; Kujala et al. 2006.

[34] Vgl. Bethge et al. 2012; Da Silva Junior et al. 2011; Freude et al. 2005; Goedhard/ Goedhard; Martinez et al. 2009; Peralta et al. 2012.

[35] Vgl. Hannöver et al. 2004.

[36] Der durchschnittliche Zusammenhang liegt bei r=0,34; der höchste bei r=0,63.

[37] Es handelte sich dabei um Items aus FKK und FPI-R.

[38] Vgl. Krampen 1991.

[39] Vgl. Abdolalizadeh et al. 2012; Peralta et al. 2012; Radkiewicz et al. 2005.

[40] Vgl. Kubinger 2009.

[41] Vgl. Kubinger 2009.

[42] Vgl. Kubinger 2009.

[43] Vgl. Kubinger 2009.

[44] Vgl. Becker 1997; Casper 2005; Hannöver et al. 2004.

[45] Vgl. Schumacher / Brähler 2004.

[46] Vgl. Schmidt-Rathjens et al. 1997.

[47] Vgl. Ortner/ Sokolowski 2008; Schmidt-Atzert 2005.

[48] Vgl. Kubinger/ Ebenhöh 1996.

3 Schlussfolgerungen

Insgesamt zeigt sich, dass das Instrument zur Messung des Beschäftigungspotenzials prognostische Validität besitzt, deren Höhe, in Anbetracht der Komplexität des Konstrukts, beachtlich ist. Inwiefern die Höhe der Validität den Aufwand der Anwendung eines Instrumentes rechtfertigt, hängt letztlich davon ab, wie die Batterie konkret zusammengesetzt ist.

Der Arbeitsbewältigungsindex ABI weist mit Abstand den größten Erklärungsanteil am späteren Beschäftigungsvolumen auf. Es hat demgegenüber nur einen geringen prognostischen Mehrwert, das komplette Instrument anzuwenden. Jedoch darf die Batterie hinsichtlich der Beurteilung ihrer Güte nicht auf den prognostischen Wert reduziert werden: Wenn die inkludierten Verfahren auch eine diagnostische Zielsetzung haben, unterstützt das Instrument doch auch die Führung des Beratungsgesprächs. Wo ein beratungsleitender und -unterstützender Wert in den Testverfahren gesehen wird, darf also nicht auf diese verzichtet werden.

Obwohl gezeigt wurde, dass die sieben Testverfahren nicht redundant und austauschbar sind, messen sie doch gemeinsam einen latenten Faktor, der als »(psychische) Beschäftigungsfähigkeit« bezeichnet werden kann. Die Verfahren sind dazu imstande, unterschiedliche Facetten dieses essenziellen Konstrukts zu messen und können betreffend verschiedener beruflicher Zielsetzungen unterschiedlich relevant sein.

Grundsätzlich können die einzelnen Testverfahren dabei als aktuell und dem State-of-the-Art entsprechend angesehen werden und erfüllen mehrheitlich die gängigen Haupt- und Nebengütekriterien. Dennoch könnte die Güte des Instrumentes erhöht werden, wenn folgende Empfehlungen beachtet werden:

  • Die SOC-29-Skala wird, u. a. aufgrund ihrer Konstruktion und inhaltlichen Validität, in der Literatur häufig bemängelt. Die Leipziger Kurzform und die SOC-HD-Skala wurden in Reaktion auf diese Kritiken entwickelt und können den SOC-29 zukünftig ersetzen.

  • Problemen der Verfälschbarkeit und Skalierung kann durch die Verwendung objektiver Persönlichkeitstests begegnet werden. Der OLMT (»Objektiver Leistungsmotivationstest«) sowie der AHA (»Arbeitshaltungen«) können etwa den LMI ersetzen, sofern die Teilnehmer_innen über basale Computerkenntnisse verfügen.

  • Wird weiterhin von move-ment auf eine Standardisierung der Vorgabe des Instrumentes geachtet, kann dessen (Durchführungs-)Objektivität gewahrt werden.

  • Der von move-ment in der Frageformulierung minimal modifizierte ABI sollte weiteren Analysen zur Überprüfung bei der Zielgruppe unterzogen werden.

Das gesamte Erhebungsinstrumentarium, das in die Modellberechnungen einfließt, wird den Kund_innen von move-ment schriftlich vorgegeben. Die Berater_innen unterstützen, wenn Hilfe benötigt wird. Offensichtlich gelingt es den Berater_innen gleich zu Beginn, eine so vertrauensvolle Beziehung mit ihren Kund_innen aufzubauen, dass diese die Fragebögen ausfüllen. Würde das gleiche Instrumentarium z. B. von behördlicher Stelle direkt vorgegeben, wäre dieses Vertrauensverhältnis möglicherweise nicht gegeben.

Zur Verbesserung der Datenqualität wird empfohlen, ein Kodierungshandbuch zu erstellen, in dem eindeutig festlegt wird, wie u. a. fehlende Daten (keine Angabe) bei der elektronischen Verarbeitung zu kennzeichnen sind.

Während in der vorliegenden Untersuchung die Verbesserung des Instrumentes nach primär inhaltlichen und nur sekundär ökonomischen Gesichtspunkten im Fokus stand, können Ökonomie und Zumutbarkeit des Instrumentes zudem prinzipiell durch seine Reduktion auf den ABI massiv erhöht werden. Ein optimaler Ausgleich zwischen Ökonomie und Zumutbarkeit einerseits und Präzision andererseits kann jedoch gefunden werden, wenn den Teilnehmer_innen zunächst der ABI vorgegeben und als Filterkriterium herangezogen wird: Nur wenn die Arbeitsfähigkeit der Teilnehmer_innen prinzipiell gegeben ist und ihr physischer und psychischer Zustand eine Beratung sinnvoll erscheinen lässt, werden die weiteren Testverfahren herangezogen, um ein facettenreicheres Bild der Personen zu erhalten. Stehen gesundheitliche Einschränkungen im Vordergrund, kann die Vorgabe weiterer Testverfahren hingegen hinfällig sein. Sinnvoll ist aber, die Teilnehmer_innen auch während der Bearbeitung physischer oder psychischer Probleme, etwa während Rehabilitationsmaßnahmen, in AMS-Verantwortung zu belassen und damit die mittelfristige Zielsetzung der beruflichen (Wieder-)Eingliederung nicht aus den Augen zu verlieren.

Sollte ein solches stufenweises Vorgehen gewählt werden, dann wäre es sinnvoll, den prognostischen Erklärungswert zu messen, den die verbleibenden Testverfahren haben, wenn vorab durch den ABI prinzipielle Beschäftigungsfähigkeit festgestellt wurde. So ist der ABI zwar optimal dazu in der Lage, Personen zu erkennen, die aufgrund gesundheitlicher Beeinträchtigungen kaum beschäftigungsfähig sind; es ist jedoch gut denkbar, dass die sechs zusätzlichen psychologischen Testverfahren feinere Unterschiede und akkuratere Leistungspotenziale feststellen können. Um alle verfügbaren Möglichkeiten durch das Instrument auszuschöpfen und dessen Ausweitung andenken zu können, ist daher die Überprüfung der prognostischen Validität des Instrumentes betreffend Personen ohne gesundheitliche Einschränkungen, die imstande sind, die berufliche Leistungsfähigkeit zu beeinträchtigen, fundamental.

4 Kurzfassung

Seit dem Jahr 2008 setzt move-ment auch in vom AMS geförderten Maßnahmen ein umfangreiches Instrument zur Erfassung des Beschäftigungspotenzials bei Kund_innen ein. Es besteht aus einem Fragebogen, verschiedenen psychologischen Verfahren und dem Arbeitsbewältigungsindex. Das Instrument dient der Analyse der Ausgangsvoraussetzungen der Teilnehmer_innen/ AMS-Kund_innen sowie der Kompetenz- und Potenzialanalyse. Auf der Basis dieser Ergebnisse werden anschließend Perspektiven und Lösungswege bei Integrationshemmnissen entwickelt. In der Praxis hat sich das Instrument als wertvolles Beratungstool bewährt. Nun stellt sich die Frage der testtheoretischen Güte des Instrumentes und, damit verbunden, der Notwendigkeit und Richtung seiner Weiterentwicklung.

In der vorliegenden Studie im Auftrag der Landesgeschäftsstelle des AMS Steiermark, die unter der Federführung des sozialwissenschaftlichen Forschungs- und Beratungsinstitutes abif in Kooperation mit L&R Sozialforschung im Jahr 2015 umgesetzt wurde, wird also untersucht, welchen prognostischen Wert einzelne Testverfahren des Beschäftigungspotenzials und das gesamte Instrument hinsichtlich des Verbleibs von Personen am Arbeitsmarkt bzw. hinsichtlich ihrer beruflichen Wiedereingliederung haben. Dabei wird auf die Personengruppe 45+ abgestellt, die im Rahmen von Maßnahmen des AMS Steiermark von move-ment betreut wurde.

Das »Beschäftigungspotenzial« als Instrument liefert dabei keine einzelne Aussage oder Zahl und lässt sich auch nicht darauf reduzieren. Es werden im Zuge des Verfahrens rund 400 Variablen pro Person erhoben. Nach der Reduktion dieser auf Scores (Punkte) in den psychologischen Verfahren, beschreiben immer noch rund 50 Variablen eine Person. Alle diese Variablen gemeinsam stellen das »Beschäftigungspotenzial« einer Person dar. Die Verfahren wurden, mit Ausnahme des Arbeitsbewältigungsindex, nicht speziell für die Feststellung der Beschäftigungsfähigkeit entwickelt. Insofern ist die Frage interessant, ob diese Testinstrumente überhaupt einen Zusammenhang mit der Beschäftigung haben. Die vorrangige Fragestellung der testtheoretischen Analyse gilt daher der (prognostischen) Validität:

Welchen prognostischen Wert haben einzelne Skalen des Beschäftigungspotenzials hinsichtlich des Verbleibs von Personen am Arbeitsmarkt?

Zur Beantwortung dieser Frage wurde das Ausmaß an Erwerbstätigkeit der Personen im zweiten Jahr nach der Feststellung des Beschäftigungspotenzials herangezogen, genauer gesagt die Anzahl der Tage in Beschäftigung. Eine nur geringfügige Beschäftigung galt dabei als nicht-beschäftigt. Die Fragestellung wurde über Regressionsanalysen und ein Strukturgleichungsmodell beantwortet.

Die Ergebnisse zeigen, dass der Arbeitsbewältigungsindex in der von move-ment adaptierten Kurzversion eindeutig prognostisch valide ist. Einige der verwendeten psychologischen Verfahren liefern noch zusätzlich zu den Faktoren Alter, Dauer der Phase der Arbeitslosigkeit vor der Testung und der Arbeitsbewältigungskonstellation einen Erklärungswert hinsichtlich späterer Beschäftigung, allerdings ist dieser eher gering und davon abhängig, welche sonstigen

Erklärungsfaktoren in den Modellen berücksichtigt werden. Weiters lassen die Ergebnisse im Strukturgleichungsmodell darauf schließen, dass mit den verschiedenen Testverfahren und Skalen das »Beschäftigungspotenzial« als latente Dimension gemessen wird. Diese wiederum hängt mit dem späteren Beschäftigungsvolumen zusammen.

Die zweite relevante Fragestellung zur testtheoretischen Analyse ist: Inwiefern erfüllen die Testverfahren und Skalen des Beschäftigungspotenzials weitere gängige Gütekriterien für standardisierte Verfahren?

Gemäß dem State-of-the-Art der psychologischen Forschung werden hierbei neben den Hauptgütekriterien der Objektivität, Reliabilität und Validität auch die Fairness, Skalierung, Unverfälschbarkeit, Zumutbarkeit und Ökonomie der Verfahren begutachtet.

Die einzelnen Testverfahren erwiesen sich als grundsätzlich objektiv, reliabel und valide mit zum Teil bemerkenswerten empirischen Übereinstimmungsvaliditäten.

Das gesamte Instrument ist zudem als prinzipiell fair und zumutbar anzusehen. Die Ökonomie könnte, wenn das Ziel lediglich die Sicherstellung der prognostischen Validität wäre, durch die Reduktion des Instrumentes auf den ABImassiv erhöht werden.

Da es sich bei den Verfahren durchgehend um schriftliche Persönlichkeitsfragebögen handelt, sind sie verfälschbar, was auch die Skalierung des Instrumentes negativ beeinflusst. Dem könnte, wo möglich, durch die Verwendung von objektiven Persönlichkeitstests entgegengewirkt werden.

Aufbauend auf dem Instrument formuliert move-ment Empfehlungen, die Maßnahmen in und außerhalb der AMS-Verantwortung umfassen können. Von Interesse war, ob die aufgezeigten Lösungswege für Integrationshemmnisse nachfolgend auch umgesetzt wurden:

Werden die von move-ment empfohlenen Maßnahmen vom AMS umgesetzt?

Obwohl die Klient_innen im ersten Jahr nach der Testung insgesamt mehrheitlich an einer AMS-Maßnahme teilgenommen haben, war dies deutlich häufiger der Fall, wenn move-ment zuvor eine solche empfohlen hatte. Allerdings werden häufig andere AMS-Maßnahmearten als die von move-ment empfohlenen umgesetzt, so die Ergebnisse auf aggregierter Ebene. Eine genauere Analyse erfordert aber einen Vergleich direkt auf Ebene der einzelnen empfohlenen Maßnahme, z. B. über die Namensgleichheit der empfohlenen wie auch umgesetzten Maßnahme.

Insgesamt kann, auf Basis der vorliegenden Ergebnisse, empfohlen werden, die bereits hohe Güte des Instruments zusätzlich zu steigern, indem die Verwendung einer Alternative für die SOC-29-Skala, der Ersatz von Persönlichkeitsfragebögen durch objektive Persönlichkeitstests, die weitergehende Standardisierung und Normierung des ABI und die Erstellung eines Kodierungshandbuches angedacht wird. Betreffend weiterer Untersuchungen sollte überlegt werden, inwiefern sich der ABI als Filterkriterium eignet, auf Basis dessen über die Vorgabe weiterer Testverfahren entschieden wird.

Anhang

Die Tabellen 9–11 können als pdf heruntergeladen werden: http://bidok.uibk.ac.at/download/anhang-bartok.pdf

Literatur

Testmanuale

Erdmann, G. / Janke, W. (2008): Stressverarbeitungsfragebogen (SVF). Stress, Stressverarbeitung und ihre Erfassung durch ein mehrdimensionales Testsystem. Göttingen: Hogrefe.

Fahrenberg, J. / Hampel, R. / Selg, H. (1984): Das Freiburger Persönlichkeitsinventar (FPI-R). Göttingen: Hogrefe.

Fahrenberg, J. / Hampel, R. / Selg, H. (2010): Freiburger Persönlichkeitsinventar (FPI-R). 8., erweiterte Auflage. Manual. Göttingen: Hogrefe.

Hasselhorn, H. M. / Freude, G. (2007): Der Work Ability Index – Ein Leitfaden. 1. Auflage. Bremerhaven: Wirtschaftsverlag NW.

Krampen, G. (1991): Fragebogen zu Kompetenz- und Kontrollüberzeugungen (FKK). Handanweisung. Göttingen: Hogrefe.

Krampen, G. / Beck, A. T. (1994): Skalen zur Erfassung von Hoffnungslosigkeit (H-Skalen). Göttingen: Hogrefe.

Schuler, H. / Prochaska, M. (2000): Das Leistungsmotivationsinventar (LMI). Handanweisung. Göttingen: Hogrefe.

Schumacher, J. / Gunzelmann, T. / Brähler, E. (2000): Deutsche Normierung der Sense of Coherence Scale von Antonovsky. Diagnostica, 46(4), Seite 208–213.

Singer, S., / Brähler, E. (2007): Die »Sense of Coherence Scale«: Testhandbuch zur deutschen Version. Göttingen: Vandenhoeck & Ruprecht.

Weiterführende Literatur

Abdolalizadeh, M. / Arastoo, A. / Ghsemzadeh, R. / Montazeri, A. / Ahmadi, K. / Azizi, A. (2012): The Psychometric Properties of an Iranian Translation of the Work Ability Index (WAI) Questionnaire. Journal of Occupational Rehabilitation, 22 (3), pp. 401–408.

Becker, P. (1997): Psychologie der seelischen Gesundheit. Göttingen: Hogrefe.

Bethge, M. / Radoschewski, F. M. / Gutenbrunner, C. (2012): The Work Ability Index as a Screening Tool to Identify the Need for Rehabilitation: Longitudinal Findings from the Second German Sociomedical Panel of Employees. Journal of Rehabilitation Medicine, 44 (11), pp. 980–987.

Blancke, S. / Roth, Ch. / Schmid, J. (2000): Employability (»Beschäftigungsfähigkeit«) als Herausforderung für den Arbeitsmarkt – Auf dem Weg zur flexiblen Erwerbsgesellschaft. Eine Konzept- und Literaturstudie. Arbeitsbericht: Band Nr. 157. Stuttgart: Akademie für Technikfolgenabschätzung in Baden-Württemberg.

Carel, R. S. / Weinstein, N. (2013): Work Ability Index Questionnaire. First Utilization of the Hebrew Translation in Israel. Harefuah, 152 (1), pp. 7–10.

Casper, V. (2005): Sense of Coherence – Die Kraft der Gruppe. Münster: LIT.

Da Silva Junior, S. / Vasconcelos, A. / Griep, R. / Rotenberg, L. (2011): Validity and Reliability of the Work Ability Index (WAI) in Nurses’ Work. Cadernos de saude publica, 27 (6), pp. 1077–1087.

Derycke, H. / Clays, E. / Vlerick, P. / D’Hoore, W. / Hasselhorn, H. M. / Braeckman, L. (2012): Perceived Work Ability and Turnover Intentions: A Prospective Study Among Belgian Healthcare Workers. Journal of Advanced Nursing, 68 (7), pp. 1556–1566.

Ebener, M. / Hardt, J. / Galatsch, M. / Hasselhorn, H. M. (2011): Prädiktive Validität der Dimensionen des Work Ability Index (WAI) in verschiedenen Berufsgruppen im Quer- und Längsschnitt. Arbeitsmedizin Sozialmedizin Umweltmedizin, 46 (3), 185.

Elsner, G. (2005): Der Arbeitsbewältigungsindex. Eine Bewertung aus arbeitsmedizinischer Sicht. Internet: http://www.neue-wege-im-bem.de/sites/neue-wege-im-bem.de/dateien/elsner_2005_abi_eine20bewertung20aus20arbeitsmedizinischer20sicht.pdf [27.11.2015].

Freude, G. / Seibt, R. / Pech, E. / Ullsperger, P. (2005): Assessment of Work Ability and Vitality. A Study of Teachers of Different Age Groups. International Congress Series, 1280, pp. 270–274.

Goedhard, R. / Goedhard, W.: Work Ability and Perceived Work Stress. Internet: http://www.sciencedirect.com/science/article/pii/S0531513105001457 [27.11.2015].

Hannöver, W. / Michael, A. / Meyer, C. / Rumpf, H. J. / Hapke, U. / John, U. (2004): Die Sense of Coherence Scale von Antonovsky und das Vorliegen einer psychiatrischen Diagnose. Psychotherapie, Psychosomatik, Medizinische Psychologie, 54, pp. 179–186.

Krohne, H. W. / Hock, M. (2007): Psychologische Diagnostik. Grundlagen und Anwendungsfelder. Stuttgart: Kohlhammer.

Kubinger, K. D. (2009): Psychologische Diagnostik. Theorie und Praxis psychologischen Diagnostizierens. Göttingen: Hogrefe.

Kubinger, K. D. / Ebenhöh, J. (1996): Arbeitshaltungen: Kurze Testbatterie; Anspruchsniveau, Frustrationstoleranz, Leistungsmotivation, Impulsivität, Reflexivität. Swets Test Services.

Kujala, V. / Tammelin, T. / Remes, J. / Vammavaara, E. / Ek, E. / Laitinen, J. (2006): Work Ability Index of Young Employees and their Sickness Absence during the Following Year. Scandinavian Journal of Work, Environment & Health, 32 (1), pp. 75–84.

Martinez, M. / Latorre, M. / Fischer, F. (2009): Validity and Reliability of the Brazilian Version of the Work Ability Index Questionnaire. Revista de saude publica, 43 (3), pp. 525–532.

Ortner, T. M. / Sokolowski, K. (2008): Objektiver Leistungsmotivations-Test (OLMT). Testrezensionen gemäß TBS-TK. Internet: www.zpid.de/pub/tests/TBS-TK_OLMT.pdf [27.11.2015].http://www.zpid.de/pub/tests/TBS-TK_OLMT.pdf

Peralta, N. / Godoi Vasconcelos, A. / Haerter Griep, R. / Miller, L. (2012): Validity and Reliability of the Work Ability Index in Primary Care Workers in Argentina. Salud Colectiva, 8 (2), pp. 163–173.

Radkiewicz, P. / Widerszal-Bazyl, M. / NEXT-Study Group (2005). Psychometric Properties of Work Ability Index in the Light of Comparative Survey Study. International Congress Series, 1280, pp. 304–310.

Schanne, Norbert / Weyh, Antje (2014): Wirksamkeitsbetrachtung der Bildungsberatung der »Dresdner Bildungsbahnen«. Eine quantitative Studie. Internet: http://bildung.dresden.de/media/pdf/bildung/Projektbericht_IAB.pdf [1.12.2015].

Schmidt-Atzert, L. (2005): Objektiver Leistungsmotivations-Test. Wien: Schuhfried.

Schmidt-Rathjens, C. / Benz, D. / Van Damme, D. / Feldt, K. / Amelang, M. (1997): Über zwiespältige Erfahrungen mit Fragebögen zum Kohärenzsinn sensu Antonovsky. Diagnostica.

Schumacher J. / Brähler E. (2000): Sense of Coherence Scale – Leipziger Kurzform (SOC-L9). Bern: Hans Huber.

Yang, D. J. et al. (2013): Reliability of Self-Administered Work Ability Index Questionnaire among Korean Workers. Ergonomics, 56 (11), pp. 1652–1657.

Zwart, B. / Frings-Dresen, M. / van Duivenbooden, J. (2002): Test-Retest Reliability of the Work Ability Index Questionnaire. Occupational Medicine (Oxford, England), 52 (4), pp. 177–181.

Quelle

Andrea Egger-Subotitsch, Claudia Liebeswar, Larissa Bartok, Andreas Riesenfelder, Monika Rauscher: Validität der Feststellung des Beschäftigungspotenzials anhand von AMS- und HV-Verbleibsdaten. AMS-Report 118, www.ams-forschungsnetzwerk.at; ISBN 978-3-85495-594-4.

bidok-Volltextbibliothek: Wiederveröffentlichung im Internet

Stand: 24.02.2017

zum Textanfang | zum Seitenanfang | zur Navigation