Volume 6, No. 1, Art. 13 – Januar 2005
Erfahrungen mit der Sekundärnutzung von qualitativem Datenmaterial – Erste Ergebnisse einer schriftlichen Befragung im Rahmen der Machbarkeitsstudie zur Archivierung und Sekundärnutzung qualitativer Interviewdaten
Diane Opitz & Reiner Mauer
Abstract: Die Akquisition und Bereitstellung quantitativer Forschungsdaten sowie deren kontinuierliche Aufbereitung und Dokumentation sind Kernaufgaben des Zentralarchivs für Empirische Sozialforschung in Köln. Eine vergleichbare Institution, die bundesweit qualitatives Datenmaterial systematisch sammelt, archiviert, dokumentiert und einer wissenschaftlichen Sekundärnutzung zuführt, gibt es in Deutschland derzeit nicht. Die Archivierung des Materials liegt allein in der Verantwortung des einzelnen Forschers. Häufig lagern die Daten im Büro oder zu Hause, wo sie im Regelfall für andere nicht zugänglich sind und der dauerhafte Verbleib ungewiss ist.
Vor diesem Hintergrund fördert die DFG ein Gemeinschaftsprojekt des Archivs für Lebenslaufforschung der Graduate School of Social Sciences (Universität Bremen) und des Zentralarchivs für Empirische Sozialforschung an der Universität zu Köln, das die Machbarkeit einer Serviceinfrastruktur für die Archivierung und Weitergabe qualitativer Forschungsdaten untersucht und überprüft, welche Anforderungen die scientific community an den Aufbau einer solchen Infrastruktur stellt.
Der vorliegende Artikel stellt zunächst die Machbarkeitsstudie vor, um dann erste Ergebnisse einer im Rahmen des Projektes durchgeführten schriftlichen Befragung zu präsentieren. Dabei werden wir insbesondere auf verschiedene Aspekte der bisherigen Praxis von Sekundärnutzung qualitativer Daten eingehen.
Keywords: Archivierung qualitativer Daten, Machbarkeitsstudie, Erfahrungen mit Sekundärnutzung, Schwierigkeiten bei Sekundärnutzung, Anforderungen an Daten für Sekundärnutzung, Archivaufgaben
Inhaltsverzeichnis
1. Eine Machbarkeitsstudie zur Archivierung und Sekundärnutzung qualitativer Daten
2. Durchführung der schriftlichen Befragung
2.1 Sample und Rücklaufquote
2.2 Themenbereiche des Fragebogens
3. Ausgewählte Ergebnisse der schriftlichen Befragung
3.1 Potentiell archivierbarer Datenbestand
3.2 Ergebnisse bezüglich der Erfahrungen mit der Sekundärnutzung qualitativer Daten
3.3 Auswirkungen der Erfahrungen mit der Sekundärnutzung qualitativer Daten auf die Bereitschaft zur Datenweitergabe bzw. zur Sekundärnutzung
3.4 Das Archiv als Datenquelle: Wünschbarkeit und Anforderungen
4. Schlussbemerkung
1. Eine Machbarkeitsstudie zur Archivierung und Sekundärnutzung qualitativer Daten1)
In dem Projekt soll – gestützt auf eine Bestandsaufnahme qualitativ ausgerichteter sozialwissenschaftlicher Forschungsprojekte der letzten 10 Jahre in Deutschland und zunächst beschränkt auf Interviewdaten – untersucht werden, ob und inwieweit Sozialwissenschaftler zum einen als potentielle Datengeber und zum anderen auch als zukünftige Sekundärnutzer qualitativer Daten in Forschung und Lehre in Frage kommen. Projektleiter und Mitarbeiter qualitativ ausgerichteter Forschungsprojekte wurden nach Art und Umfang sowie Archivierungswürdigkeit und Nutzungsmöglichkeiten des von ihnen erhobenen qualitativen Datenmaterials befragt. [1]
Darüber hinaus sollte das konkrete Interesse an Sekundärnutzungen vorhandenen verbalen Datenmaterials festgestellt werden. Vor- und Nachteile, die für die Durchführung von Sekundär- und Reanalysen gesehen werden, waren dafür zu erheben. Aufbauend auf diesen Untersuchungen soll schließlich ein innovatives Modell für die Archivierung qualitativer Interviewdaten entwickelt, sowie der Aufwand für eine fachgerechte und benutzerfreundliche Dokumentation und Aufbereitung des Datenmaterials, das in Deutschland als archivierungswürdig eingestuft wird, abgeschätzt werden. [2]
Alle Forschungsschritte erfolgen durch Kooperation des Kölner Zentralarchivs mit dem Archiv für Lebenslaufforschung, das aus dem ehemaligen Sonderforschungsbereich 186 Statuspassagen und Risikolagen im Lebensverlauf" an der Universität Bremen hervorgegangen ist. [3]
2. Durchführung der schriftlichen Befragung2)
Zunächst konzentrierten sich die Projektarbeiten auf eine Bestandsaufnahme qualitativer Forschungsprojekte in Deutschland. Diese diente gleichzeitig als Grundlage für die Auswahl der Stichprobe für die sich im nächsten Arbeitsschritt anschließende schriftliche Befragung. Als Datenquelle diente hierbei die Datenbank "FORIS" des Informationszentrums Sozialwissenschaften (IZ) in Bonn.3) Gemeinsam mit dem IZ wurde eine Suchstrategie entwickelt, mit deren Hilfe für den Zeitraum von 1984 bis 2003 rund 18.000 mit qualitativen Methoden arbeitende Projekte identifiziert werden konnten. [4]
Für die schriftliche Befragung wurden aus der oben beschriebenen Datenbasis alle Projekte der letzten zehn Jahre ausgewählt, die als "empirisch-qualitativ" gekennzeichnet sind, die als Methode zur Datengewinnung "qualitative Interviews" oder "Experteninterviews" verwendet haben und eine Angabe zum Projektleiter enthielten. Nach Überprüfung aller Adressen verblieben 1.750 Projekte mit 1.104 Projektleitern. Von diesen Projektleitern hat die Mehrheit (86%) dem IZ ein bzw. zwei qualitative Projekte für den Nachweis in FORIS gemeldet. Lediglich rd. 1% der zum Sample gehörenden Projektleiter hat sechs oder mehr Projekte gemeldet. Die Rücklaufquote betrug 39% (= 430 Befragte). Trotz des relativ guten Rücklaufs ist unbekannt, ob die Ausfälle stichprobenneutral sind, d.h. ob die antwortenden Personen möglicherweise der Sekundärnutzung und Archivierung von qualitativen Daten gegenüber positiver eingestellt sind als diejenigen, die sich nicht an der Befragung beteiligt haben. [5]
2.2 Themenbereiche des Fragebogens
Die Befragung zielte zunächst darauf ab, den potentiell archivierbaren Datenbestand zu erfassen. Dazu gehörten Fragen nach dem Verbleib der Daten4), vorhandenen Datenformaten, dem Stand der Anonymisierung und der Datendokumentation sowie eine Einschätzung notwendiger Arbeitsschritte der Datenaufbereitung, um die Daten Dritten zur Verfügung stellen zu können. Darüber hinaus wurde die Bereitschaft ermittelt, Daten aus beendeten bzw. zukünftigen Forschungsprojekten für eine Nutzung durch Dritte zur Verfügung zu stellen. Ein weiterer Fragenkomplex befasste sich mit der Sekundärnutzung von qualitativen Daten5): Wer nutzte bzw. nutzt die eigenen Daten und für welche Zwecke? Hat der Befragte selbst schon einmal Daten sekundär genutzt, und welche Erfahrungen machte er dabei? Gibt es das Interesse, qualitative Daten zukünftig sekundär zu nutzen? Abschließend wurden noch Fragen zum Interesse am Aufbau eines Archivs für qualitative Daten und den Leistungserwartungen an ein solches Archiv gestellt. Der Fragebogen enthielt sowohl geschlossene als auch eine Reihe offener Fragen. [6]
3. Ausgewählte Ergebnisse der schriftlichen Befragung
3.1 Potentiell archivierbarer Datenbestand
Durch die Befragung konnten nähere Angaben zu empirisch erhobenem Datenmaterial von ca. 1100 Projekten ermittelt werden. Insgesamt umfassen die von uns untersuchten Projekte rund 80.000 Interviews. Bei einem Drittel der Projekte wurden dabei zwischen 2 und 20 Interviews, bei mehr als einem Drittel zwischen 20 und 50 und bei knapp einem Drittel mehr als 50 Interviews durchgeführt. Minimal wurden 2, maximal 300 Interviews durchgeführt. [7]
Der überwiegende Anteil der Projektleiter (80%) hat seit 1990 zwischen ein und fünf Projekte abgeschlossen, in denen qualitative Interviewdaten produziert wurden. Bei 40% dieser Projekte handelt es sich um soziologische Projekte, 15% stammen aus dem Bereich der Bildungsforschung u. Erziehungswissenschaft und 8% haben einen wirtschaftswissenschaftlichen Hintergrund. Der Rest verteilt sich auf folgende Themengebiete: Sozialpolitik, Psychologie, Kommunikationswissenschaften, Ethnologie, Historische Sozialforschung, Arbeitsmarkt- und Berufsforschung, Medizin, Sportwissenschaft und einzelne Projekte, die nicht mehr näher zugeordnet wurden. [8]
Bezüglich des Verbleibs der Daten aus diesen Projekten zeigt sich erwartungsgemäß, dass nahezu die Hälfte aller Projektdaten im Büro aufbewahrt werden, 10% verwahren die Daten zu Hause. Überraschend in diesem Kontext ist allerdings, dass sich die Daten von knapp einem Viertel der Projekte bereits in einem Archiv befinden. Hierbei ist jedoch zu beachten, dass die Angabe "in einem Archiv" nicht unbedingt die Weitergabe an ein professionelles Archiv bedeuten muss, sondern dass damit wohl durchaus auch die geordnete Ablage der Projektunterlagen in dem jeweiligen Institut gemeint sein kann. Anders lässt sich der hohe Anteil angesichts der wenigen existierenden, im Regelfall auf bestimmte Themenbereiche spezialisierten Archive für qualitatives Datenmaterial in Deutschland kaum erklären. Das Datenmaterial von 13% aller berichteten Projekte wurde bereits vernichtet. Zieht man in Betracht, dass 60% der betrachteten Projekte erst 2003/2004 beendet wurden bzw. noch andauern – die Daten also höchstwahrscheinlich noch in Gebrauch sind –, und der Berichtszeitraum lediglich die letzten 10 Jahre umfasst, ist der Anteil an bereits unwiederbringlich verlorenem Datenmaterial beachtlich. [9]
Um die Machbarkeit eines Archivs für qualitative Interviewdaten und den damit verbundenen Aufwand einschätzen zu können, ist eine Betrachtung des vorhandenen Datenbestandes im Hinblick auf Datenformate, Stand von Transkription, Anonymisierung und Dokumentation notwendig. In knapp der Hälfte der Fälle liegen die Daten bereits in elektronischer Form vor, weitere 30% in Papierform und die restlichen 20% im Audioformat. Die Befragung zeigte, dass das Vorliegen der Daten in elektronischer Form von potentiellen Sekundärnutzern als wichtige Voraussetzung für eine Nutzung genannt wird. Ebenso wurde die Überführung der Daten in ein computerfähiges Format als Leistungsanforderung an ein Archiv gestellt. [10]
Mehr als 40% der Projektleiter gaben an, dass zu den Interviews aus ihren Projekten überwiegend keine bzw. nur unzureichende Transkripte vorliegen und die Daten für eine Weitergabe auch nicht ausreichend anonymisiert sind. In einem Viertel der Fälle liegt auch keine ausreichende Dokumentation vor. Für eine Archivierung und Weitergabe dieser Daten an Dritte zur Sekundärnutzung müsste also zunächst eine beträchtliche Vorarbeit geleistet werden. Jedoch erklärte sich ein Fünftel der Befragten bereit, die für eine Weitergabe notwendigen Aufbereitungsschritte selbst zu übernehmen, 17% könnten zumindest einen Teil dieser Arbeiten durchführen und weitere 17% machen die Übernahme vorgenannter Arbeiten abhängig von den vorhandenen Ressourcen. Die offen gestellte Frage, welche Arbeitsschritte der Datenaufbereitung bzw. -dokumentation für eine Weitergabe an Dritte Voraussetzung seien, ergab allerdings keine systematisch zu verwertenden Hinweise darauf, wie eine angemessene Dokumentation für qualitative Daten auszusehen hat. Dies liegt möglicherweise daran, dass es bisher noch keine Standards für die Dokumentation von Metadaten in diesem Bereich gibt. Je aufwendiger die Dokumentation der Daten ist, desto geringer dürfte aller Wahrscheinlichkeit aber auch die Bereitschaft sein, diese Arbeiten selbst zu übernehmen bzw. die Daten weiterzugeben. [11]
Insgesamt zeigen die Auswertungen zur Bestandsaufnahme, dass es in Deutschland eine große Anzahl qualitativer Daten gibt und viele Forscher auch die Bereitschaft erklären, diese für Re- oder Sekundäranalysen Dritten zur Verfügung zu stellen.6) Nimmt man alleine die Zahl der im Rahmen dieses Projektes befragten Projektleiter, die ihre Bereitschaft zur Datenüberlassung signalisiert haben, so kommt man bereits auf über 400 potentiell archivierbarer Datensätze, die der scientific community für Sekundärnutzungen zur Verfügung gestellt werden könnten.7) Diese potentiell archivierbaren Datensätze stammen inhaltlich zu über 60% aus den Bereichen Soziologie, Politikwissenschaft und der Bildungsforschung bzw. Erziehungswissenschaft und sind laut Einschätzung der Primärforscher zu einem sehr hohen Anteil für weitere Forschungsprojekte (90%), aber auch in der akademischen Lehre und für Qualifikationsarbeiten einsetzbar (jeweils 75%). Es müsste jedoch geklärt werden, welches Material aus der Fülle der vorliegenden Studien für archivierungswürdig gehalten wird. [12]
3.2 Ergebnisse bezüglich der Erfahrungen mit der Sekundärnutzung qualitativer Daten
Ausgehend von den in der internationalen Literatur immer wieder vorgebrachten Zweifeln, dass qualitative Daten aufgrund ihres Charakters nur im Rahmen ihres ursprünglichen Forschungszweckes ausgewertet werden können, soll anhand von Fragen zu den bisherigen Erfahrungen mit der Sekundärnutzung geprüft werden, inwieweit diese Argumente auch in der deutschsprachigen scientific community Gewicht haben und inwiefern sich das auf die zukünftige Bereitschaft zur Sekundärnutzung auswirkt. In diesem Zusammenhang ist es von besonderem Interesse, zu untersuchen, inwieweit sich die von den Befragten genannten Zweifel an der Brauchbarkeit qualitativen Datenmaterials für andere als die ursprünglichen Forschungszwecke mit den in der Literatur genannten Argumenten überschneiden. [13]
Versucht man diese Argumente zusammenzufassen, lassen sich zwei Ebenen identifizieren: Zum einen die forschungsethische und zum anderen die methodologische, wobei keiner der beiden ein höherer Stellenwert zuzuweisen ist. [14]
Vor allem die Überlegungen bezüglich der Verantwortung des Forschers gegenüber den Untersuchungspersonen sind bedeutsam und lassen sich nicht pauschal lösen. Qualitative Daten sind sehr sensibel und geben nicht nur viele persönliche Details aus dem Leben der Untersuchungspersonen, sondern auch aus deren persönlichem Umfeld wieder. Des Weiteren stammen die Befragten in vielen Fällen aus eng begrenzten Populationen, so dass ihre Reidentifizierung auch mit wenig Zusatzwissen möglich wäre. Besonders brisant sind in diesem Zusammenhang qualitative Daten, die z.B. zu Grenzbereichen der Legalität erhoben werden, und im Falle einer Reidentifikation für die Untersuchungspersonen durchaus zu persönlichen Nachteilen bis hin zu strafrechtlicher Verfolgung führen könnten. [15]
Da sich für die Weiterverwendung speziell qualitativer Forschungsdaten keine klaren rechtlichen Rahmenbedingungen in der deutschen Gesetzgebung finden lassen, ist es für den Primärforscher sehr schwierig zu entscheiden, inwieweit die persönliche Freiheit des Betroffenen durch die Nutzung seines Interviews durch andere Forscher beeinträchtigt werden könnte. Denn Zweck des Datenschutzgesetzes ist es, "den einzelnen davor zu schützen, dass er durch den Umgang mit seinen personenbezogenen Daten in seinem Persönlichkeitsrecht beeinträchtigt wird" (§1 Abs. 1 BDSG). Grundsätzlich gelten die Datenschutzgesetze jedoch nur für personenbezogene Angaben (§1 Abs. 1 und 2 BDSG). Wissenschaftliche Daten können deshalb an andere Forschungsprojekte weitergegeben werden, wenn sie so anonymisiert werden, dass "die Einzelangaben über persönliche oder sachliche Verhältnisse nicht mehr oder nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft einer bestimmten oder bestimmbaren Person zugeordnet werden können" (§3 Abs. 7 BDSG). [16]
Dies entspricht dem Konzept der "faktischen Anonymität", welches es z.B. auch dem Kölner Zentralarchiv erlaubt, seine Daten an Dritte zur Sekundärnutzung abzugeben. Kritiker der Sekundärnutzung allerdings vertreten die Ansicht, dass sich eine solche Anonymisierung für qualitative Daten nicht gewährleisten lässt, es sei denn, man verändert oder löscht so viele Informationen, dass die Daten für eine sinnvolle Analyse unbrauchbar wären. [17]
Mit diesem Argument wechselt man zugleich auch auf die methodologische Ebene, deren Hauptargument darin besteht, dass qualitative Daten so speziell und auf den ursprünglichen Forschungszweck bezogen sind, dass sie außerhalb des theoretischen Bezugsrahmens ihrer Konzeption nicht auswertbar sind (HEATON 1998). Des Weiteren bezweifeln die Gegner prinzipiell, dass Sekundäranalysen überhaupt haltbar sind, wenn der persönliche Bezug des Forschers zum Untersuchungsobjekt fehlt. Darüber hinaus argumentieren viele Forscher, dass sich ihre Daten nicht zu einer anderen als ihrer eigenen Forschungsfrage auswerten lassen, da die Theorie- und Ergebnisfindung nie komplett frei von persönlichen Ansichten des Forschers ist und zusätzlich noch vom Interviewer selbst beeinflusst wird (HAMMERSLEY 1997, HEATON 1998). Daneben finden sich auch Argumente die die Qualität der Daten selbst betreffen; so wird argumentiert, dass die meisten qualitativen Datensätze zu klein seien, um den methodischen Anforderungen zu genügen (THORNE 1994, SZABO & STRANG 1997). [18]
Um zu überprüfen, ob die Sekundärnutzung qualitativer Daten in der deutschen Forschungslandschaft akzeptiert ist und womit eine eventuelle Nichtakzeptanz begründet wird, sollen zunächst die bisherigen Erfahrungen mit der Sekundärnutzung untersucht werden. Dieser Komplex umfasst zwei Bereiche: zum einen die Frage, ob Daten des Befragten schon einmal sekundär genutzt wurden und wenn ja, durch wen und wofür und zum anderen die Frage, ob der Befragte selbst schon einmal (eigene oder fremde) Daten sekundär genutzt hat. [19]
Sekundärnutzung eigener Daten
Die Ergebnisse der Analyse zeigen, dass die Weiterverwendung der selbst erhobenen Daten unter den Befragten durchaus verbreitet ist. Wie in Tabelle 1 ersichtlich ist, berichtete etwas mehr als die Hälfte der Forscher (52,9%), dass die von ihnen erhobenen Daten erneut für andere Forschungszwecke genutzt wurden.
Tabelle 1: Wurden oder werden Daten aus Ihrem(n) früheren Forschungsprojekt(en) erneut genutzt? [20]
Abbildung 1: Wer nutzte bzw. nutzt diese Daten? Und für welche Zwecke wurden diese Daten genutzt bzw. werden sie genutzt?
[21]
Dabei wurden die Daten erwartungsgemäß am häufigsten durch die Befragten selbst wieder verwendet (47,9%) und zu einem guten Drittel nutzten Kollegen aus den jeweiligen Projekten die Daten (37,2%). Die Weitergabe eigener Daten an projektfremde Personen zu Zwecken der Sekundärnutzung erfolgte eher selten (14,9%, vgl. Abbildung 1). Bezüglich der Verwendungszwecke lässt sich feststellen, dass keine der vorgegebenen Sekundärnutzungszwecke – Wiederverwendung der Daten in der akademischen Lehre, für Qualifikationsarbeiten oder für neue Forschungsprojekte – von den Befragten überdurchschnittlich häufig oder selten angegeben wurde. Betrachtet man die Datenweitergabe etwas detaillierter nach der Häufigkeit der Fremdnutzung, fällt auf, dass eine Mehrfachnutzung überwiegt; besonders im Bereich der akademischen Lehre (86,9%) werden die qualitative Daten immer wieder verwendet. [22]
Erfahrungen des Befragten mit der Sekundärnutzung von Daten
Auch die Ergebnisse bezogen auf die Frage, ob die Befragten selbst schon einmal qualitative Daten sekundär genutzt haben, bestätigen, dass Sekundäranalysen in der deutschen Forschungslandschaft zwar eher selten, aber nicht unüblich sind. Immerhin mehr als ein Drittel (36,7%) aller Befragten gab an, selbst schon einmal Sekundäranalysen durchgeführt zu haben (vgl. Tabelle 2).
Tabelle 2: Haben Sie selbst schon einmal (fremdes oder eigenes) qualitatives Datenmaterial sekundär genutzt? [23]
Interessant erschien uns in diesem Zusammenhang zu erfahren, woher die Daten bezogen und wofür sie verwendet wurden, und ob sich diese Struktur von der Bereitstellung eigener Daten für die Sekundärnutzung unterscheidet. Auch hier lässt sich – wie in Abbildung 2 dargestellt – feststellen, dass Forscher für Sekundäranalysen vorrangig auf eigene Daten zurückgreifen (56,3%). Im Unterschied zur Datenabgabe an Kollegen, wurden für eigene Sekundäranalysen Daten von Kollegen nur in jedem fünften Fall genutzt. Zwar wurden projektfremde Daten auch etwas häufiger angefordert als eigene Daten an Dritte weitergeben, insgesamt traf dies aber dennoch nur in ca. 20% der Fälle zu.
Abbildung 2: Für welche Zwecke haben Sie die Daten genutzt, und woher haben Sie sie bezogen? [24]
In Bezug auf die Frage, für welchen Zweck diese Daten sekundär genutzt wurden, gab es einige Unterschiede zur Weiterverwendung der eigenen Daten. Vorrangig gaben die Befragten an, qualitative Daten in neuen Forschungsprojekten sekundär genutzt zu haben (42,8%). Ein Drittel der Sekundärnutzung fällt auf die Anwendung der Daten in der akademischen Lehre und zu knapp einem Viertel verwendeten die Befragten qualitative Daten erneut für Qualifikationsarbeiten. [25]
Gründe der Ablehnung von Sekundärnutzung
Um nun zu prüfen, inwieweit sich die zuvor genannten Argumente aus der Forschungsliteratur gegen die Sekundärnutzung qualitativer Daten mit denen unserer Befragten überschneiden, sollten die Befragten begründen, warum sie bislang noch keine Sekundäranalysen durchgeführt haben (291 Personen). Es wurde vermutet, dass die Forscher die Nutzung fremder Daten vorrangig aus methodologischen Gründen ablehnen würden, und zwar mit der Argumentation, dass qualitative Daten aus ihrem Forschungszusammenhang herausgerissen, kein weiteres Analysepotential bieten. [26]
Erstaunlicherweise ergab die Befragung, dass die meisten Forscher bisher nie in Betracht gezogen zu haben scheinen, bereits verfügbare Daten für ihre Forschungszwecke zu nutzen (vgl. Abbildung 3). Denn über die Hälfte der Nennungen bezog sich auf Aussagen wie "es gab keinen Anlass / keinen Grund bisher" oder auch einfach nur "kein Bedarf". Diejenigen, die schon mal daran gedacht haben, Daten sekundär zu nutzen, argumentierten überwiegend mit der Nichtverfügbarkeit bzw. Nichtzugänglichkeit fremder Daten oder auch einfach nur mit der Unkenntnis darüber, woher man geeignete Daten bekommen könnte.
Abbildung 3: Gab es besondere Gründe, warum Sie qualitative Daten nie sekundär nutzten? [27]
In Bezug auf die oben dargestellten Zweifel forschungsethischer und methodologischer Art, lässt sich bei den Befragten in bedeutsamen Maße nur das Argument wiederfinden, dass die eigene Forschungsfrage zu speziell wäre, als das sie sich vorstellen könnten, dass es dafür fremde Daten geben könnte. Die erwarteten Bedenken bezüglich der Kontextgebundenheit, der mangelnden Kenntnis des Erhebungskontextes oder der Qualität der Daten wurden insgesamt nur selten als Gründe angeführt, warum eine Sekundärnutzung bisher abgelehnt wurde. [28]
Schwierigkeiten, die bei der Sekundärnutzung auftraten
In engem Zusammenhang mit den bisherigen Erfahrungen und der Einstellung gegenüber einer zukünftigen Sekundärnutzung, sind die Probleme zu sehen, die während der Nutzung fremder Daten aufgetreten sein könnten. Deshalb wurden die Forscher, die selbst schon einmal Sekundäranalysen durchgeführt haben, gebeten anzugeben, ob Sie dabei auf irgendwelche Schwierigkeiten gestoßen sind und wenn ja, welche dies waren (vgl. Abbildung 4).
Abbildung 4: Traten bei der Sekundärnutzung der Daten Schwierigkeiten auf? [29]
Lediglich knapp ein Fünftel dieser Befragten gab an (38 von 171 Personen), bei der Sekundäranalyse Probleme gehabt zu haben. Dabei handelte es sich erwartungsgemäß zum größten Teil um die fehlende Nachvollziehbarkeit des Forschungskontextes, was eng im Zusammenhang zu sehen ist mit einer unvollständigen Dokumentation. Des Weiteren bemängelten die Forscher die ungenügende Aufbereitung der Daten sowie deren Unvollständigkeit. Auch mangelnde Aktualität und Vergleichbarkeit der Daten mit anderen wurden als Probleme aufgeworfen. Schwierigkeiten bezüglich der Anonymisierung und des Datenschutzes wurden am wenigsten genannt. [30]
Ausgehend von den tatsächlich aufgetretenen Schwierigkeiten bei der Sekundärnutzung lassen sich Mindestanforderungen an die Aufbereitung qualitativen Datenmaterials ableiten, welche nach der Häufigkeit der Nennung in Abbildung 5 dargestellt werden. Eine umfassende Dokumentation des gesamten Forschungsprozesses ist für die Nutzung fremder Daten unabdingbar. Dazu gehören neben der Beschreibung der Forschungsziele, der Untersuchungspopulation und der Umstände des Erhebungsprozesses auch detaillierte Informationen über die Datenaufbereitung, wie etwa Anonymisierungsstrategien oder Transkriptionsregeln. [31]
Darüber hinaus sind Informationen über Auswertungsszenarien und im Idealfall auch die Möglichkeit, Einblick in die Auswertungsergebnisse zu bekommen, z.B. in Form von Publikationen oder Arbeitsberichten, für den Sekundärnutzer sehr hilfreich. Dieses wurde auch durch die Ergebnisse bezüglich der Frage bestätigt, welche Anforderungen die befragten Forscher als bedeutsam erachten würden, um selbst qualitative Daten sekundär zu nutzen. [32]
Die am zweit häufigsten genannte Schwierigkeit bei der Sekundärnutzung – die ungenügende Aufbereitung der Daten selbst – lässt sich auch in den Anforderungen an die Daten wieder finden. Die Befragten erwarten zum einen ordentlich transkribierte Daten, und zum anderen legen sie großen Wert auf die Digitalisierung in einem kompatiblen Datenformat. Darüber hinaus wurde von den Befragten sehr häufig die Gewährleistung der Qualität der Daten, speziell im Hinblick auf methodologische Gütekriterien, genannt.
Abbildung 5: Wenn Sie Interviewdaten sekundär nutzen wollten, welche Anforderungen würden Sie an die Daten stellen? [33]
In diesem Kontext stellte sich die Frage, inwieweit sich die Anforderungen erfahrener Sekundärnutzer an das Datenmaterial von denen unterscheiden, die bislang noch keine Sekundäranalysen durchgeführt haben. Dabei wurde deutlich, dass Forscher, die bereits selbst sekundär gearbeitet haben, neben den bereits angeführten Anforderungen sehr viel mehr Wert auf die Gewährleistung der Anonymisierung und des Datenschutzes legen, vorzugsweise soll sogar für die Weitergabe für eine Sekundärnutzung eine Einwilligung der Interviewpartner vorliegen (vgl. Abbildung 6). Darüber hinaus sehen erfahrene Sekundärnutzer auch den Zugang zu den Originaldaten bzw. den Tonbandaufnahmen als sehr bedeutsam an.
Abbildung 6: Vergleich Anforderungen an Daten bezüglich der Erfahrungen mit Sekundärnutzung [34]
Abbildung 7: Vergleich Anforderungen an Daten bezüglich der Schwierigkeiten bei der Sekundärnutzung [35]
Betrachtet man des Weiteren die Anforderungen an das Datenmaterial gesondert nach denjenigen, die während der Sekundärnutzung auf Schwierigkeiten gestoßen sind, erkennt man, dass der Zugang zu den Originaldaten von diesen Befragten als wichtiger angesehen wird als die Verfügbarkeit in digitaler Form (vgl. Abbildung 7). Zusätzlich wird von ihnen auch die Möglichkeit der Rückfrage bzw. des Kontaktes zu den Primärforschern genannt. Am dritthäufigsten nannten die Forscher eine Systematisierung bzw. Katalogisierung der qualitativen Daten, d.h. sie erachten es als wichtig, qualitative Daten leichter nach vorgegebenen Suchkriterien finden zu können. [36]
Im Zusammenhang gesehen mit den Erkenntnissen bezüglich der Ablehnung von Sekundärnutzung, lässt sich vermuten, dass der Aufwand, der derzeit für die Suche nach geeigneten Daten aufzubringen ist, bei einem Großteil der Forscher dazu führt, lieber auf eigene Daten zurückzugreifen bzw. neue Daten zu erheben. Der Aufbau eines Archivs für qualitatives Datenmaterial mit einer benutzerfreundlichen Datenbank könnte mehr Forscher dazu bewegen, für neue Forschungsfragen auf bereits vorhandene Daten zurückzugreifen. [37]
3.3 Auswirkungen der Erfahrungen mit der Sekundärnutzung qualitativer Daten auf die Bereitschaft zur Datenweitergabe bzw. zur Sekundärnutzung
Bereitschaft der Befragten zur Datenabgabe
Wesentlich für den Aufbau eines Archivs, ist neben der Nachfrage nach archivierten Daten, die Bereitschaft von Primärforschern, die von ihnen erhobenen Daten an ein Archiv für eine weitere Nutzung durch Dritte abzugeben (vgl. Tabelle 3). Über 60% der befragten Projektleiter wären grundsätzlich bereit, Datenmaterial aus bereits beendeten oder noch andauernden Projekten für eine Nutzung durch Dritte bereitzustellen, wenngleich die Mehrzahl dies an bestimmte Bedingungen knüpft. Und sogar über 80% würden Daten aus zukünftigen Projekten weitergeben.
Tabelle 3: Wie wirken sich die Erfahrungen und Schwierigkeiten der Sekundärnutzung auf die Bereitschaft zur Datenweitergabe
aus? [38]
Abbildung 8: Wie wirken sich die Erfahrungen und Schwierigkeiten der Sekundärnutzung auf die Bereitschaft zur Datenweitergabe
aus? [39]
Die Datenabgabe sowohl der aktuellen als auch von zukünftig erhobenen Daten wird vorrangig von den Befragten an Bedingungen geknüpft, die bereits Erfahrungen mit der Sekundärnutzung gemacht haben (vgl. Abbildung 8). Besonders für diejenigen, die dabei Schwierigkeiten hatten, käme eine vorbehaltlose Datenweitergabe nicht in Frage. Dabei stimmt allerdings für die Zielsetzung einer Verbreitung der sekundären Nutzung qualitativer Daten die Tatsache optimistisch, dass diese eine Datenweitergabe prozentual auch am seltensten ablehnen. [40]
Es wurde vermutet, dass Forscher die Weitergabe fremder Daten vorrangig aus forschungsethischen Gründen ablehnen würden und zwar mit der Argumentation, dass die vertrauliche Beziehung, die während einer qualitativen Untersuchung zwischen dem Forscher und der Untersuchungsperson in vielen Fällen mühevoll aufgebaut wird, durch die Weitergabe an Fremde zerstört werden könnte. Dies wurde durch die Ergebnisse der Befragung eindeutig bestätigt. Bezüglich der an die Weitergabe geknüpften Bedingungen wurden am häufigsten (27%) die Wahrung der Anonymität der Befragten und die datenschutzrechtliche Zulässigkeit der Weitergabe genannt. Auch viele derjenigen, die eine Weitergabe ihrer Daten verweigern, führen genau diese Punkte zur Begründung an. Dies unterstreicht die Bedeutung eines noch im Rahmen der Machbarkeitsstudie einzuholenden Gutachtens zur Klärung der datenschutzrechtlichen Fragen. Für rund ein Viertel der Befragten stellt die Kontrolle über die weitere Nutzung eine wichtige Bedingung für die Bereitschaft zur Abgabe von Daten an ein Archiv dar. Dazu gehört u.a. die Information, wer die Daten wofür nutzt oder aber auch die Genehmigung durch den Datengeber für jede einzelne Weitergabe. [41]
Bereitschaft der Befragten zur Sekundärnutzung
Aus der Sicht eines Archivs ist nicht nur bedeutsam, wertvolle Daten akquirieren zu können und diese umfassend aufzubereiten, um sie Sekundärnutzern zur Verfügung stellen zu können, sondern es muss auch ein hinreichend großes Nutzerpotential geben, um somit den nicht unerheblichen Datenaufbereitungs- und Archivierungsaufwand rechtfertigen zu können. Diesbezüglich ergab die Befragung im Rahmen der Machbarkeitsstudie, dass nur jeder Zehnte eine zukünftige Sekundärnutzung ausschließen würde (vgl. Tabelle 4). Etwas über ein Viertel der Befragten war sich zum Befragungszeitpunkt noch nicht sicher. Auch hier zeigte sich – wie in Abbildung 9 dargestellt –, dass vor allem oder gerade diejenigen mit Erfahrungen in der Sekundärnutzung sowohl der eigenen als auch von fremden Daten durchaus auch zukünftig auf andere als selbst erhobene Daten zurückgreifen würden.
Tabelle 4: Könnten Sie sich vorstellen, in der Zukunft Daten sekundär zu nutzen? [42]
Abbildung 9: Bereitschaft zur Sekundärnutzung in Zukunft in Abhängigkeit von den eigenen bisherigen Erfahrungen [43]
3.4 Das Archiv als Datenquelle: Wünschbarkeit und Anforderungen
Schließlich sollte die Befragung auch Aufschluss darüber geben, ob die Forscher sich eine professionelle Stelle zur Archivierung ihrer Daten oder auch als Bezugsquelle von fremden Daten in Deutschland wünschen würden. Beinahe 80% der befragten Projektleiter halten den Aufbau einer solchen Infrastruktur für sinnvoll. Hierbei schien es auch unbedeutsam, ob die Befragten bereits sekundär gearbeitet haben oder ihre eigenen Daten für sekundäre Forschungszwecke zur Verfügung gestellt haben. Auch die Frage, ob ihnen bereits Archive bekannt sind, die sich mit der Archivierung qualitativer Forschungsdaten beschäftigen erwies sich in diesem Zusammenhang nicht als relevant. [44]
Für die weitere Konzeption einer professionellen Infrastruktur zur Aufbereitung, Langfristsicherung und Vermittlung qualitativer Forschungsdaten ist es wichtig zu wissen, welche Erwartungen potentielle Nutzer an ein solches Archiv haben. Deshalb bekamen die Befragten in einer offenen Frage die Gelegenheit, ihre diesbezüglichen Vorstellungen darzustellen (vgl. Tabelle 5). [45]
Die wichtigste Aufgabenstellung eines Archivs sehen die Forscher in der Systematisierung und Katalogisierung der Forschungsdaten. Des Weiteren wünschen sie sich einen unkomplizierten Zugang zu den Daten, vorzugsweise über das Internet. Dies unterstützt die Vermutung, dass der Aufbau einer informativen Datenbank und die Schaffung einer benutzerfreundlichen Suchmaske – vorzugsweise Online – sehr viel mehr Forscher dazu bewegen könnte, im Vorfeld eigener Erhebungen erst einmal zu schauen, ob es nicht vielleicht doch bereits Datenmaterial zu ihren Fragestellungen gibt. Dies wäre auch aus forschungsethischer Sicht sehr zu begrüßen. Neue Elemente des Bundesdatenschutzgesetzes – die Erforderlichkeits- und die Bedarfsprüfung – verlangen vom Forscher generell am Beginn seiner Forschungstätigkeit zu prüfen, ob die benötigten Daten nicht anderweitig, als durch eine Neuerhebung und somit einen weiteren Eingriff in den "Schutzbereich des Persönlichkeitsrechtes" zu beschaffen wären (METSCHKE & WELLBROCK 2000).
Tabelle 5: Welche Leistungserwartungen würden Sie an ein Archiv stellen? [46]
Die am dritthäufigsten genannte Erwartung ist die Dokumentation des Forschungsprozesses. Aus Sicht eines potentiellen Datengebers sind damit Hilfestellungen bei der Dokumentation gemeint, und aus Datennutzersicht die Gewährleistung der Bereitstellung einer umfassenden Forschungsdokumentation. Die bisherigen Ergebnisse und die Erfahrungen aus der Forschungsliteratur belegen, dass dieser Arbeitsbereich nicht nur der zeit- und arbeitsintensivste ist, sondern auch der bedeutsamste überhaupt für die Machbarkeit von Sekundärnutzungen qualitativer Forschungsdaten. Da es aber unwahrscheinlich ist, dass ein Archiv über ausreichende Ressourcen verfügen wird, um diese wichtige Aufgabe für den Primärforscher komplett übernehmen zu können, erscheint es besonders wichtig, Kriterien und Leitlinien für eine professionelle Dokumentation zu entwickeln, an denen sich die Forscher schon während des Forschungsprozesses orientieren könnten. Allerdings wäre dann auch die Einsicht der Mittelgeber gefragt, die den zusätzlichen Aufwand an Zeit und Personalressourcen bereits bei der Bewilligung berücksichtigen müssten. [47]
Weiterhin wünschenswert fänden die Forscher, dass ein Archiv auch Beratungs- und Serviceleistungen anbietet, so z.B. im Bereich der Projektplanung und -durchführung, aber durchaus auch Workshops zur Datenerhebung oder -analyse. Des Weiteren halten die Befragten die Ausarbeitung von methodischen Standards und Gütekriterien durch ein professionelles Archiv für sinnvoll, die dann auch als Vorgaben in die scientific community eingebracht werden könnten. Vereinzelt wird sogar erwartet, dass ein Archiv für die Gewährleistung solcher Standards verantwortlich sein sollte. Dies jedoch ist sicher eine Aufgabe, die allein in der Verantwortung des Forschers liegen sollte. [48]
Darüber hinaus wird von einem Archiv erwartet, dass es Kontakte zu den Primärforschern für eventuelle Rückfragen herstellen kann. Dies könnte, natürlich in Abhängigkeit von den diesbezüglichen Wünschen seitens der Datengeber, durch den Aufbau und die Pflege einer umfassenden Projektdatenbank realisiert werden. Die nachrangig genannten Leistungsanforderungen betreffen wiederum Arbeitsaufgaben, bei denen ein Archiv nur Unterstützung anbieten könnte, wie der Optimierung der Transkription, der Datenaufbereitung sowie der Digitalisierung der Daten in ein kompatibles Datenformat. [49]
Trotz immer wieder geäußerter methodischer Bedenken, scheint die Sekundärnutzung qualitativer Daten weiter verbreitet zu sein, als ursprünglich angenommen, wobei allerdings hinzuzufügen ist, dass der Begriff der Sekundäranalyse sehr weit gefasst werden kann. Diejenigen, die bisher keine Erfahrungen mit der Sekundärnutzung gemacht haben, führen in der Mehrzahl ein mangelndes Angebot an verfügbaren Daten bzw. die Unkenntnis über nutzbares Material an. Prinzipielle methodische Einwände gegen die Nutzung von qualitativem Datenmaterial spielen dabei nicht die erwartet dominante Rolle. Betrachtet man in diesem Zusammenhang den großen Anteil an Forschern, der sich eine zukünftige Sekundärnutzung qualitativer Daten durchaus vorstellen kann (80%), so würde die Schaffung eines entsprechenden Angebots an verfügbaren und zugänglichen Daten die erneute Nutzung qualitativer Daten erhöhen und somit zu einer größeren Ausschöpfung des Analysepotentials qualitativer Daten beitragen. Darüber hinaus würden die Möglichkeiten von Reanalysen zur Überprüfung von Forschungsergebnissen gesteigert und somit der Forderung nach mehr Transparenz in der Forschung gerecht werden. Auch könnte dies zu einem verstärkten Einsatz vorhandener Daten in der Lehre beitragen. Die Ausschöpfung der genannten Möglichkeiten hängt allerdings sehr stark davon ab, dass den hohen Anforderungen, welche die Nutzer an das Datenmaterial stellen, insbesondere im Hinblick auf die Dokumentation der Daten und des gesamten Forschungsprozesses mit entsprechenden Infrastrukturmitteln begegnet wird. [50]
1) Das von der DFG geförderte Gemeinschaftsprojekt des Archivs für Lebenslaufforschung der Graduate School of Social Sciences (Universität Bremen) und des Zentralarchivs für Empirische Sozialforschung an der Universität zu Köln "Archivierung und Sekundärnutzung qualitativer Daten – eine Machbarkeitsstudie" umfasst eine Laufzeit von 2 Jahren (2003-2005). Im Rahmen des Projektes soll mit Hilfe sowohl einer standardisierten als auch einer qualitativen Befragung unter empirisch qualitativ arbeitenden Sozialwissenschaftlern die Wünschbarkeit und die Machbarkeit einer Serviceinfrastruktur für die Archivierung und Weitergabe qualitativer Forschungsdaten untersucht und überprüft werden.
Projektteam: Prof. Karl F. SCHUMANN; Dr. Andreas WITZEL; Irena MEDJEDOVIC, Diane OPITZ (Bremen) sowie Prof. Wolfgang Jagodzinski; Dr. Ekkehard MOCHMANN und Reiner MAUER (Köln); weiterführende Informationen finden Sie auf der Homepage des Archivs für Lebenslaufforschung. <zurück>
2) Die standardisierte Erhebung wurde bereits abgeschlossen. Die Durchführung der qualitativen Befragung ausgewählter Wissenschaftler aus dem Sample wird im Januar 2005 begonnen. <zurück>
3) FORIS bietet Beschreibungen sozialwissenschaftlicher Forschungsprojekte aus Deutschland, Österreich und der Schweiz. Zur Informationsgewinnung für FORIS wird u.a. jährlich eine zentrale WWW-Erhebung von Forschungsprojekten in der Bundesrepublik Deutschland durchgeführt (http://www.gesis.org/Information/index.htm). <zurück>
4) Siehe auch KLUGE und OPITZ 2000 sowie OPITZ und WITZEL 2004. <zurück>
5) Zu Möglichkeiten von Re- und Sekundäranalysen siehe auch WITZEL 2004. <zurück>
6) Wie die Erfahrungen des ZA allerdings zeigen, besteht eine Diskrepanz zwischen der erklärten Abgabebereitschaft und einer tatsächlichen Abgabe von Daten. <zurück>
7) Die Zahl bezieht sich auf die in der schriftlichen Befragung erfassten Projektdaten, die nicht vernichtet oder bereits in ein Archiv gegeben wurden und deren Projektleiter grundsätzlich abgabebereit sind. <zurück>
Hammersley, Martyn (1997). Qualitative Data Archiving: Some Reflections on Its Prospects and Problems. Sociology, 31(1), 131-142.
Heaton, Janet (1998). Secondary Analysis of Qualitative Data. Social Research Update,22, http://www.soc.surrey.ac.uk/sru/SRU22.html>http://www.soc.surrey.ac.uk/sru/SRU22.html [Zugriffsdatum: 19.01.2005].
Kluge, Susann & Opitz, Diane (2000, Dezember). Die computergestützte Archivierung qualitativer Interviewdaten mit dem Datenbanksystem "QBiQ" [36 Absätze]. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research [Online Journal], 1(3), Art. 11, http://www.qualitative-research.net/fqs-texte/3-00/3-00klugeopitz-d.htm [Zugriffsdatum: 19.01.2005].
Metschke, Rainer & Wellbrock, Rita (2000). Datenschutz in Wissenschaft und Forschung – Überarbeitung. Materialien zum Datenschutz, Berlin.
Opitz, Diane & Witzel, Andreas (2004). The Concept and Architecture of the Bremen Life Course Archive. In Max Bergmann & Thomas Eberle (Hrsg.), Qualitative Inquiry: Research, Archiving, and Reuse (S.105-120). Bern: Swiss Academy of Humanities and Social Science.
Szabo, Vivian & Strang, Vicky R. (1997). Secondary Analysis of Qualitative Data. Advances in Nursing Science. Methods of Clinical Inquiry, 20(2), 1997, 66-74.
Thorne, Sally (1994). Secondary Analysis in Qualitative Research: Issues and Implication. In Janice M. Morse (Hrsg.), Critical Issues in Qualitative Research Method (S.363-279). London: Sage.
Witzel, Andreas (2004). Archivierung qualitativer Interviews. Möglichkeiten für Re- und Sekundäranalysen in Forschung und Lehre. In Birgit Griese; Hedwig Rosa Griesehop & Martina Schiebel (Hrsg.), Perspektiven qualitativer Sozialforschung: Beiträge des 1. und 2. Bremer Workshops. Werkstattberichte des Instituts für angewandte Biographie- und Lebensweltforschung (IBL) (S.40-60). Bremen: Universitätsbuchhandlung Bremen.
Diane OPITZ, Diplom-Sozialwissenschaftlerin, Abschluss an der Humboldtuniversität zu Berlin, seit 1998 in Bremen als wissenschaftliche Mitarbeiterin tätig, seit 2001 im Archiv für Lebenslaufforschung
Hauptinteressen: Organisationsabläufe und Arbeitsroutinen bei der Archivierung von Interviewdaten; Anonymisierungsstrategien und datenschutzrechtliche Rahmenbedingungen; Anforderungen an Metadaten zur Datenweitergabe, Datenbankaufbau mit dem Ziel der Einbindung ins WWW
Kontakt:
Diane Opitz
Archiv für Lebenslaufforschung an der Graduate School for Social Sciences
Universität Bremen
FVG West
D-28334 Bremen
E-Mail: dopitz@gsss.uni-bremen.de
URL: http://www.lebenslaufarchiv.uni-bremen.de/
Reiner MAUER, Diplom-Volkswirt, wissenschaftlicher Mitarbeiter am Zentralarchiv für Empirische Sozialforschung in Köln
Gegenwärtige Arbeitsschwerpunkte: Entwicklungen zum Management von Umfragedaten und deren Dokumentation (insbesondere die Migration des ZA-Studienbestandes in das XML bzw. DDI-Format), Koordination der NESSTAR-Einführung im ZA, Mitarbeit an der Entwicklung eines Archivkonzeptes für die qualitative Sozialforschung
Kontakt:
Reiner Mauer
Zentralarchiv für Empirische Sozialforschung an der Universität zu Köln
Postfach 410960
D-50869 Köln
E-Mail: mauer@za.uni-koeln.de
URL: http://www.gesis.org/za/
Opitz, Diane & Mauer, Reiner (2005). Erfahrungen mit der Sekundärnutzung von qualitativem Datenmaterial – Erste Ergebnisse einer schriftlichen Befragung im Rahmen der Machbarkeitsstudie zur Archivierung und Sekundärnutzung qualitativer Interviewdaten [50 Absätze]. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 6(1), Art. 43, http://nbn-resolving.de/urn:nbn:de:0114-fqs0501431.
Revised 6/2008