Was beinhaltet das Dortmunder Chat-Korpus?

Das Dortmunder Chat-Korpus umfasst Mitschnitte (sog. "Logfiles") aus unterschiedlichen Typen von Chat-Anwendungen.

Bei der Auswahl der Daten wurde Wert darauf gelegt, den Einsatz der Chat-Technologie in einer Vielzahl unterschiedlicher Anwendungskontexte zu dokumentieren. Bei der Akquisition der Daten lag das Hauptaugenmerk daher nicht lediglich auf frei via WWW oder IRC zugänglichen Chat-Angeboten; vielmehr wurden insbesondere auch solche Chat-Umgebungen berücksichtigt, die in professionellen Kontexten (Lehr-/Lernkon­texten, Beratung) zum Einsatz kommen und jeweils nur eingeschränkt zugänglich sind (etwa für die TeilnehmerInnen einer bestimmten Veranstaltung oder für die NutzerInnen eines bestimmten Beratungsangebots). Daneben wurden Mitschnitte einer Anzahl von Politiker-/Prominenten-/Expertenchats in das Korpus aufgenommen, die von den Veranstaltern der jeweiligen Chat-Events im WWW "zum Nachlesen" veröffentlicht wurden. Aufnahmekriterium in diesem Fall war, dass die Mitschnitte augenscheinlich nicht redaktionell nachbearbeitet, sondern in ihrer ursprünglichen sprachlichen Form und Struktur belassen worden waren.

Dem Bereich der "Plauder"-Chats, worunter wir thematisch prädifferente und für jedermann zugängliche Webchat- und IRC-Angebote fassen, stellen wir in unserem Korpus den Bereich der "professionellen Chats" gegenüber. "Professionell" sind nach unserer Einteilung Chat-Ereignisse dann, wenn sie zumindest für einen Teil der aktiv an der Kommunikation beteiligten NutzerInnen in berufliche Handlungszusammenhänge eingebettet sind (z.B. Lehren / Studieren, professionelles Beraten, Veranstaltung eines kollektiven Politikerinterviews durch die Mitarbeiter einer Online-Redaktion). Bei der Akquisition von Chat-Mitschnitten haben wir hierbei insbesondere Chat-Veranstaltungen im Hochschulkontext, Beratungschats und Chat-Events mit journalistischem Hintergrund (d.h.: Chats mit Politikern, Prominenten oder Experten) berücksichtigt.

Das Korpus umfasst mehrere Teilkorpora. Die Großbereiche "Professionelle Kommunikation" und "Freizeitkommunikation", denen in unserem Korpus die Teilkorpora "Professionelle Chats" und "Plauder-Chats" entsprechen, sind weiter untergliedert. Bei den professionellen Chats unterscheiden wir Lehr-/Lernkontexte, Beratungskontexte und Medienkontexte, die "Plauder-Chats" unterteilen wir in Chats im Medienkontext (i.d.R. freie Userchats im Rahmen von Chat-Angeboten, bei denen ansonsten Chat-Events mit Politikern, Prominenten und Experten veranstaltet werden) und Chats außerhalb von Medienkontexten. Letztere sind die "typischen" und in der Forschungsliteratur bislang am ausführlichsten untersuchten "freien" (d.h.: weder thematisch festgelegten noch institutionell strukturierten) Kanäle (IRC oder Webchats), in denen rund um die Uhr kommuniziert werden kann.

Teilweise wurden die in das Korpus aufgenommenen Daten selbst erhoben (mitgeschnitten oder als bereits online publizierte Logfiles archiviert), teilweise von externen Partnern zur Verfügung gestellt. Für die freundliche Überlassung von Daten danken wir u.a. dem Seminar für Sprachwissenschaft der Eberhard-Karls-Universität Tübingen (Komplettmitschnitt eines virtuellen Seminars), der Universitätsbibliothek der TU Dortmund (Mitschnitte aus der chatbasierten Bibliotheksauskunft), dem Paritätischen Wohlfahrtsverband Berlin (Mitschnitte aus der psychosozialen Beratung) sowie dem Saarländischen Rundfunk (Komplettmitschnitt des Begleitchats zur "Tour de France" 2003 auf der Website der ARD).

Das dem Korpus zu Grunde gelegte Klassifikationsschema erhebt nicht den Anspruch einer mustergültigen Typologie für Chat-Mitschnitte, Chat-Angebote oder Chat-Umgebungen. Es soll lediglich als grobe Heuristik dienen, um den Bestand an Mitschnitten und die Bandbreite an im Korpus dokumentierten Nutzungskontexten der Chat-Technologie überschaubar zu machen. Das Klassifikationsschema ist auf einen Zifferncode abgebildet, der es erlaubt, jedem Korpusdokument eine siebenstellige Identifikationsnummer zuzuweisen, aus der zugleich die systematische Einordnung der Dokuments in die Korpusstruktur abgelesen werden kann.

Die Grundstruktur und Zusammensetzung des Basiskorpus ist wie folgt:

Aus unserem Basiskorpus haben wir sechs verschiedene Kompilationen zusammengestellt, die online verfügbar sind und frei für Forschungszqwecke genutzt werden können. Zu allen Kompilationen - wie auch zum Basiskorpus - gibt es ausführliche Bestandsdokumentationen mit Angaben zur Herkunft der einzelnen Teilkorpora und Dokumente sowie Materialien zum Kontext einzelner Mitschnitte.