ForschungProjekteTALC
Projektbeschreibung

Projektbeschreibung TALC - Tool for Analyzing Language and Communication

SPRACHERWERBSFORSCHUNG DIGITALSIEREN

Die Analyse kindlicher Spontansprachproben ist eine der zentralen, seit langem etablierten Erkenntnisquellen der Spracherwerbsforschung. Der Prozess der Erhebung, manuellen Transkription und Auswertung von Spontansprachdaten ist allerdings mit einem enormen Zeit- und Kostenaufwand verbunden, weshalb auf den meisten linguistischen Ebenen (z.B. Grammatik, Wortschatz) die empirische Datengrundlage aufgrund kleiner Stichproben zu Meilensteinen und Ablauf der Sprachentwicklung gering ist.

Gleichzeitig sind Entwicklungen im Bereich der digitalen Spracherkennung und –verarbeitung inzwischen soweit fortgeschritten, dass Anwendungen in der linguistischen und sprachtherapeutischen Forschung möglich erscheinen. Im Bereich Erwachsenensprache sind solche Algorithmen längst in der Mainstreamnutzung angekommen (s. Alexa, Siri oder Dragon Speech). Die Verarbeitung kindlicher Sprache gestaltet sich aufgrund der Besonderheiten im akustischen und sprachlichen Bereich allerdings deutlich anspruchsvoller.

Mit TALC wird in diesem Projekt ein Hard- und Softwaresystem entwickelt, welches die Aufnahme, (halb)automatische Transkription und sprachwissenschaftliche Auswertung ermöglichen soll. Die Spracherwerbsforschung wird damit an der Schnittstelle der Disziplinen Linguistik, Computerlinguistik, Sprachpädagogik/Sprachtherapie und Informatik digital transformiert:

  • Die Ökonomisierung des Aufnahme-, Transkriptions- und Auswertungsprozesses ermöglicht eine Potentierung der Datenmenge
  • Mit der Aufnahme längerer Sequenzen an Alltagskommunikation erhöht sich die Realitätsnähe der Datenbasis
  • Durch die Analyse individueller Spracherwerbsumgebungen verbessert sich der Praxistransfer im Anwendungsbereich
  • Die durch das digitale System generierten Daten können eine Erweiterung der Methodik von Studien zur Evaluation von Interventionen darstellen und korrespondieren mit der Forderung der Messung von Veränderungen im Alltag der Betroffenen (z.B. familiäre oder institutionelle Kontexte)

WAS IST TALC?

TALC besteht aus einem kleinen, tragbaren Rekorder, welche die Aufnahme von mehreren Stunden Sprachmaterial erlaubt. Die zugehörige Software soll zunächst die Äußerungen der aufgenommenen Kommunikationspartner (z.B. Kind-pädagogische Fachkraft) personenzugeordnet (halb)automatisch transkribieren. In einem weiteren Schritt erfolgt eine automatische deskriptive und linguistische Auswertung von ausgewählten Verteilungs- und Sprachparametern (z.B. Anzahl und Art der Wörter, Sprecherwechsel, Wortarten) und Audiodaten der Umgebung (z.B. Geräusche elektronischer Medien). Das Ziel des Projekts ist es dies auch für mehrsprachige Kommunikation und in institutionellen Kontexten (z.B. Kita oder Schule) zu ermöglichen.

DIE TALC DATENBANK

Die TALC Datenbank wird die Nachnutzung der im Rahmen der TALC Entwicklung und von Lab internen TALC Projekten erhobenen ein- und mehrsprachigen kindlichen Sprachdaten ermöglichen. Geplant ist eine Einlagerung in Form von Transkripten und Audiodateien.

Die TALC Datenbank befindet sich derzeit im Aufbau. Zugangsmodalitäten werden bei Eröffnung der Datenbank bekannt gegeben.

TALC PROJEKTSTATUS

TALC hat zwei parallele Projektstränge in Deutschland und Südafrika. An beiden Standorten arbeiten komplementäre Teams der Disziplinen Sprachtherapie, (Computer)linguistik und Informatik/Elektroingenieurswesen an den benötigten Systemen. TALC wird in Deutschland zunächst für das Deutsche und in Südafrika für Afrikaans entwickelt. Ein Übertrag auf weitere Sprachen ist geplant. In beiden Ländern sind die Pilotstudien hierzu im Jahr 2019 gestartet.

Die Leitung des TALC Projekts in Südafrika übernimmt Frau Prof. Juan Bornman von der Universität Pretoria. Wissenschaftler/innen der Universitäten Stellenbosch und Cape Town sind ebenfalls am Projekt beteiligt.