Articles

Die Transkription ist enorm wichtig, und hier ist ihre Zukunft

Wenn Sie in Ihrer Freizeit nicht viel über die Transkription nachdenken, machen Sie sich keine Sorgen. Damit sind Sie sicher nicht allein.

Die Transkription, also der Prozess, bei dem jemand (oder etwas) Audio in Text umwandelt, ist ein wichtiges Instrument, um einen Großteil der modernen Gesellschaft verständlicher zu machen.

Einigen mag das etwas kontraintuitiv erscheinen. Wir leben schließlich in einer Kultur, die sich stark auf Audio- und Videomedien verlässt. Warum brauchen wir also Text, um das zu verdeutlichen?

Wir schlagen vor, dass Sie sich eine Handvoll YouTube-Videos ansehen und sich dann fragen, wie hilfreich es wäre, ein schriftliches Dokument über alles zu haben, was in dem Clip gesprochen wird.

Warum ist die Transkription wichtig?

Die Transkription dient jedoch einem viel größeren und wichtigeren Zweck als der Entschlüsselung Ihrer viralen Lieblingsvideos.

Neben der Erstellung einer schriftlichen Aufzeichnung eines Videos oder einer Audiopräsentation hilft die Transkription dabei, das Gesprochene zu bereinigen (und zu klären).

Sprache, die wir alle verstehen

Betrachten Sie all die verschiedenen Akzente, die es in den Vereinigten Staaten gibt. Vom Norden bis zum Süden und entlang der Küsten von Ost nach West gibt es eine enorme Vielfalt an Dialekten in unserem Land.

Betrachten wir nun den Rest der Welt.

Es gibt zweifellos Zeiten, in denen man beim Anschauen einer britischen Serie auf Netflix die Untertitel einschalten muss, um die Serie besser genießen zu können.

Die Transkription durchbricht nicht nur den dicken Akzent oder den ungewohnten Tonfall, sondern bringt auch das Gesagte auf den Punkt.

Nehmen Sie zum Beispiel eine Online-Präsentation oder einen Schulungskurs, bei dem der Inhalt zielgerichtet ist, aber die präsentierende Person nicht so ausgefeilt ist.

Die Transkription beseitigt die persönlichen Ticks oder hörbaren Ablenkungen, die die verbalen Elemente einer Präsentation durcheinander bringen könnten. Sie beseitigt das Stolpern oder die langen Pausen, die entstehen, wenn der Vortragende einen Schluck Wasser trinkt oder seine Gedanken sammeln muss.

Die Transkription beseitigt die persönlichen Ticks oder hörbaren Ablenkungen, die die verbalen Elemente einer Präsentation durcheinander bringen könnten.

In manchen Fällen ist es notwendig, einige dieser nonverbalen Hinweise mit einzubeziehen, um sicherzustellen, dass die beabsichtigte Bedeutung einer Rede oder eines Vortrags auf dem Papier die gleiche ist wie live. In jedem Fall kann die Transkription sicherstellen, dass die Botschaft genau aufgezeichnet wird.

Nicht verloren, sondern gefunden in der Übersetzung (und Transkription)

Und ja, auch bei der Transkription geht es um Übersetzung.

Es gibt eine lustige Szene in dem Film Lost in Translation aus dem Jahr 2003, in der Bill Murrays Figur einen Werbespot in Japan dreht und der sehr animierte Regisseur – der Japanisch spricht – mehr als nur ein bisschen wortreich mit seinen Anweisungen ist.

bill murray in lost in translation being very animated for the camera

bill murray in lost in translation being very animated for the camera

Dieser Austausch ist zwar sehr komödiantisch, verdeutlicht aber auch, wie nützlich eine Transkription wäre.

Sicherlich wäre ein zuvorkommenderer Übersetzer hilfreich gewesen, aber eine klare Transkription wäre es auch. Eine, bei der Bill Murrays Figur die Schnörkel des Regisseurs (und die Fehlinterpretationen des Übersetzers) ignorieren und sich stattdessen auf die tatsächlichen Anweisungen konzentrieren könnte.

Die Transkription nimmt die Übersetzung einer anspruchsvollen Fremdsprache, durchbricht ihre Unvertrautheit und liefert die einfachste Form dessen, was jemand einem sagen möchte.

Es gibt Sprachen, die 20 Wörter benötigen, um das auszudrücken, wofür wir vielleicht nur fünf brauchen, oder andersherum. Letztendlich gibt sie Ihnen die Möglichkeit, effizient zu kommunizieren, unabhängig davon, was kommuniziert wird.

Zugang zu den einst Unzugänglichen

Der letzte Zweck, dem die Transkription dient, ist wohl der wichtigste – Zugänglichkeit.

Kommunikation ist für eine offene Gesellschaft von entscheidender Bedeutung. Leider sind manche Menschen in ihrer Hörfähigkeit eingeschränkt oder haben kognitive Behinderungen, die es erforderlich machen, dass Informationen schriftlich vorliegen, damit sie sie aufnehmen können.

Auch für Sehbehinderte ist die Brailleschrift eine Form der Transkription, die ihnen den zuvor unzugänglichen Text buchstäblich an die Hand gibt.

black and white image of the entire Braille alphabet

black and white image of the entire Braille alphabet

Unternehmen, die Audio- oder visuelle Inhalte in einem Textformat zur Verfügung stellen, öffnen sich einem viel breiteren Kundenkreis. Wenn ein Unternehmen dies auch für firmeninterne Materialien tut, kann es auch sicherstellen, dass es nicht gegen die Normen zur Diskriminierung am Arbeitsplatz verstößt.

Im Bildungsbereich bietet die Transkription (und insbesondere das Notieren von Notizen der alten Schule) eine Reihe von Möglichkeiten, um Schülern beim Lernen zu helfen.

Wie wir bereits festgestellt haben, können Menschen mit kognitiven Einschränkungen von der Transkription profitieren. Das Gleiche gilt für Personen mit weniger schwerwiegenden Störungen wie Aufmerksamkeitsdefizit, Legasthenie oder anderen Lernschwächen.

Aber auch die Transkription einer Vorlesung oder einer Diskussion im Klassenzimmer stellt sicher, dass jeder Schüler, unabhängig von seinen Fähigkeiten oder seiner Intelligenz, davon profitiert.

Da die Schüler bei dieser Art der Transkription den Inhalt in ihre eigenen Worte fassen müssen, erweist sich dies als eine effektivere Methode, um zu lernen und den Stoff aufzunehmen. Vor allem, wenn sie den Laptop weglegen und einen Stift in die Hand nehmen.

Cutting Through The Clutter

Die Bereinigung des sprachlichen Unrats, der mit jeder Sprache einhergeht, und die Bereitstellung des Zugangs zu dieser Sprache sind nicht die einzigen Gründe, warum die Transkription so wichtig ist.

Sie liefert auch eine klare Aufzeichnung von Interaktionen, auf die wir später zurückgreifen können.

Betrachten Sie einmal, wie Sie die Chat-Hilfefunktion für den Kundensupport genutzt haben. Oft erhalten Sie nach Abschluss der Interaktion ein Angebot für eine Abschrift des Chats. Das ist hilfreich, wenn Sie in Zukunft darauf zurückgreifen müssen.

Stellen Sie sich vor, wie wertvoll diese Abschrift nach einem Telefonat mit dem Kundendienst ist – oder nach jedem Gespräch, das Sie mit einem anderen Unternehmen führen. Auch wenn wir uns bei der Lösung von Problemen auf Chats, Textnachrichten, E-Mails oder Knowledge Center verlassen, bleibt das Telefon für viele die bevorzugte Kontaktmethode.

Tipp: Sie möchten Ihre Anrufe einfach aufzeichnen und transkribieren? Dafür haben wir eine App entwickelt.

Die Abschrift, die Sie erhalten, ist nicht nur eine Aufzeichnung, sondern auch einfacher zu durchsuchen.

Wenn Sie schon einmal versucht haben, eine Audio- oder Videodatei nach bestimmten Daten zu durchsuchen, dann wissen Sie, wie mühsam das sein kann. Und obwohl die Technologie so allgegenwärtig und zuverlässig wie eh und je ist, kann der Besitz einer „Offline-Kopie“ einer Videopräsentation, eines Webinars oder einer ähnlichen videobasierten Demonstration Sie in Zeiten retten, in denen die Technik nicht funktioniert oder Ihr Publikum eine gedruckte Kopie wünscht.

Unternehmen, die Audio- oder visuelle Inhalte in einem Textformat zur Verfügung stellen, öffnen sich einem viel breiteren Kundenstamm.

Aber welche Unternehmen würden, abgesehen von ein paar flüchtigen Fällen, eine solche Low-Tech-Methode der Dokumentation verwenden?

Wie sich herausstellt, viele.

Betrachten Sie die Notwendigkeit, medizinische Verfahren, Rezepte oder ärztliche Anweisungen sowohl für den Patienten, seine Krankenakte als auch für einen Versicherungsträger zu dokumentieren. Eine unsachgemäße Erfassung von Notizen könnte das Wohlergehen eines Patienten gefährden oder sich negativ auf seine medizinischen Kosten auswirken.

Die andere Branche, die in hohem Maße auf die Transkription angewiesen ist, ist der juristische Bereich.

Wenn man sich die Feinheiten der juristischen Sprache vergegenwärtigt, können die Auswirkungen eines Fehlers enorm sein. Die Transkription stellt sicher, dass unabhängig vom Verfahren alle Beteiligten auf derselben Seite stehen.

Andere Beispiele aus der Industrie sind Marktstudien oder wissenschaftliche Forschung sowie die bereits erwähnten Bereiche Bildung, Geschäftspräsentationen und Schulungen sowie Kundendienst.

A New Frontier of Transcription

Oberflächlich betrachtet mag die Transkription recht einfach erscheinen, und das ist sie auch. Doch neue Fortschritte zwingen uns dazu, die Transkription als etwas zu betrachten, das weit über ein einfaches Text-in-Sprache-Konzept hinausgeht.

Ein solches Beispiel stellt die gesamte Idee der Transkription auf den Kopf, und zwar durch eine tatsächliche Umkehrung. Ein Forscherteam des renommierten Massachusetts Institute of Technology (MIT) hat ein Gerät entwickelt, das in der Lage ist, Verinnerlichtes zu transkribieren – also Dinge, die man innerlich sagt, aber nicht laut ausspricht – und sie in Worte zu verwandeln.

Das System mit dem Namen AlterEgo verwendet Elektroden, um die Nervenmuskeln in Gesicht und Kiefer zu „lesen“, und überträgt diese Signale an eine KI, die angewiesen ist, bestimmte Signale und Wörter miteinander zu verbinden. AlterEgo nutzt auch Knochenleitungs-Kopfhörer, die Informationen an das Innenohr des Benutzers weiterleiten.

Arnav Kapur, ein Doktorand, der die Entwicklungsgruppe leitet, erklärt, der Auslöser für das Projekt sei gewesen, „ein IA-Gerät zu bauen – ein Gerät zur Steigerung der Intelligenz. Unsere Idee war: Könnten wir eine Computerplattform haben, die eher intern ist, die Mensch und Maschine in gewisser Weise verschmilzt und die sich wie eine interne Erweiterung unserer eigenen Kognition anfühlt?“

Während die Technologie zweifellos auf der nächsten Ebene angesiedelt ist und Geräte widerspiegelt, die man bisher nur in der Science-Fiction gesehen hat, sind die potenziellen Anwendungen tief in der modernen Praxis verwurzelt.

Georgia Tech College of Computing Professor Thad Starner hebt mehrere Szenarien hervor, in denen das AlterEgo-System Sinn macht.

Er verweist zunächst auf das Bodenpersonal, das auf Flughäfen Flugzeuge leitet und Gepäck abfertigt. „Sie sind von Düsenlärm umgeben und tragen diese großen Ohrenschützer – wäre es da nicht großartig, in einer Umgebung mit Sprache zu kommunizieren, in der das normalerweise nicht möglich ist?“

Starner meint, dass „das Flugdeck eines Flugzeugträgers oder sogar Orte mit vielen Maschinen, wie ein Kraftwerk oder eine Druckmaschine“ weitere mögliche Einsatzorte für die Technologie darstellen.

Er fügt hinzu, dass selbst jemand, der die Fähigkeit zu sprechen verloren hat, theoretisch immer noch ein gewisses Maß an Stimme behalten könnte.

Im Moment ist das System noch in der Entwicklung, wobei die Forschungsgruppe Daten sammelt und daran arbeitet, die Wissensbasis der KI zu verbessern.

Wenn es um die Transkription geht, kann das nur eines bedeuten – die Fähigkeit, mehr Wörter zu transkribieren.