Anzeige
Anzeige
Lead Wolf Audio To Text Hg Maagentalila Rgb 1600X900
How to Audio Kolumne

How to: Audio to Text

Wie macht man aus einem Audio am schnellsten und zuverlässigsten einen lesbaren Text? Das ist inzwischen eine vergleichsweise einfache Sache geworden. Im heutigen How to steht, warum.

Anzeige
Anzeige

Jeder, er es schon mal gemacht hat, weiß wie mühsam das ist: Einen nur aufgenommenen Text verschriftlichen. Das sogenannte Transkribieren ist in vielen Fällen sehr zeitaufwändig.

Sprach-Software ist mittlerweile nicht nur deutlich kostengünstiger, sondern auch wesentlich zuverlässiger geworden. Noch vor wenigen Jahren war man bei einer solchen Software oft genug Zufälligkeiten ausgeliefert. Inzwischen hingegen kommt man in vielen Fällen zu sehr ordentlichen Ergebnissen, auch wenn diese Resultate von Perfektion noch immer ein gutes Stück entfernt sind (Jeder, der Siri oder andere Sprachassistenten am Handy nutzt, weiß, was gemeint ist).

Das könnte dich auch interessieren: How to: Audio im Text

Wie funktioniert das?

Browserbasiert. Soll heißen: Man braucht keinerlei Installationen am Rechner, alles passiert online. Man lädt eine Audio-Datei auf den Server des Anbieters hoch und bekommt - je nach Länge des Files - nach vergleichsweise kurzer Zeit ein fertiges Transkript.

Howt O
(Screenshot: Jakubetz)

Faustregel: Für ein Audio sollte man circa zehn Minuten einplanen; ich bin bis jetzt kaum über längere Zeiten gestolpert. Die Texte können dann wahlweise im Browser editiert oder gleich als beispielsweise Word-Doc geladen werden.

Anzeige

Hochgeladen kann bei den meisten Anbietern nahezu alles, was irgendwie Audio ist. Das heißt, auch Videos mit einer funktionierenden Tonspur. Oder auch ein File direkt aus dem Netz - das funktioniert dann per Link. Wie oben im Screenshot zu sehen: Sinnvoll ist es, wenn man seine vorhandenen Cloud-Dienste mit dem Anbieter (in diesem Fall: Trint) verknüpft, dann funktionieren die Dinge noch schneller und reibungsloser.

Wovon hängt die Qualität des Ergebnisses ab?

Naturgemäß erst einmal von dir selbst. Genauer gesagt: von der Qualität deines Audio-Files. Je klarer die Aufnahme, je deutlicher die Personen sprechen, desto besser sind die Resultate. Hintergrundgeräusche, starke Dialekte oder nuschelnde Menschen bringen die Software zur Verzweiflung. Von dem her lässt sich diese Frage nicht pauschal beantworten. Die Antworten würden schwanken zwischen "verblüffend gut" und "kaum zu gebrauchen".

Howto
(Screenshot: Jakubetz)

Wie viel Arbeit spare ich mir?

Siehe oben. Bei einer guten Aufnahme gibt es nicht mehr viel zu korrigieren und dann ist auch die Zeitersparnis beachtlich. Trotzdem gibt es Dinge, die eine Software nicht kann und bis auf Weiteres auch nicht können wird: Groß- und Kleinschreibung, Satzbeginn und Satzanfang beispielsweise. Das sind die Dinge, die erfahrungsgemäß die meiste Arbeit machen.

Was kostet das?

Die beiden Marktführer Amberscript und Trint bieten ähnliche Preismodelle an. Der Tarif Pay as you go rechnet stundenweise ab, hier ist Amberscript etwas teurer als Trint. Dafür hat Amberscript eine minutengenaue Abrechnung im Portfolio, das gibt es bei Trint nicht. Zudem bieten beide noch monatliche Abos ab, deren Preise von Umfang und Nutzern abhängt. Nachdem jeder seine eigenen Bedürfnisse hat, gibt es hier auch keine Empfehlung.

Hinweis: In diesem How to geht es nicht um installierbare Software. Bei Preisen zwischen 150 und 300 Euro rentieren sie sich nur für Vielanwender. Das soll aber keineswegs etwas über deren Qualität aussagen.

Lead 4 Cta Mock Up 1200X1200 V2 92
Wer analysiert, führt!

Wann steigt der Kunde aus? Eine Website ohne Tracking kann funktionieren, muss aber nicht. Wie Analytics dabei hilft, den Kunden besser zu verstehen und die Basics des Trackings: Jetzt im aktuellen LEAD Bookazine 2/2019.

Anzeige
Verlagsangebot
Anzeige
Aktuelle Stellenangebote
Alle Stellenangebote
Anzeige