Diktat Transkription mit TextEdit

Masefati

Mitglied
Thread Starter
Dabei seit
03.02.2006
Beiträge
65
Reaktionspunkte
1
Hi

leider schaffe ich es nicht, über die Diktat Funktion in TextEdit, automatisch gesprochenen Text in eine brauchbare Textdatei zu transkribieren. Ich habe zwei Anwendungsfälle:
a) Ich spreche und TextEdit nimmt den Ton über das interne Mikrofon meines MacBooks auf
b) Ich lasse TextEdit das Audio eines Videos transkribieren und verwende dazu Soundflower als virtuelle Audiokarte

Ich erhalte Resultate, die aber nicht befriedigend sind.

Fall a), gesprochener Text über das interne Mikrofon:
Ich muss schon sehr deutlich und langsam sprechen damit TextEdit einige der Wörter korrekt notiert. Von korrekten Sätzen ist das jedoch weit entfernt. Ratsam ist es wohl, ein externes Mikrofon anzuschliessen, aber ist das auch zwingend? Sind die Ergebnisse mit einem externen Mikrofon dann brauchbar? Was habt ihr für Erfahrungen?

Fall b), Transkription einer englischen Vorlesung in Videoformat.
Hierfür habe ich Soundflower installiert, dass ich in einem Programm wie Audacity oder VLC als direkte Audioausgabe zu TextEdit nutzen kann. Soundflower funktioniert auch wunderbar, aber die Transkriptionsergebnisse sind noch entteuschender als unter Punkt a.
Ich habe verschiedene Englisch-Voreinstellungen (Canadian Englisch, US English, UK English etc.) ausprobiert und die besten Ergebnisse erhalte ich bei meinem britischen Prof mit Canadian English. Auch habe ich beide möglichen Varianten; offline und online Diktat getestet. Bei letzterem werden die Daten an Apple gesendet und von einem Server übersetzt. Das hat besser geklappt als die offline Einstellung. (Wieso Apple für die Onlne-Transkription meine gespeicherte Kontakte-Liste haben will ist mir nebenbei gesagt ein unangenehmes Rätsel.)
Zwei Schwierigkeiten in diesem Case: Erstens werden nur einige Sekunden beziehungsweise wenige Zeilen transkribiert und danach "hängt" sich TextEdit auf. Es scheint als rechnet hier mein MacBook seine 8GB RAM in den Abgrund. Zweitens ist das was TextEdit aus dem Video versteht noch kreativer und lustiger als im "Fall a" mit der Mikrofonaufnahme. Als würde man random einzelne Wörter aus einem Lexikon zusammenwürfeln und dann behaupten das ergäbe irgend einen Sinn. TextEdit schreibt ein paar Wörter, löscht diese wieder, ersetzt sie durch neue, löscht wieder, schreibt wieder was neues und hat in der Zeit in der 5 Sätze gesprochen wurden gerade einmal eine Zeile geschrieben. Also total unbrauchbar wenn es um Kontext geht.

Bis jetzt habe ich nur Berichte über die Tauglichkeit dieser Transkriptionslösung gefunden. Ich bin überzeugt, die richtigen Audioeinstellungen getroffen zu haben; TextEdit hört ja in den ersten Sekunden mit. Hat jemand eine Idee woran das liegen könnte, dass das mein Ergebnis trotzdem zu wünschen lässt? Reden ich und mein Prof so dermassen undeutlich? Sind die Anforderungen für mein MacBook (Late2009, 8GB, 2GHz Intel Core 2 Duo 64bit) zu hoch oder steckt die Diktat-Funktion von TextEdit noch in den Kinderschuhen? Muss nach jedem Satz pausiert werden und TextEdit der dem MacBook Zeit zu rechnen gelassen werden? Sind eine Minute aneinanderhängender Text einfach zu viel?

Ich danke für Tipps und Rückmeldungen
 
Also ich hab's schon lange aufgegeben, meinem iMac was zu diktieren. Und ich bin Vielschreiber (Journalist). Es soll notwendig sein, mit seinem Schreibprogramm eine Schulung zu machen, damit es sich auf den Sprecher einstellen kann. Zumindest machen es die prof. Programme, die man kaufen kann, so.
 
Diese Antwort habe ich befürchtet. Ein Schreibprofi der Die Diktierfunktion aufgegeben hat ;)
Kann ich das so verstehen, dass Transkriptionssoftware im Allgemeinen noch nicht so weit ist gesprochene Sprache auf einem vernünftigen Niveau zu notieren? Bsp Siri versteht mich auch nicht wirklich..
 
Danke dass du dir die zeit genommen hast diesen horrend langen text zu lesen :D
 
Ich glaube Transkriptionssoftware kann das schon recht gut.
Nur leider ist die Didaktfunktion von Siri eben nur ein lieblos implementiertes Gimmick und keine ernsthafte Software. Damit wird eine kleine SMS während der Fahrt korrekt "getippt", aber nicht ein komplettes Gespräch. :)
 
Bei siri, text edit, google docs. Ich glaub in word habe ich es auch probiert. Klappt alles nicht so richtig. Sind aber wie du sagst alles nur applikationen die halt so nebenbei auch noch eine diktierfunktion drin haben. Kann man denn von bezahlter spezial-transkriptionssoftware mehr erwarten? Hat schon jemand ein hurra erlebnis gehabt und kann was empfehlen was
 
Man muss sich jedoch eingestehen, dass niemand so perfekt spricht wie vielleicht ein Nachrichtensprecher. Doch ob's bei dem klappt, das entzieht sich meiner Kenntnis. Übrigens habe ich Siri nach dem ersten Versuch sofort wieder abgeschaltet. Ein Gimmick, das mich schnell genervt hat und das ich nicht benötige und noch nie vermisst habe.
 
Das Hauptproblem ist die Klarheit einer Aufnahme! Eine Untersuchug mit einem Program wie Praat (eine wiss. Sprachanalysesoftware / open source auch für den Mac - das Arbeiten damit ist aber recht komplex, Einarbeitung erforderlich aber dann ist es ein "Schweizer Offiziersmesser" für die Sprachanalyse), kann zeigen wie gut das setup ist. Für gewöhnlich spricht ein Mensch anders wenn er diktiert, als wenn er "normal" spricht und die Klarheit der Sprache ist schon recht entscheidend. Die Geschwindigkeit mit der ein Computer Sprache in geschriebenen Text konvertiert ist auch eine Frage der Rechenleistung - insbesondere wenn einfach "drauf los geredet" wird.

Eine Diktatsoftware wird in der Regel trainiert (sprachliche Eigenarten die Menschen einfach überhören, stören eine Maschine manchmal erheblich, z.B. sprechen mit Akzent!) um Fehler zu minimieren, das ist oft entscheidend. Beiläufiges Hören können Maschinen noch nicht wirklich.

Eine rechtliche Anmerkung: unangekündigte Tonaufnahmen ohne Zustimmung aller Betroffenen im öffentlichen Raum sind wie Fotos zu betrachten… (Ich schreibe dies nicht aus "Klugschei…ergründen", bitte informieren!)
 
Dragon ist meiner Erfahrung nach ganz brauchbar. Gutes Training ist aber erforderlich. Der Erfolg hängt aber auch von der Art der Worte abhängig. Fremdorte, Fachausdrücke u.ä ereschweren die Arbeit. Die Erfolge sind am grössten, wenn die Texte quasi immer ähnlich sind. Das Problem bei Siri sind eher die Online Lexika.
 
Dragon wurde mir heute auch von anderer seite empfohlen. Dazu die selbe aussage, die software sei anzutrainieren. Bei vorlesungsvideos wie in meinem fall, sei es fast unumgänglich das gehörte selbst nochmal zu wiederholen und dann die eigene stimme transkribieren zu lassen.
Das hilft mir schon mal sehr weiter wenn alle die selbe software empfehlen. Den kauf muss ich mir bei den, für mich als non profi, doch eher hohen preisen allerdings noch überlegen.

Meine Frage wurde damit beantwortet. Danke leute! :)
 
Zurück
Oben Unten