Hi
leider schaffe ich es nicht, über die Diktat Funktion in TextEdit, automatisch gesprochenen Text in eine brauchbare Textdatei zu transkribieren. Ich habe zwei Anwendungsfälle:
a) Ich spreche und TextEdit nimmt den Ton über das interne Mikrofon meines MacBooks auf
b) Ich lasse TextEdit das Audio eines Videos transkribieren und verwende dazu Soundflower als virtuelle Audiokarte
Ich erhalte Resultate, die aber nicht befriedigend sind.
Fall a), gesprochener Text über das interne Mikrofon:
Ich muss schon sehr deutlich und langsam sprechen damit TextEdit einige der Wörter korrekt notiert. Von korrekten Sätzen ist das jedoch weit entfernt. Ratsam ist es wohl, ein externes Mikrofon anzuschliessen, aber ist das auch zwingend? Sind die Ergebnisse mit einem externen Mikrofon dann brauchbar? Was habt ihr für Erfahrungen?
Fall b), Transkription einer englischen Vorlesung in Videoformat.
Hierfür habe ich Soundflower installiert, dass ich in einem Programm wie Audacity oder VLC als direkte Audioausgabe zu TextEdit nutzen kann. Soundflower funktioniert auch wunderbar, aber die Transkriptionsergebnisse sind noch entteuschender als unter Punkt a.
Ich habe verschiedene Englisch-Voreinstellungen (Canadian Englisch, US English, UK English etc.) ausprobiert und die besten Ergebnisse erhalte ich bei meinem britischen Prof mit Canadian English. Auch habe ich beide möglichen Varianten; offline und online Diktat getestet. Bei letzterem werden die Daten an Apple gesendet und von einem Server übersetzt. Das hat besser geklappt als die offline Einstellung. (Wieso Apple für die Onlne-Transkription meine gespeicherte Kontakte-Liste haben will ist mir nebenbei gesagt ein unangenehmes Rätsel.)
Zwei Schwierigkeiten in diesem Case: Erstens werden nur einige Sekunden beziehungsweise wenige Zeilen transkribiert und danach "hängt" sich TextEdit auf. Es scheint als rechnet hier mein MacBook seine 8GB RAM in den Abgrund. Zweitens ist das was TextEdit aus dem Video versteht noch kreativer und lustiger als im "Fall a" mit der Mikrofonaufnahme. Als würde man random einzelne Wörter aus einem Lexikon zusammenwürfeln und dann behaupten das ergäbe irgend einen Sinn. TextEdit schreibt ein paar Wörter, löscht diese wieder, ersetzt sie durch neue, löscht wieder, schreibt wieder was neues und hat in der Zeit in der 5 Sätze gesprochen wurden gerade einmal eine Zeile geschrieben. Also total unbrauchbar wenn es um Kontext geht.
Bis jetzt habe ich nur Berichte über die Tauglichkeit dieser Transkriptionslösung gefunden. Ich bin überzeugt, die richtigen Audioeinstellungen getroffen zu haben; TextEdit hört ja in den ersten Sekunden mit. Hat jemand eine Idee woran das liegen könnte, dass das mein Ergebnis trotzdem zu wünschen lässt? Reden ich und mein Prof so dermassen undeutlich? Sind die Anforderungen für mein MacBook (Late2009, 8GB, 2GHz Intel Core 2 Duo 64bit) zu hoch oder steckt die Diktat-Funktion von TextEdit noch in den Kinderschuhen? Muss nach jedem Satz pausiert werden und TextEdit der dem MacBook Zeit zu rechnen gelassen werden? Sind eine Minute aneinanderhängender Text einfach zu viel?
Ich danke für Tipps und Rückmeldungen
leider schaffe ich es nicht, über die Diktat Funktion in TextEdit, automatisch gesprochenen Text in eine brauchbare Textdatei zu transkribieren. Ich habe zwei Anwendungsfälle:
a) Ich spreche und TextEdit nimmt den Ton über das interne Mikrofon meines MacBooks auf
b) Ich lasse TextEdit das Audio eines Videos transkribieren und verwende dazu Soundflower als virtuelle Audiokarte
Ich erhalte Resultate, die aber nicht befriedigend sind.
Fall a), gesprochener Text über das interne Mikrofon:
Ich muss schon sehr deutlich und langsam sprechen damit TextEdit einige der Wörter korrekt notiert. Von korrekten Sätzen ist das jedoch weit entfernt. Ratsam ist es wohl, ein externes Mikrofon anzuschliessen, aber ist das auch zwingend? Sind die Ergebnisse mit einem externen Mikrofon dann brauchbar? Was habt ihr für Erfahrungen?
Fall b), Transkription einer englischen Vorlesung in Videoformat.
Hierfür habe ich Soundflower installiert, dass ich in einem Programm wie Audacity oder VLC als direkte Audioausgabe zu TextEdit nutzen kann. Soundflower funktioniert auch wunderbar, aber die Transkriptionsergebnisse sind noch entteuschender als unter Punkt a.
Ich habe verschiedene Englisch-Voreinstellungen (Canadian Englisch, US English, UK English etc.) ausprobiert und die besten Ergebnisse erhalte ich bei meinem britischen Prof mit Canadian English. Auch habe ich beide möglichen Varianten; offline und online Diktat getestet. Bei letzterem werden die Daten an Apple gesendet und von einem Server übersetzt. Das hat besser geklappt als die offline Einstellung. (Wieso Apple für die Onlne-Transkription meine gespeicherte Kontakte-Liste haben will ist mir nebenbei gesagt ein unangenehmes Rätsel.)
Zwei Schwierigkeiten in diesem Case: Erstens werden nur einige Sekunden beziehungsweise wenige Zeilen transkribiert und danach "hängt" sich TextEdit auf. Es scheint als rechnet hier mein MacBook seine 8GB RAM in den Abgrund. Zweitens ist das was TextEdit aus dem Video versteht noch kreativer und lustiger als im "Fall a" mit der Mikrofonaufnahme. Als würde man random einzelne Wörter aus einem Lexikon zusammenwürfeln und dann behaupten das ergäbe irgend einen Sinn. TextEdit schreibt ein paar Wörter, löscht diese wieder, ersetzt sie durch neue, löscht wieder, schreibt wieder was neues und hat in der Zeit in der 5 Sätze gesprochen wurden gerade einmal eine Zeile geschrieben. Also total unbrauchbar wenn es um Kontext geht.
Bis jetzt habe ich nur Berichte über die Tauglichkeit dieser Transkriptionslösung gefunden. Ich bin überzeugt, die richtigen Audioeinstellungen getroffen zu haben; TextEdit hört ja in den ersten Sekunden mit. Hat jemand eine Idee woran das liegen könnte, dass das mein Ergebnis trotzdem zu wünschen lässt? Reden ich und mein Prof so dermassen undeutlich? Sind die Anforderungen für mein MacBook (Late2009, 8GB, 2GHz Intel Core 2 Duo 64bit) zu hoch oder steckt die Diktat-Funktion von TextEdit noch in den Kinderschuhen? Muss nach jedem Satz pausiert werden und TextEdit der dem MacBook Zeit zu rechnen gelassen werden? Sind eine Minute aneinanderhängender Text einfach zu viel?
Ich danke für Tipps und Rückmeldungen