Interview-Audio-Datei in Text umwandeln via Word oder anders?

JomiHH

JomiHH

Aktives Mitglied
Thread Starter
Dabei seit
06.11.2003
Beiträge
1.679
Reaktionspunkte
10
Ich möchte soooo gern eine Audio-Datei per Spracherkennung in eine Textverarbeitung bekommen, um das endlos lange Abtippen von Interviews zu beschleunigen. Das Diktat-Mikro in Word ist zwar ein Anfang, aber doch auch sehr ungenau bei der Erkennung und Umwandlung. Gibt es vielleicht bessere Programme oder Tipps? Das wäre großartig!
Vielen Dank!
J.
 
Wenn es dir nichts ausmacht einkleinwenig im Terminal zu arbeiten, kannst du das mit Bordmitteln eigentlich recht gut lösen.

Virtuelle Soundkarte installieren -> im Terminal das "ducking" abschalten -> macOS eigene Diktatfunktion starten und Audiofile abspielen.

Lies hier mal -> https://www.macuser.de/threads/wie-schlecht-ist-eigentlich-die-diktatfunktion-gibt-es-vernuenftige-software-fuer-speech2text.856209/page-2#post-10723187

Nimm aber bite gleich BlackHole. Soundflower läuft unter Big Sur nicht mehr.
 
  • Gefällt mir
Reaktionen: UnixCoon
Kann man nicht einfach mit 2 x fn Taste die Diktatfunktion aktivieren und die Audiodatei über Lautsprecher abspielen? Oder ist es das, was zu ungenau ist?
 
Nee, genau das funktioniert leider nicht. Soundflower bzw Blackhole verbinden quasi die Audioausgabe direkt mit dem Eingang.
 
  • Gefällt mir
Reaktionen: UnixCoon
Wenn es dir nichts ausmacht einkleinwenig im Terminal zu arbeiten, kannst du das mit Bordmitteln eigentlich recht gut lösen.

Virtuelle Soundkarte installieren -> im Terminal das "ducking" abschalten -> macOS eigene Diktatfunktion starten und Audiofile abspielen.

Lies hier mal -> https://www.macuser.de/threads/wie-schlecht-ist-eigentlich-die-diktatfunktion-gibt-es-vernuenftige-software-fuer-speech2text.856209/page-2#post-10723187

Nimm aber bite gleich BlackHole. Soundflower läuft unter Big Sur nicht mehr.
Danke! Aber: Ans Terminal traue ich mich nicht - zuviel Respekt davor...
 
Nee, genau das funktioniert leider nicht. Soundflower bzw Blackhole verbinden quasi die Audioausgabe direkt mit dem Eingang.
Ich hab’s mal mit der Diktierfunktion von Word versucht, doch die ist nicht gerade perfekt, leider...
 
Ich hab’s mal mit der Diktierfunktion von Word versucht, doch die ist nicht gerade perfekt, leider..
Word auf einem Mac oder Windows-Rechner?
Laut Signatur ist ein Macbook vorhanden, probiere doch mal die integrierte Diktat Funktion (2 x fn, wie oben geschrieben) von Pages?
Vielleicht auch die Abhörsituation verbessern, falls zB die Audioaufnahme auch über richtige Lautsprecher statt über das Handy o.Ä. abgespielt werden kann.
 
Ich geb mal hier meine Erfahrungen zum Besten:
Aufnahme war ein Interview mit einem Mann, der Dialekt gesprochen hat.


- Wondershare Filmora
- Konnte ich nicht testen: die Funktion gibt es nur in der Abo Version

- MacWhisper
- Ergebnis ungenügend

- Whisper Transkription
- Ergebnis ungenügend

- notta.ai
- Ergebnis nicht ausreichend

- AI Transcription
- Gibt es nur als Abo

- Transkriptor
- Ganz ok,
- allerdings 59,95 $ / Jahr

- AIKO
- Kostenfrei
- Ergebnis fast perfekt


Ich nutze nach dem Test AIKO
Stand: Nov. 2023
 
  • Gefällt mir
Reaktionen: Schnatterente, Sonnenschein11 und Smiley007
Ah, interessant! Bislang fand ich MacWhisper schon ganz ordentlich. Dann werd ich jetzt mal AIKO testen. Danke!
 
  • Gefällt mir
Reaktionen: Franken
Das werde ich direkt einmal testen, auch wenn ich wenig Hoffnung habe

Ich habe ein Interview ca. 6 Stunden mit meiner 90 jährigen Großtante zu geschichtlichen Familienereignissen ihres Lebens.

Auch mit viel Dialekt.
 
  • Gefällt mir
Reaktionen: Franken und Sonnenschein11
Hast du mal Google ausprobiert? Zumindest der Google Assistant schneidet bei Spracherkennung regelmäßig vergleichsweise(!) gut ab.
Bei den Dialekten scheint schwäbisch die meisten Probleme zu verursachen. Daran scheitern fast alle Spracherkennungs-Algorithmen.
Liegt vielleicht an den vielen Verschleifungen dieser Mundart.

Richtig perfekt oder auch nur "gut" hat meines Wissens bei Dialekten bisher keine Spracherkennung abgeschnitten.
Heißt: Wenn das Ausgangsmaterial aus Dialekt besteht, ist es vielleicht weniger Arbeit, das ganze Zeug einfach abzutippen.
 
  • Gefällt mir
Reaktionen: dg2rbf
Meine Arbeitsweise hab ich etwas angepasst.
Den Ton per AIKO in Text übertragen und dann jeweils eine Frage und Antwort von ChatGPT in "vernünftiges" Deutsch zu übersetzen. :giggle:
Das funktiniert sehr gut.
Allerdings muss ich dann doch immer wieder in die Audio Datei reinhöre
Um das besser handeln zu können bräuchte ich eine Software, bei der ich z.B. Marker setzen kann und diese mit einer kurzen Notiz versehen kann, um was es an der Stelle geht.

Kennt jemand so eine App bzw Software?
 
Zurück
Oben Unten