Spracherkennung am Computer

Annie Hilator

Annie Hilator

Aktives Mitglied
Thread Starter
Dabei seit
18.10.2009
Beiträge
1.361
Reaktionspunkte
1.526
Hallo,

kurze Frage in die Runde: benutzt hier jemand Spracherkennungsprogramme am Computer, und wenn ja, welche?`Frage bezieht sich sowohl auf Mac als auch auf Windows (gibt es sowas eigentlich für Linux auch?).

Habe mal soeben die Spracherkennung von Windows 7 getestet, da ich gerade an einem Windows 7-Notebook sitze. Huiuiui, grausam.......

Kleine Kostprobe:

"Hallo,

Können so Frage in die Runde: Industrieland Spracherkennungsprogramme am Computer, und wenn ja, welche? Frage bezieht sich sowohl auf Merck als auch auf Windows Klammern gibt es sowas eigentlich für Linux auch?).

Aber mal so eben die Spracherkennung von Windows sieben getestet, da ich gerade an einem Windows sieben Notebook sitzen. Krause.... "

Bewährte Microsoft-Qualität halt..... :teeth:
 
Moin,

darf ich jetzt daraus auf die Deutlichkeit Deiner Aussprache schließen?
:Pfeif:
 
Moin,

darf ich jetzt daraus auf die Deutlichkeit Deiner Aussprache schließen?
:Pfeif:

:Oldno:

Habe das eingebaute Mikrofon benutzt, laut und deutlich gesprochen (der Nachbar wird im Zweifelsfall auch denken, dass ich was an den Ohren habe) und auch immer nur drei oder vier Worte auf einmal, dann gewartet. Einrichtung der Spracherkennung ist offiziell abgeschlossen. Ergebnis sieht man ja....... :rolleyes:
 
Bewährte Microsoft-Qualität halt..... :teeth:

Bewaehrtes dummes Geschwaetz halt. Spracherkennung funktioniert nur ordentlich wenn das System vorher auf den Sprecher anstaendig trainiert wird.Dragon NaturallySpeaking ist wohl ganz brauchbar.

Was du deutlich nennst ist fuer das System noch lange nicht deutlich.
 
Hallo,

kurze Frage in die Runde: benutzt hier jemand Spracherkennungsprogramme am Computer, und wenn ja, welche?`Frage bezieht sich sowohl auf Mac als auch auf Windows (gibt es sowas eigentlich für Linux auch?).

Habe mal soeben die Spracherkennung von Windows 7 getestet, da ich gerade an einem Windows 7-Notebook sitze. Huiuiui, grausam.......

Kleine Kostprobe:

"Hallo,

Können so Frage in die Runde: Industrieland Spracherkennungsprogramme am Computer, und wenn ja, welche? Frage bezieht sich sowohl auf Merck als auch auf Windows Klammern gibt es sowas eigentlich für Linux auch?).

Aber mal so eben die Spracherkennung von Windows sieben getestet, da ich gerade an einem Windows sieben Notebook sitzen. Krause.... "

Bewährte Microsoft-Qualität halt..... :teeth:


welchen Dialekt sprichst du? :crack:

Zu deiner Frage: ich habe schon vor zehn, zwölf Jahren am Mac das Programm ViaVoice von IBM verwendet, und das hat schon damals jedes Wort korrekt erkannt. Da ich viele Texte schreibe, hatte ich mir eine Erleichterung versprochen, wenn ich einfach diktiere. Das Problem war aber nicht die Spracherkennung, sondern der Kaudawelsch den ich diktiert habe. Ddas Programm hat alles richtig erkannt, aber die Nachbearbeitung aus dem Erkannten einen lesbaren Text zu machen hat mindestens so lange gedauert wie den Text gleich zu tippen. Man kann sicher lernen, druckreif zu diktieren, aber das war mit dann den Aufwand nicht wert.
 
Dragon Dictate for Mac. Ich benutze es seit 3 Wochen, um Fließtext einzusprechen. Klappt gut. Einschränkung: bei vielen Englischen Wörten muss man jedes einzelne Wort eintrainieren. Das dauert natürlich letztlich 20-30 Stunden für rund 500 Wörter.

Aber wer sehr viel schreiben muss, kommt meines Erachtens kaum drum rum. Die 10 Finger sind nun mal nach 2 Stunden müde. Aber mit Dictate kann ich 10 Stunden am Stück arbeiten.

Für mich wird es wohl langsam unverzichtbar. Aber ich schätze, dass es erst in 3-4 Jahren so weit sein wird, dass man echt Zeit spart. Die müssen nämlich weg von der Einzelworterkennung hin zur Satzerkennung (also Grammatik). Sonst wird das nichts.

Cinober
 
Hust ... Dragon ist schon gut, nutzt eine Bekannte auch intensiv. Sie musste dem Teil auch erst Sprechen und Verstehen beibringen.

Der Satz hier ist schiere Theorie:
Aber ich schätze, dass es erst in 3-4 Jahren so weit sein wird, dass man echt Zeit spart.

da er schon seit Jahrzehnten ziemlich wörtlich in der EDV-Welt kursiert. :)

Ja, es wurde immer besser, es ist noch nicht perfekt und da ist noch Luft nach oben. Ich glaube aber nicht, dass es jetzt wirklich mal schnell geht. :)
 
Versuchen wir doch mal ein Diktat am Computer mit Siri. :D

Es liegt wohl eher daran, dass ich nicht so sprechen, wie ich schreiben würde. Und dass mich mein Computer nicht zu verstehen kann wie ich es gerne hätte.
Vor einigen Jahren gab es zwar noch keinen Dienst keine diktiere Funktion, aber dafür gab es die Möglichkeit am Computer Befehle zu sprechen. Das hat zwar auch nicht wirklich funktioniert, aber immerhin war es eine nette Spielerei. Wenn auch nicht mehr.

Ich stelle gerade fest, dass es ziemlich ungewohntes zu zusprechen. Und anscheinend Muschel ich auch ein wenig. ;)
 
:Oldno:

Habe das eingebaute Mikrofon benutzt, laut und deutlich gesprochen ...

Genau das ist das Problem. Beim Diktieren erwacht im Menschen der Drang, er muesse nun auf unnatuerliche Weise deutlich und laut sprechen.
Beispielsweise werden Phoneme so ausgesprochen wie sie geschrieben werden, Konsonanten ueberstark betont und Silben falsch intoniert. Da wird aus [ˈʃpɛːtɐ] schon mal gern [ˈʃpɛːtɛʁ] oder aus [ˈɡeːən] > [ˈɡeːhən].
Auch sind sich manche nicht ueber ihre sprachlichen, und insbesondere dialektalen, Idiosynkrasien bewusst.
Das bedeutet nicht, dass das System dann perfekt funktioniert, aber zumindest schliesst man dadurch Fehlerquellen im Basisbereich aus.
 
Ich habe das Programm Dictate jetzt intensivst (!!) benutzt innerhalb von 3 Wochen. Dass es noch nicht perfekt(er) funktioniert, liegt m.E. an der Programmierung, nicht undbedingt an der fehlenden Hardware-Geschwindigkeit, die ja ihrerseits verantwortlich ist für die programmiertechnischen Möglichkeiten. Dictate analysiert nur das Einzelwort. Deshalb muss es in allen seinen Variationen im Datenpool drin stehen. Ich habe rund 170 000 Wörter drin - im Deutschen. Davon sind schon ein Großteil reine Varianten eines einzigen Wortes, z.B.: zerknirscht, zerknirschte, zerknirschtes, zerknirschter, zerknirschten, zerknirschtem, Zerknirschte, Zerknirschten, usw. Damit sinkt die tatsächliche Wortauswahl an Stammwörtern auf am Ende ein paar Tausend Wörter. Das ist eindeutig zu wenig. Aber anscheinend ist Hardwaremäßig nicht mehr drin im Moment, weil ja die Wandlung quasi in Echtzeit geschieht. Und bei einem schnellen Sprachfluss muss das Programm ja jedes Wort erst einmal mit einer FFT in seine Einzelsinus-Wellen zerlegen und dann in Libraries nachsehen, was dieses Wort bedeuten könnte. In 5 Jahren ist das ganz vielleicht doppelt oder viermal so schnell, hoffe ich.

Aber Dragon macht das Programm selber recht unkomfortabel. Das könnte man schon jetzt massiv beschleunigen. Aber keiner macht das. Programmierer haben auch nur eine begrenzte Fähigkeit, Prozesse zu gliedern oder sie richtig aufzureihen. Da muss ja eine Menge Kommunikationswissen dahinter stehen. Und da hapert's es anscheinend. Dragon könnte schon jetzt m.E. ein Vielfaches an Zeit einsparen, wenn das Programm "sinnvoll" konstruiert wäre, z.B. beim "Wortschatz-Training". Das ist so umständlich gemacht, dass man Aggressionen bekommt. Da wird kostbare Zeit einfach durch umständlichste Bedienung und fehlende Hilfstellung zunichte gemacht. Wenn man z.B. ein neues englisches Wort eintrainieren will, dabei aber einen Fehler macht (falsche Vokale usw.), dann braucht man zu viel Zeit, um es zu löschen und eine bessere Version zu erstellen. Das ist so umständlich gemacht, dass man laut aufschreien könnte. Man muss das Wort aufsuchen, markieren, einen entfernten Löschbutton betätigen und dann einen Button drücken, der ein neues Wort bilden soll, das bereits verwendete Wort wieder eintippen (ohne Fehler), und dann wieder mit dem Eintrag des phonetischen Klangs des Wortes beginnen. Da wird man zur Furie, weil das um Faktor 10 schneller ginge. Ein Computer ist doch gerade dafür da, Dinge einfacher für den Nutzer zu machen. Die Dragon-Leute machen es einem aber gerade schwer. Völlig überflüssig - so wie beim Mann die Brustwarzen. Das ist so schade, dass da niemand mehr eingreift in der Firma.

Es ist wie mit allem. Auch Affen können ein Erfolgs-Musical komponieren, es fragt sich nur, wie lange es dauert, bis es fertig ist. Das hat schon Hoimar von Ditfurth (schreibt man den so?) geschrieben. Wissen ist nun mal Macht.

Cinober
 
Ich verwende Dragon Naturally Speaking 12 (am Macbook über Parallels) und bin sehr zufrieden. Bei Spracherkennung mit Dragon ist das A und O ein ordentlich trainiertes Benutzerprofil. Das kostet am Anfang Zeit, aber das Ergebnis ist es wert.
 
Zurück
Oben Unten