iOS So schade: Diktieren wird schwer gemacht

Cinober

Aktives Mitglied
Thread Starter
Dabei seit
16.01.2012
Beiträge
1.354
Reaktionspunkte
192
Habe jetzt 3 Wochen mit meinem iPhone 12 Mini hantiert. Bin durchweg begeistert von der Software und dem System an sich. So wünsche ich mir schnelles Arbeiten und schnelles Reagieren auf meine Umwelt. Ich komme von Blackberry.

Aber: es gibt einen kleinen Pferdefuß (obwohl ich Pferde ansonsten gerne mag): beim Diktieren (durch Druck auf das Mikrofon-Symbol in der virtuellen Tastatur) erkennt die App zwar recht gut Deutsch, aber bei Eigennamen hakelt es gewaltig. Klar, woher soll eine App alle Eigennamen der Welt kennen? Aber bei einem "Wort zu Text" - System muss eine Lernfunktion eingebaut sein, sonst kann man nichts damit anfangen. Wenn ein Rechtsanwalt 30 Briefe an einen Klienten z.B. namens "Cindy Berger" oder "Thomas de Maizière" schreiben muss, wird er wahnsinnig. Bei dem Zweiten schreibt das System: "Thomas Du mir sehr". Und bei der Ersteren "Sind die Berger".

Bei PC-Diktiersystemen kann man Wörter "anlernen", damit man sie ab da flott benutzen kann. So habe ich es seit 10 Jahren auf meinen MacBooks gemacht. Das ist zuerst mal mühselig (bis zu 2000 Einträge), aber erspart einem später Tonnen von Zeit. Und das müsste doch im Jahr 2021 auf einem Smartphone auch möglich sein. Denn das hat man ja dauernd dabei - im Gegensatz zum PC. Die Prozessoren sind doch so schnell geworden, viel schneller als vor 10 Jahren.

Hat jemand das gleiche Problem mit dem iPhone? Gibt es eventuell Abhilfe? Dann bitte hier melden.

Cinober
 
Ist ja mysteriös, bei mir werden sowohl "Cindy Berger" als "Thomas de Maizière" auf Anhieb korrekt erkannt. Ist bei der Aussprache vielleicht sehr sensibel. Jedenfalls werden Eigennamen aus den Kontakten wohl grundsätzlich besser erkannt. Wäre also ein Versuch für Dich wert, Dir wichtige Eigennamen als Kontakte anzulegen.
 
  • Gefällt mir
Reaktionen: Cinober
Aber bei einem "Wort zu Text" - System muss eine Lernfunktion eingebaut sein, sonst kann man nichts damit anfangen.
Sag es ihr doch einfach...

Hey Siri.
"Lerne, wie [Kontaktname] ausgesprochen wird"

Nach meiner Erfahrung erkennt sie den Namen dann auch besser.
Allerdings meintest du die diktierfunktion, die ist ja nochmal etwas leicht anderes.
 
  • Gefällt mir
Reaktionen: Cinober
Ich spreche eigentlich "astreines" Hochdeutsch - aus beruflichen Gründen. Aber ich bekomme auch nach 10 Versuchen mit Pierre Brice "Pierre Bries" und mit Edward Heath "Edward hieß". Cindy Berger habe ich jetzt ein paar Mal tatsächlich gekriegt. Aber dann nach dem 5. Mal kommt "Sind die Berger". Und danach wieder richtig.

Also, ich sehe da kein richtiges System dahinter. Das Programm müsste mich bitten, den verkorksten Begriff per Buchstabeneingabe zu verifizieren. Dann würde das Ganze klappen. Aber so.

Mein letzter Versuch nach vielen verschiedenen Anläufen:

Pierre Bries
Edward hieß
Sind die Berger
Thomas de Maizière

Also ein einziger Treffer trotz zig Anläufen. Das muss Apple verbessern. Unbedingt. Wenn es Bitcoins gibt, muss es auch Sprachsysteme geben. Finde ich. Wobei das Letztere für mich wichtiger wäre.

Cinober
 
Ich hätte jetzt aber auch eigentlich gedacht, dass genau solche lernenden Algorithmen der Grund für diese ganzen "Neural Engine" und Co getauften Zusatzchips in den Axx-Prozessoren sind...
 
Bei mir ist das System Englisch (brit. English), da erkennt das System angelsächsische Namen zu nahezu 100%, aber auch Französische (de Maiziere) werden fast immer erkannt. Vielleicht ist Deine Ausprache "zu Deutsch" - mal versucht die Namen wie ein Muttersprachler auszusprechen? Die Frage wäre, ob z.b. ein Muttersprachler den TE bei Namen problemlos verstünde… (Keine Gemeinheit, aber als Zweisprachler mit recht viel Übersetzungspraxis, auch im Dolmetschen, kann ich nachvollziehen, wenn ein Programm da "hängt". Anlernen funktioniert nur dann, wenn es mit einer gewissen Fehlertoleranz in der Aussprache klar kommt - das ruft dann aber oft wieder Probleme bei unbekannten Ausdrücken hervor… Erst wenn die KI selbst denkt werden sich solche Fehler vielleicht vermeiden lassen.)
 
Ich habe mal mit dem Namen etwa tief und selige Versuche gemacht. (Der vorhergehenden Satz sollte mit Spracheingabe heißen: ich habe mal mit dem Namen Edward hieß unzählige Versuche gemacht).

hier das Ergebnis meiner Bemühungen:


Hat wohl hier

Edward hier

Edward hieß

Edward hieß

@Word hier

Apple Health

Emojis

Edward hieß

Edwin hieß

Er wurde hieß

Das waren jetzt die Ergebnisse für Edward Heath, die ich vor ein paar Sekunden aufgesprochen habe.

Also ich glaube nicht, dass das an meiner Aussprache liegt. Ich spreche recht gut Englisch, auch amerikanisches
Englisch. Habe in New York gelebt.
ich glaube, es liegt an Apple. Ich habe mir vorhin einmal in den Einstellungen durchgelesen, wie Apple versucht die Spracherkennung hoch zu schrauben. Hochinteressant. Und da ist noch ein weiter Weg zu gehen.

Ich benutze auf meinen Computern auch Dragon Dictate. Dort kann ich jeden Namen, egal aus welcher Sprache, anlernen. Und ich glaube, das ist der einzige Weg, der gangbar ist.

Cinober
 
Hat jemand das gleiche Problem mit dem iPhone? Gibt es eventuell Abhilfe? Dann bitte hier melden.

Ich habe schon immer das Problem mit dem Namen meiner Tochter und die ist jetzt 24 Jahre. Sie heißt Janne (wie Anne nur mit J davor gesprochen) und dieser Name wird echt oft von mir diktiert und immer ist er falsch geschrieben. Natürlich ist meine Tochter in den Kontakten gespeichert, auch als Tochter. Ich habe schon gefühlt ein paar Tage damit zugebracht, um der Diktierfunktion diesen Namen beizubringen, aber es ist nichts zu machen, ich muss immer verbessern. Als Name erscheint anstatt Janne: Yanne, Diane, Jannis und noch einiges andere. Da scheint es keinerlei Lernfähigkeit zu geben.
 
Du bekommst es halt kostenlos im System dazu. Wenn du es professionell nutzen willst, brauchst du professionelle Diktiersoftware.
Wenn es Bitcoins gibt, muss es auch Sprachsysteme geben.
Albernster Vergleich. Es gibt Sprachsysteme. Es gibt auch professionelle. Die müssen aber nicht in dein Telefon integriert sein, ist Bitcoin ja auch nicht.
 
Ich habe hier nichts unterstellen wollen, sondern nur die Problematik verdeutlichen wollen. DragonDictate funktioniert mehrsprachig, hat eine eine Fehlertoleranz und ist explizit als Diktatsoftware ausgelegt. iOS hat die Spracherkennung "unter anderem" eingebaut und wenn man weiß wie rechenintensiv eine gute Sprachanalyse / - erkennung arbeitet, dann vermute ich, dass iOS hier gewisse Abstriche macht um die Energieeffizienz nicht zu stark zu strapazieren, schließlich soll das Telefon ja eigentlich und vornehmlich andere Aufgaben erledigen. Wie gesagt, eine Vermutung…
 
ich verwende als workaround Just Press Record (ipad, iphone), es hat beim jetzigen Test Thomas de Maiziére sofort erkannt...den Audiofile kann man als Transkript exportieren....geht auch mit der AppleWatch
 
Hallo Resa,

vielen Dank. Leider kann ich deinen Vorschlag nicht nachvollziehen. Würde es aber gerne. Könntest du das noch mal für einen Laien wie mich wiederholen. Was genau macht denn Just Press Record?

Cinober
 
Was lässt sich daran denn nicht nachvollziehen? Selbst die Screenshots zur App zeigen doch schon die Transkriptionen.
 
Hallo Resa,

vielen Dank. Leider kann ich deinen Vorschlag nicht nachvollziehen. Würde es aber gerne. Könntest du das noch mal für einen Laien wie mich wiederholen. Was genau macht denn Just Press Record?

Cinober
Hallo, Du nimmst mit der App auf wie auf einem Diktaphon, und sie wandelt den Audioteil bei Bedarf um...bzw. erstellt ein Transkript, das Du dann in anderen Apps bearbeiten kannst. Ich habe sie einmal für das iPad gekauft und kann sie aber auf iPhone und watch auch verwenden. Schaut immer bissl lustig aus, wenn ich in meine Watch rede :)
 
  • Gefällt mir
Reaktionen: Cinober
Du bekommst es halt kostenlos im System dazu. Wenn du es professionell nutzen willst, brauchst du professionelle Diktiersoftware.

Albernster Vergleich. Es gibt Sprachsysteme. Es gibt auch professionelle. Die müssen aber nicht in dein Telefon integriert sein, ist Bitcoin ja auch nicht.
Naja, das ist auch schon wieder einfach sowas dahin geschriebenes. Schauen wir mal zu Google, zu den aktuellen Pixelgeräten. Die Spracheingabe ist um Welten besser und das ist auch mittlerweile bekannt.

Man benötigt nicht generell ein weiteres Programm, da man bei diesen Geräten einfach davon ausgehen muss, dass hier eine Qualität vorgegeben sein sollte, die auch hören Ansprüchen gerecht wird.
 
  • Traurig
Reaktionen: BalthasarBux
Zurück
Oben Unten