Schlagwort: spracherkennung

  • Die Alexa-App gibt es jetzt auch mit Alexa-Sprachassistent

    Derzeit erhält die Amazon-Alexa-App eine Update, in dem auch die Implementierung der Sprachassistentin Alexa vorgenommen wird. Das hört sich irgendwie komisch an, oder? Mit der Alexa-App ließen sich in der Vergangenheit die Smart-Home-Devices über das Smartphone steuern. Wie bei Amazon Echo, aber ohne Sprachsteuerung. Diese wird der Alexa-App nun hinzugefügt.

    Wer bisher die Alexa-Sprachsteuerung auf dem Handy oder dem Tablet nutzen wollte, der musste vorher eine mit Alexa kompatible App, wie beispielsweise Reverb, verwenden. Damit ist nun Schluss.

    Ist kein Amazon Echo in Hörweite, dann lassen sich alle Befehle der Sprachsteuerung auch mit der App realisieren. Nur automatisch zuhören kann die Alexa-App nicht. Dazu muss der Button gedrückt werden.

    Wenn deine Alexa-App noch keine Sprachsteuerung hat, dann aktualisiere die App. Ist sie danach immer noch nicht vorhanden, wird es vermutlich noch ein paar Tage dauern, da dieses Update in mehreren Wellen ausgeliefert wird.

    Vorerst wird leider nur Android unterstützt. Die Updates für iOS-Geräte folgen wohl (viel) später.

  • Kopfhörer als Mikrofonersatz für PC und Notebook einrichten

    Du hast vergessen das PC-Mikrofon mitzunehmen oder das eingebaute Mikrofon deines Notebooks funktioniert nicht mehr richtig? Dann verwende doch ersatzweise einfach ein Headset, beispielsweise vom Handy oder Tablet.

    Die einzige Voraussetzung ist, dass der Kopfhörer einen Klinkenstecker sowie ein integriertes Mikrofon besitzt. Daher sind die In-Ear-Kopfhörer eines Smartphones prädestiniert für solche Notfälle.

    Man kann natürlich nicht erwarten, dass bei dieser Notlösung ein toller Stereo- oder Surround-Sound erzeugt wird. Aber es reicht vollkommen für Sprachnotizen oder die Spracherkennung aus.

    Verbinde den Stecker des Headsets mit dem Mikrofonanschluß deines Computers. Dann klickst du mit der rechten Maustaste auf das Lautsprecher-Symbol in der Taskleiste oder dem Systemtray und wählst im Kontextmenü die Option Aufnahmegeräte.

    Im Dialogfenster Sound klickst du doppelt auf den Eintrag Mikrofon. Dann wechselst du in den Einstellungen zum Register Pegel und stellst das Mikrofon und die Mikrofonverstärkung über die Schieberegler ein.

    Abschließend überprüfst du bei der Geräteverwendung auf der Registerkarte Allgemein, ob hier Gerät verwenden (aktivieren) eingestellt ist. Gegebenenfalls wählst du im Drop-Down-Menü diese Option aus. Dann speicherst du die Änderungen mit Übernehmen oder OK.

    Nun ist dein (Not-) Mikrofon einsatzbereit.

    Tipp:

    Wenn du das Mikrofon und die Kopfhörer verwenden möchtest, dein Computer/Laptop aber getrennte Kopfhörer- und Mikrofonanschlüsse besitzt, dann benötigst du einen Klinkenadapter (Buchse auf 2 x Stecker). Solche Adapter findest du für ein paar Cent in jedem Elektronik-Fachgeschäft, auf Ebay oder Amazon.

  • Google Sprachsuche einschalten und optimieren

    Die Google-Sprachsuche ist standardmäßig auf jedem Android-Gerät installiert und natürlich auch im Chrome-Browser vorhanden. Bei Smartphones und Tablets aktiviert der Sprachbefehl OK Google das Mikrofon, beim Chrome-Browser auf dem Desktop-PC muss das Mikrofon per Mausklick aktiviert werden. Im Gegensatz zum PC lässt sich bei Android die Sprachsuche wesentlich flexibler einsetzen.

    Die Google-Suche ist auf Android-Handys über den Home-Bildschirm jederzeit erreichbar. Anpassungen der Sprachsuche werden in den Einstellungen der Google App vorgenommen. Dazu startest du die App und tippst oben links auf das Menü-Icon und anschließend auf Einstellungen | Sprache | „Ok Google“ Erkennung.

    Spracherkennung aktivieren und deaktivieren

    Hier kannst du im Bereich Über die Google App die Spracherkennung aus- und wieder einschalten. Die Option Im Auto steuert die Spracherkennung in Google Maps.

    Die Einstellung Auf jedem Bildschirm ermöglicht eine Google-Sprachsuche aus jeder aktiven Anwendung. Egal in welchem Programm du dich gerade befindest, WhatsApp, Kamera oder der Musikwiedergabe, es reicht der Befehl Ok Google um eine Webrecherche zu starten. Sicherheitshalber sollten in diesem Fall die persönlichen Ergebnisse deaktiviert bleiben.

    Sprachfilter für vulgäre Begriffe

    Wenn du anstößige Wörter suchen willst, ist die Deaktivierung des entsprechenden Sprachfilters erforderlich. Die Option Anstößige Wörter sperren schaltest du bei Einstellungen | Sprache aus.

    Google Sprachsuche unter iOS

    Auch mit dem iPhone/iPad ist die Google Sprachsuche möglich. Öffne auf deinem iPhone die Google-App. Dann tippst du in der linken oberen Ecke auf das Bild und scrollst im Kontextmenü bis zur Option Sprachsuche. Aktiviere das Feature und bestätige den Vorgang mit Fertig.

    Ab sofort ist auch bei deinem iPad oder iPhone die Google-Sprachsuche möglich.

  • Chrome Browser: „OK Google“ ist tot!

    Chrome Browser: „OK Google“ ist tot!

    Der Befehl für die automatische Spracherkennung beim Chrome-Browser, OK Google, wurde in der aktuellen Version 46 entfernt. Damit ereilte ihn das gleiche Schicksal wie das Notification Center. Der Grund für den Wegfall dieser Features war wohl mangelnde Nutzeraktivitäten. Das bedeutet aber nicht, dass die Sprachsuche auch entfent wurde, sie muss manuell per Mausklick angestoßen werden.

    google-ok-sprachbefehl-automatisch-erkennung-chrome-entfernt-weg

    Die Änderung betrifft nur die Desktop-Version des Browsers, nicht aber die mobile Variante und das Chromebook. Es ist offensichtlich aufgefallen, dass die Nutzer eher in ihr Smartphone sprechen, als mit dem Desktop-Computer. Immerhin wird Chrome dadurch wieder etwas schlanker.

    automatisch-sprachbefehl-desktop-browser-entfernt-version-46-chrome-ok-google-funktioniert-nicht-mehr

  • Adressen von Webseiten mit einem Tonsignal an einen anderen Rechner senden

    Adressen von Webseiten mit einem Tonsignal an einen anderen Rechner senden

    Viele Nutzer die mit zwei oder mehr Computern auf einmal arbeiten, kennen das Problem der Weitergabe von URL´s an diese Rechner. Es gibt eine Reihe von Tricks, mit denen das gelöst werden kann. Die meisten dieser Möglichkeiten sind jedoch zu langwierig. Egal ob man eine Internetadresse kopiert und sie per E-Mail sendet, in Evernote gespeichert wird oder sie neu eintippt. Aber es gibt eine andere, etwas ungewöhnliche Lösung.

    Die heißt Übertragung per Tonsignal. Diese Variante erinnert sehr stark an die Anfänge des Internets, als die Verbindungen noch mit nervigen Pieptönen stattfand.

    Dieser Technik bedient sich die Erweiterung Google Tone für den Chrome-Browser. Das Add-on wandelt die URL in Töne um und spielt sie über die Lautsprecher ab.

    google-tone-googel-extension-erweiterung-download-herunterladen-web-store-kostenlos-url-verteilen

    Damit das Ganze auch richtig funktioniert, ist eine aktivierte Google Spracherkennung, Hangouts oder Google Now auf dem Zielrechner erforderlich. Außerdem musst du auf den betreffenden PC´s in deinem Google-Konto angemeldet sein.

    Nach dem Download und der Installation von Google Tone wurde dem Browser ein zusätzliches Icon mit einem Lautsprecher hinzugefügt. Zum Übertragen einer Webseitenadresse klicke einfach nur auf dieses Lautsprecher-Icon und der Ton wird abgespielt. Zuvor musst du natürlich die Boxen einschalten und beim Zielrechner die Spracherkennung aktivieren.

    lautsprecher-symbol-klicken-mausklick-sound-ton-einschalten-google-tone-hangouts-senden

    Der oder die Zielrechner quittieren den erfolgreichen Empfang der URL mit einer Statusmeldung.

    url-senden-empfangen-google-tone-modem-sound-umwandeln-umgebung

    Mit einem Mausklick auf diese Meldung wird die Webseite im Chrome-Browser aufgerufen.

    Wer noch eine andere Möglichkeit testen möchte, der kann die Maus ohne Grenzen ausprobieren. Diese Methode erlaubt unter anderem auch das Transferieren von Daten aus dem Zwischenspeicher.

  • Samsung SmartTV hört alles mit: Aufgepasst beim Privatgespräch vor dem Fernseher

    Du hast Zuhause einen SmartTV stehen? Dann solltest du genau darauf achten, was du vor dem Fernseher erzählst und machst. Denn jeder smarte Fernseher hört genau mit. Das muss er auch, um smart zu sein. Samsung weist bei seinen SmartTV-Geräten im Kleingedruckten sogar darauf hin, dass man doch vor dem Fernseher nicht allzu private Sachen erzählen soll.

    SmartTVs hören mit

    SmartTVs sind eine feine Sache: Per Sprachbefehl kann man bequem und ohne Fernbedienung den Fernseher steuern. Die Kehrseite der Medaille: Der smarte Fernseher lauscht mit und überträgt das Gesprochene ins Internet. Das muss er auch, um eine vernünftige Spracherkennung gewährleisten zu können. Denn die Spracherkennung steckt nicht im Gerät, sondern auf Servern im Internet. Alles, das die Mikros des Fernsehers aufnehmen, werden übers Internet zu Spracherkennungs-Diensten geschickt, dort analysiert, erkannt und übersetzt und dann als TV-Befehl zum Fernseher zurückgeschickt.

    Wer sich vor einem SmartTV mit Spracherkennung unterhält, sollte also im Hinterkopf behalten, dass der Fernseher alles Gesprochene mitbekommt und man eigentlich nicht weiß und schon gar nicht kontrollieren kann, was mit den Aufnahmen geschieht.

    Samsung weist in seiner Global Privacy Policy im Abschnitt Voice Recognition sogar explizit darauf hin, dass die Aufnahmen an einen Drittabieter geschickt werden und Samsung keinen Einfluss darauf hat, was mit den Aufzeichnungen passiert und wer sie zu Augen bzw. zu Ohren bekommt. Dort heißt es:

    Please be aware that if your spoken words include personal or other sensitive information, that information will be among the data captured and transmitted to a third party through your use of Voice Recognition.

    Als SmartTV-Besitzer muss man sich entscheiden: Entweder auf die Spracherkennungs-Features verzichten, oder – bildlich gesprochen – die Hosen runterlassen und alles Gesprochene ungeniert ins Internet zu schicken. George Orwells Teleschirme aus dem dystopischen Roman 1984 sind damit Realität geworden.

    samsung-smart-tv-hoert-mit-privacy-policy-spracherkennung

  • Speak-a-Message: Schnell mal eine Nachricht sprechen statt sie zu schreiben

    Egal ob geschäftlich oder privat, jeden Tag schreiben eine Menge E-Mails. Manchmal würde man aber auch gerne mal auf das Tippen verzichten. Die meisten Spracherkennungsprogramme wie beispielsweise die Windows-Spracherkennung oder Dragon Naturally Speaking sind zwar sehr gut, bedürfen aber einer zeitintensiven Einrichtung. Auch die Bedienung dieser (Profi-)Programme liegt nicht jedem Nutzer gleichermaßen gut. Eine recht gute und sehr einfach zu bedienende Alternative ist das Tool Speak-A-Message.

    Schnelle Erfassung von Sprachnachrichten

    Speak-a-Message ermöglicht die blitzschnelle Erstellung von Sprachnachrichten. Diese lassen sich dann aus dem Programm heraus per E-Mail versenden, speichern, oder direkt auf der eigenen Facebook-Pinnwand veröffentlichen. Genauso einfach lässt sich eine Sprachnachricht in Text umwandeln.

    Download und Installation

    Aber alles der Reihe nach. Zuerst muss das Programm erst einmal heruntergeladen und installiert werden. Auf der Webseite www.speak-a-message.com kann das Programm auch als kostenlose Version heruntergeladen werden. Klicken Sie dazu auf den roten Button und folgen Sie dann dem Download- und Installationsassistenten.

    speak-a-message-sprache-in-text-umwandeln-sprachnachricht

    Sprachnachrichten aufnehmen

    Vor dem Starten des Programms überprüfen Sie, ob ein Mikrofon angeschlossen ist.

    Starten Sie das Tool dann mit einem Doppelklick auf das Desktop-Symbol.

    desktop-icon-sprache-in-text-umwandeln-speak-a-message-starten-tool

    Zum Aufnehmen einer Sprachnachricht, klicken Sie auf den roten Button Aufnehmen. Zusätzlich kann man eine Titelbeschreibung und den Namen des Sprechers eintragen. Mit einem Mausklick auf die grünen Häkchen werden die Angaben gespeichert.

    nachricht-sprechen-aufnehmen-titel-sprecher-wma-format

    Die Umwandlung in Text

    Soll der Inhalt dieser Sprachdatei in Text umgewandelt werden, dann klicken Sie auf Transkribieren und anschließend auf die Schaltfläche Sprache zu Text. Nach ein paar Sekunden wird der erkannte Text angezeigt. Der angezeigt Text kann zusätzlich noch korrigiert und geändert werden. In diesem Fall speichern Sie die Änderungen mit dem Button Text speichern.

    transkribieren-umwandeln-sprache-text-speichern-markieren-kopieren

    Ein Mausklick auf Dateien zeigt die Liste vorhandener Sprachdateien, sowie den Speicherpfad an.

    dateien-speicherort-pfad-vorhandene-sprachdateien-wma-speak-a-message

    Weitere Funktionen

    Die Spracherkennungssoftware enthält noch weitere Features. So lassen sich über die Symbolschaltflächen nicht nur die Sprachdateien bearbeiten, sondern auch direkt per E-Mail versenden oder auf Ihrer Facebook-Pinnwand veröffentlichen.

    Weitere Funktionen sind:

    • Einfügen von Fotos, eCards und Screenshots in Sprachnachrichten
    • Anfertigen von Hintergrundkommentaren bei Fotos
    • Anfertigen von Audio-Shows und Voice-Tagebüchern

    Fazit

    Alles in Allem ist das Spracherkennungs-Programm Speak-A-Message für den privaten Einsatz sehr zu empfehlen. Die Bedienung aller Programm-Funktionen ist übersichtlich, gut durchdacht und sehr bedienerfreundlich.

    Je öfter dieses Programm benutzt wird, desto besser wird die Umwandlung von Sprache in Text. Man muss sich nur angewöhnen, deutlich zu ins Mikrofon zu sprechen.

    Ein weiterer großer Vorteil dieses Programms ist, das der E-Mail-Empfänger einer Sprachnachricht dieses Tool nicht zwingend zum Abspielen benötigt. Speak-A-Message zeichnet die Sprachnachrichten im WMA-Audio-Format auf. Da reicht der normale Windows-Media-Player, VLC Media Player, oder ein anderes Tool Ihrer Wahl.

  • Windows 7: Statt Texte tippen, Texte diktieren und den Computer per Sprachsteuerung bedienen

    Wer hin und wieder mal einen Text diktieren möchte anstatt zu tippen, benötigt nicht unbedingt eine zusätzliche Software wie „Dragon Naturally Speaking“. Auch Windows 7 enthält standardmäßig eine zuverlässige Spracherkennungssoftware, die aber erst eingerichtet werden muss.

    Klicken Sie dazu auf den „Start“-Button und wählen im Startmenü „Alle Programme | Zubehör | Erleichterte Bedienung | Windows-Spracherkennung“.

    windows-7-spracherkennung-mikrofon-dragon-naturally-speaking-software-bordmittel

    Der Einrichtungsassistent für die Spracherkennung startet mit dem Willkommensbildschirm, den Sie mit „Weiter“ bestätigen.

    willkommensbildschirm-weiter-klicken-spracherkennung-software

    Im nächsten Bildschirm wählen Sie Ihr Mikrofon aus. Am besten, Sie benutzen ein Tischmikrofon oder ein Headset damit die Sprachbefehle gut erkannt werden. In Bildschirme integrierte Mikrofone (z. B. bei Notebooks) reichen oftmals nicht aus.

    einrichtung-assistent-hardware-mikrofon-erkennung

    Danach wird die Sprachqualität getestet, die Sie dann mit „Weiter“ bestätigen. Danach ist die Einrichtung des Mikrofons abgeschlossen.

    mikrofon-eingerichtet-text-sprache-steuerung

    Mit „Weiter“ gelangen Sie zum nächsten Schritt.

    Um die Spracherkennung zu optimieren, aktivieren Sie die Einstellung „Dokumentüberprüfung aktivieren“ und bestätigen Sie die Einstellung mit „Weiter“.

    spracherkennung-verbessern-genauigkeit-dokument-ueberpruefung

    Der nächste Arbeitsschritt regelt die automatische Aktivierung der Spracherkennung. Es empfiehlt sich den manuellen Aktivierungsmodus zu verwenden, um eine versehentliche Befehlseingabe zu verhindern.

    manuelle-aktivierung-zuhoeren-einrichten

    Im nächsten Dialogfenster können Sie sich noch eine Referenzkarte mit einer Übersicht der am häufigsten verwendeten Sprachbefehle ausdrucken.

    sprachbefehl-karte-ausdrucken-liste

    Beenden Sie im nächsten Dialogfenster den Einrichtungsprozess mit „Fertig stellen“.

    Danach können Sie mit dem Lernprogramm der Spracherkennung die Befehlseingabe trainieren.

    lernprogramm-spracherkennung-steuerung-computer-windows-desktop

    Mit ein wenig Übung lassen sich dann schnell Texte erfassen und auch der Computer per Spracheingabe steuern. Die Texterfassung des Lernprogramms arbeitet zwar mit WordPad, aber im Echtbetrieb funktioniert die Spracheingabe natürlich auch mit Outlook und Word.

    spracheingabe-word-wordpad-editor-outlook-windows-excel

    Leider wird Open Office hier nicht unterstützt. Die Lösung wäre hier die Texteingabe in WordPad. Danach kopieren Sie den diktierten Text in den Writer von Open Office.

  • iPhone Siri verbessern: Die Aussprache von Namen korrigieren und Siri die korrekte Aussprache und Betonung beibringen

    Siri ist ganz schön clever. Termine setzen, SMS schreiben, E-Mails verfassen – fast alle Funktionen lassen sich per Sprachbefehl steuern. Wichtig dabei sind natürlich immer die Namen. Siri versucht stets, die Namen aus dem Kontaktregister möglichst korrekt auszusprechen. Bei simplen Namen wie „Peter Müller“ oder „Hans Meier“ klappt das reibungslos und hört sich ganz gut an. Schwieriger wird es bei fremdsprachigen und komplizierteren Namen wie „Kirstin Kowalczyk“. Hier hapert es oft mit der Aussprache und die gesprochenen Namen hören sich doch recht holprig und hölzern an oder werden einfach falsch ausgesprochen und betont. Nur gut, dass Siri lernfähig ist. Mit einem simplen Trick können Sie Sire die richtige Aussprache beibringen.

    Siri und die Aussprache von erkannten Namen

    Ein Beispiel: Sie möchte eine SMS an Mirko Müller schicken. Dann starten Sie Siri (indem Sie länger auf den Home-Button drücken) und sagen einfach, was Sie möchten, etwa „SMS an Mirko Müller„. Siri wiederholt anschließend was er bzw. sie verstanden hat und antwortet beispielsweise mit „Ok, ich kann eine Nachricht an Mirko Müller schicken“.

    In den meisten Fällen wird der erkannte Name korrekt ausgesprochen; vor allem bei klassischen deutschen Vor- und Nachnamen. Anders sieht es aus, wenn fremdsprachige oder komplizierte Namen ins Spiel kommen. Dann erkennt Siri zwar den Namen korrekt, spricht ihn aber meist eigenartig oder falsch betont aus, etwa Namen wie „Kirstin Kowalczyk“. Das lässt sich ändern.

    Das Zauberwort „Aussprache“

    Mit folgendem Trick können Sie die Aussprache von Namen korrigieren und aus verschiedenen Varianten wählen.

    1. Dazu starten Sie Siri neu (indem Sie wieder länger auf den Home-Button drücken) und sagen das Zauberwort „Aussprache“ sowie den gewünschten Namen, etwa

    Aussprache Kirstin Kowalczyk

    2. Siri fragt anschließend „Ok, wie spreche ich diesen Vornamen aus (Kirstin)?“. Jetzt sprechen Sie den Vornamen so aus, wie Siri ihn später auch betonen soll.

    iphone-siri-namen-verbessern-aussprache-betonung

    3. Danach erhalten Sie eine Auswahl verschiedener Aussprachen und Betonungen. Per Fingertipp können Sie die Varianten abspielen und per Tipp auf „Auswählen“ als korrekte Variante auswählen. Passt keine der Varianten, können Sie mit „Erneut sagen“ die Erkennung wiederholen.

    iphone-siri-namen-verbessern-aussprache-betonung-2

    4. Anschließend wiederholt Siri die Schritte für den Nachnamen.

    iphone-siri-namen-verbessern-aussprache-betonung-3

    iphone-siri-namen-verbessern-aussprache-betonung-4

    iphone-siri-namen-verbessern-aussprache-betonung-5

    Ab sofort verwendet Siri bei der Wiederholung von Sprachbefehlen die korrekte Aussprache des Namens.

  • Google: Neue Funktion für den Übersetzer

    Der Google Übersetzer, nicht zu verwechseln mit der automatischen Webseitenübersetzung, hat seit kurzem eine zusätzliche Funktion spendiert bekommen: Die Sätzesammlung. Hier können Sie oft genutzte Phrasen oder feststehende Formulierungen speichern und jederzeit wieder aufrufen und durchsuchen.

    Sätze und Phrasen speichern

    Allerdings steht die Speicherfunktion nur angemeldeten Usern zur Verfügung. Wenn Sie noch kein Google-Konto haben, sollten Sie als erstes eines erstellen.

    Starten Sie Google, klicken Sie in der Menüleiste auf „Mehr“, und wählen Sie dort den „Übersetzer“ aus.

    bild-1-google-übersetzer-speichern-sätze-sammeln-durchsuchen-favoriten-stern-symbol-speichern

    Geben Sie einen Satz in der Ausgangssprache (hier: Deutsch) ein. Die Übersetzung wird sofort im rechten Bereich angezeigt. Darunter befindet sich ein Stern-Symbol, mit dem Sie diese Übersetzung speichern können.

    bild-2-sätzesammlung-google-chrome-anmelden-konto-einloggen-speichern-ablegen-wieder-aufrufen-durchsuchen

    Wenn Sie zu einem späteren Zeitpunkt einen dieser Sätze benötigen, zum Beispiel als Vokabel-Training, dann klicken Sie oben auf den Favoriten-Stern. Darunter wird die komplette Sätzesammlung angezeigt. Wenn Sie ein Objekt anklicken, wird es automatisch in die beiden linken Textfelder eingefügt. Außerdem können Sie sich mit dem Lautsprechersymbol die Sätze vorlesen lassen, um Ihre Aussprache zu kontrollieren.

    bild-3-sätzesammlung-übersetzer-durchsuchen-aufrufen-anhören-umfangreich

    Die Textfelder enthalten aber auch noch eine andere Funktion. Wie im Deutschen gibt es auch in der anderen Sprache alternative Schreibweisen. Wenn Sie mit dem Mauszeiger über den betreffenden Satz fahren, wird ein Teil des Satzes farblich markiert.

    bild-4-alternative-satzstellung-aussuchen-bearbeiten-übersetzung-deutsch-formulierung

    Für die Listenansicht der alternativen Schreibweisen klicken Sie auf die Farbmarkierung.

    bild-5-alternative-liste-anzeigen-möglichkeiten-satzstellung-aussuchen-anstelle

    Zur Auswahl und Übernahme einer Alternative klicken Sie diese einfach an.