© Manuela Wamser - Fraunhofer IIS

Fraunhofer-Technologie ermöglicht Barge-in und Fernfeld-Spracherkennung in LG Smart Speaker

Fraunhofer upHear Voice Quality Enhancement arbeitet das Mikrofonsignal für den Spracherkenner auf, auch unter ungünstigen akustischen Bedingungen.

LG hat eine russische Version seines „XBOOM AI ThinQ WK7“ Smart Speakers mit der Sprachassistentin „Alice“ von Yandex vorgestellt. Damit Alice Benutzerbefehle in bestmöglicher Audioqualität erhält, steckt im WK7Y-Modell des Smart Speakers die Yandex.IO-Mikrofonarray-Technologie mit integriertem Fraunhofer upHear Voice Quality Enhancement (VQE) für Fernfeld-Sprachsignalaufarbeitung und Barge-in. upHear VQE liefert ein sauberes Audiosignal an den Keyword-Spotter und den Spracherkenner, sodass Alice Sprachbefehle genau verstehen kann, egal wo im Raum sie gegeben werden – und sogar während der Smart Speaker Musik spielt.

Fraunhofer upHear VQE verarbeitet die Mikrofonarraysignale des LG WK7Y: Die Technologie entfernt störende Geräusche und neutralisiert akustische Echos, die durch das lautsprechereigene Signal während der Wiedergabe verursacht werden, um Barge-in zu ermöglichen. Auf diese Weise werden sowohl der Keyword-Spotter als auch der Spracherkenner des Sprachassistenten mit einem sauberen Sprachsignal versorgt.

Über Fraunhofer upHear Voice Quality Enhancement

Fraunhofer upHear VQE verarbeitet Mikrofonsignale und ermöglicht damit Fernfeld-Vollduplex-Gespräche in voller Audiobandbreite für Mobiltelefone, sowie Fernfeld-Sprachbefehle und Barge-in während der Audiowiedergabe für „smarte“ Geräte – und das immer in hervorragender Audioqualität. Möglich wird dies durch die Kombination von mehrkanaliger akustischer Echokompensation, Quellenlokalisierung, Rauschunterdrückung und Beamforming. Die voll integrierte Technologie eignet sich für zahlreiche Anwendungen, darunter natürliches Sprachverstehen in Smartphones und Tablets oder anderen Geräten mit Spracherkenner, sowie für Konferenzlösungen. upHear VQE kann flexibel mit einer Vielzahl von Mikrofonarray-Geometrien eingesetzt werden und ist optimiert für Geräte mit Mono- und Stereo- sowie Surround- und sogar immersiver Audiowiedergabe.

Titelbild © Manuela Wamser – Fraunhofer IIS

This post is also available in: English 汉语 한국어