{"id":7847,"date":"2022-09-15T16:47:38","date_gmt":"2022-09-15T14:47:38","guid":{"rendered":"https:\/\/www.audioblog.iis.fraunhofer.com\/?p=7847"},"modified":"2022-11-08T10:49:19","modified_gmt":"2022-11-08T08:49:19","slug":"telos-dialog-plus","status":"publish","type":"post","link":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/telos-dialog-plus","title":{"rendered":"\u201eH\u00e4?\u201c war gestern!"},"content":{"rendered":"<p><strong>Telos integriert die MPEG-H Technologie Dialog+ und erm\u00f6glicht damit Sendeanstalten eine automatische Dialogverbesserung f\u00fcr ihre Inhalte.<\/strong><!--more--><\/p>\n<p>Freitagabend, Filmzeit. Novemberregen prasselt auf die Fensterbleche, w\u00e4hrend es drau\u00dfen dunkel wird. Die Filmmusik schwillt dramatisch an, w\u00e4hrend sich die Spannung dem H\u00f6hepunkt n\u00e4hert. Der B\u00f6sewicht ist gerade dabei, seinen finsteren Plan vor sich hin murmelnd zu enth\u00fcllen \u2013 als ein \u201eSchatz, spul\u2018 bitte kurz noch mal zur\u00fcck!\u201c die Spannung durchschneidet.<\/p>\n<p>Sind es undeutlich sprechende Schauspielerinnen und Schauspieler, \u00fcbereifrige Musikkomponisten, oder eine unbeholfene Tonmischung, die solche Unannehmlichkeiten zu verantworten haben? Nichts von alldem \u2013 die Antwort ist wesentlich komplexer.<\/p>\n<p>Tats\u00e4chlich belegen zahlreiche Studien, dass es ein allgemeing\u00fcltig optimales Verh\u00e4ltnis zwischen Dialoglautst\u00e4rke und Hintergrundger\u00e4uschen schlicht nicht <em>gibt<\/em>. Die Wahrnehmung ist hochindividuell. Sounddesignern ist es in der Praxis schier unm\u00f6glich, die gesamte heterogene Masse des Publikums mit einer einzigen Mischung gl\u00fccklich zu machen. Moderne Filmproduktionen haben jedoch heutzutage die technischen M\u00f6glichkeiten, das H\u00f6rerlebnis variabel zu gestalten. Wenn Filmproduzierende Audiosysteme wie MPEG-H Audio implementieren, k\u00f6nnen sie dem Publikum die Option geben, die Lautst\u00e4rke einzelner Audioobjekte individuell anzupassen. So k\u00f6nnte, an einem regnerischen Novemberabend, die Stimme des B\u00f6sewichts lauter und die dramatische Filmmusik leiser gestellt werden.<\/p>\n<p>Auch f\u00fcr bereits existierende Filme haben Wissenschaftler des Fraunhofer IIS ein technisches Werkzeug entwickelt, das die H\u00f6rqualit\u00e4t drastisch verbessert: die dateibasierte Technologie MPEG-H Dialog+. Sie ist AI-basiert und nutzt Deep Neural Networks, um im bereits bestehenden Mix den Dialog von Hintergrundger\u00e4uschen zu trennen und das gesprochene Wort akustisch zu verst\u00e4rken. Das f\u00fchrt dazu, dass der neue Remix einfacher zu verstehen ist. MPEG-H Dialog+ wurde k\u00fcrzlich im Telos Alliance Minnetonka AudioTools Server implementiert und als Dialog+ Modul auf den Markt gebracht.<\/p>\n<p>Selbstverst\u00e4ndlich musste die AI in Vorbereitung auf den Produktlaunch trainiert werden. Gemeinsam mit dem WDR haben Fraunhofer IIS und Telos eine ideale Lernumgebung geschaffen: \u00fcber DVB und die ARD-Mediathek wurde eine Feldstudie durchgef\u00fchrt. Ziel war es, zu implementierende Anforderungen und Produktionsabl\u00e4ufe zu verfeinern, um eine Dialogmischung mit einer verbesserten Sprachverst\u00e4ndlichkeit zu erreichen. Die Ergebnisse flossen in die Telos-Produktentwicklung ein. Der WDR, sowie andere Anstalten der ARD, spielten eine wichtige Rolle, indem sie geeignetes Trainingsmaterial f\u00fcr das Deep Neutral Network zur Verf\u00fcgung stellten und den optimalen Workflow gestalteten. Au\u00dferdem f\u00fchrte der WDR den Dienst \u201eKlare Sprache\u201c in der Mediathek ein. Die gute Zusammenarbeit f\u00fchrte unter anderem dazu, dass die Software nun als Teil eines automatischen Workflows in der WDR-Produktions-Infrastruktur implementiert ist \u2013 vom Archiv bis zur Transcoding-Farm.<\/p>\n<p>Die Integration von MPEG-H Dialog + in die Telos Alliance-Produktpalette erm\u00f6glicht es Sendern, auch \u00e4ltere Filme technisch aufzupolieren. Mithilfe des hochmodernen Dialogtrennungs-Algorithmus k\u00f6nnen sie dem Publikum nun personalisierbare Audiomischungen bieten. Die Automatisierung dieses Workflows macht ihn besonders praktisch und kosteneffizient. Zudem gibt es eine Reihe von Voreinstellungen (sog. Presets), die auf spezifische Anwendungsszenarien zugeschnitten sind \u2013 beispielsweise auf Musikfilme, Dokus oder Sport. Dabei kann MPEG-H Dialog+ zwei Formate ausgeben: Zum einen eine Stereomischung f\u00fcr herk\u00f6mmliche Workflows, zum anderen eine ADM-Datei, die alle brandneuen Funktionen von Next Generation Audio unterst\u00fctzt \u2013 etwa Personalisierung und die Bereitstellung eines universellen Datensatzes f\u00fcr alle Wiedergabeger\u00e4te.<\/p>\n<p>Dank hochmoderner, automatischer Dialogverbesserung k\u00f6nnen Film-Fans sich in Zukunft ohne Verst\u00e4ndnisprobleme voll und ganz in phantastische Welten st\u00fcrzen \u2013 selbst wenn lautes Regengeprassel von drau\u00dfen erschwerend hinzukommen sollte.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Telos integriert die MPEG-H Technologie Dialog+ und erm\u00f6glicht damit Sendeanstalten eine automatische Dialogverbesserung f\u00fcr ihre Inhalte.<\/p>\n","protected":false},"author":2,"featured_media":7747,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[111],"tags":[476,311,374,333,360],"class_list":["post-7847","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-produkte-technologien","tag-accessibility-de","tag-audio-de","tag-broadcast-de","tag-dialogue-enhancement-de","tag-mpeg-h-de"],"_links":{"self":[{"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/posts\/7847"}],"collection":[{"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/comments?post=7847"}],"version-history":[{"count":1,"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/posts\/7847\/revisions"}],"predecessor-version":[{"id":7848,"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/posts\/7847\/revisions\/7848"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/media\/7747"}],"wp:attachment":[{"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/media?parent=7847"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/categories?post=7847"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.audioblog.iis.fraunhofer.com\/de\/wp-json\/wp\/v2\/tags?post=7847"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}