Technologie

Dank KI wieder sprechen können

Von Lukas Pierre Bessis
25.08.2023

Die Fähigkeit, sich auszudrücken, gilt als ein wesentlicher Bestandteil unseres Menschseins. Der Verlust der Sprache nach einer Hirnverletzung oder aufgrund einer Krankheit führt dazu, dass ein Mensch seine Gedanken, Gefühle und Ideen nicht mehr ausdrücken kann, und das führt sehr oft zu einer großen persönlichen Belastung. In zwei kürzlich veröffentlichten Studien haben Forscher gezeigt, wie die Kombination von Hirnimplantaten und künstlicher Intelligenz zwei Frauen - eine war nach einem Schlaganfall gelähmt, die andere litt an einer fortschreitenden neurodegenerativen Erkrankung - eine Stimme verliehen hat.

Ein Schlaganfall kann die Hirnregionen schädigen, die Sprache und Sprechen steuern. Auch die amyotrophe Lateralsklerose (ALS), eine fortschreitende Erkrankung, die die Neuronen angreift, die die Muskeln steuern, kann zu Sprachproblemen führen, wenn die Muskeln betroffen sind, die die Lippen, die Zunge, das Gaumensegel, den Kiefer und die Stimmlippen bewegen.  Doch Forscher haben jetzt einen Weg gefunden, den Stimmlosen ihre Stimme zurückzugeben. 

Technologische Errungenschaft

Gehirn-Computer-Schnittstellen (BCI) sind bekanntlich da, und sie werden immer besser. Zwei Studien, die am 23. August in der Zeitschrift Nature veröffentlicht wurden, belegen, wie weit wir mit unseren technologischen Fähigkeiten gekommen sind.   In der ersten Studie, die von Forschern der Universitäten San Francisco und Berkeley durchgeführt wurden, konnte eine Frau Namens Ann die mit 30 Jahren einen Schlaganfall erlitten hatte, der zu schweren Lähmungen und einer starken Schwäche der Gesichts- und Stimmmuskulatur führte, nach Jahren der Rehabilitation nur mühsam kommunizieren, indem sie einen Buchstaben nach dem anderen auf einen Computerbildschirm tippte. Dann, im Jahr 2021, begann die Zusammenarbeit mit den Forschern der Universitäten San Francisco und Berkeley, eine natürlichere Kommunikationsmethode zu entwickeln, bei der ein digitaler Avatar eingesetzt wird, der mithilfe von künstlicher Intelligenz die Signale des Gehirns in Sprache und Mimik umwandelt. 

Sie implantierten ihr ein hauchdünnes Rechteck aus 253 Elektroden auf der Oberfläche ihres Gehirns, genau über den sprachbezogenen Bereichen, die ohne den Schlaganfall die Muskeln in Anns Lippen, Zunge, Kiefer und im Stimmapparat animiert hätten.  Die Elektroden waren über ein Kabel mit einer Reihe von Computern verbunden.

KI schon weit fortgeschritten

Ann trainierte mit den Forschern die Künstliche Intelligenz (KI) dass sie ihre Gehirnsignale erkennt. Wochenlang wiederholte sie verschiedene Sätze aus einem Konversationswortschatz von 1.024 Wörtern. Anstatt die KI darauf zu trainieren, ganze Wörter zu erkennen, entwickelten die Forscher ein System, das Wörter aus kleineren Komponenten oder Phonemen entschlüsselt. Auf diese Weise musste die KI nur 39 Phoneme lernen, um jedes englische Wort zu entziffern.

Als Nächstes entwickelten die Forscher einen Algorithmus für die Sprachsynthese, den sie anhand einer Aufnahme von Anns Rede auf ihrer Hochzeit personalisierten. So klingen ihre Gedanken auch wie sie eins sprach. Ausserdem entwickelte das Forscher Team eine Software die sich mit den emotionalen Signalen die Anns Gehirn während sie zu sprechen versuchte an Gesichtsmuskeln sendete um Emotionen wie Freude, Traurigkeit oder Überraschung darzustellen. Durch diesen Trick kommt auch Betonung, Tonalität und Melodie in die Sprache. 

Aktuell ist das BCI-System ist in der Lage, ein großes Vokabular zu dekodieren und in Text umzuwandeln und zwar mit einer mittleren Geschwindigkeit von 78 Wörtern pro Minute. Die Geschwindigkeit einer natürlichen Konversation unter englischen Sprechern liegt bei etwa 160 Wörtern pro Minute. 

Ann selbst sagt dass sie nach 17 Jahren Sprachlosigkeit nun wieder ein Gefühl der Sinnhaftigkeit hat, „Es fühlt sich an, als hätte ich wieder ein Leben!”

Wie geht es weiter?

Aktuell arbeiten die Forscher an der Entwicklung einer drahtlosen Version des Systems, bei der der Patient nicht mehr physisch mit dem BCI an Computern verbunden sein muss. Sie hoffen, dass ihr Projekt in naher Zukunft von der FDA zugelassen wird, und sie so zu einem System kommt dass Gehirnsignale in Sprache wandelt.

Im hier folgenden von der Universität San Francisco produzierten Video seht ihr, wie die Technologie funktioniert, während Ann sich mit ihrem Mann Bill unterhält.

Das Wiedergewinnen der Sprache ist mehr als nur Worte. Es ist ein Stück Freiheit, Identität und Menschlichkeit, das zurückgegeben wird. Und mit der rasanten Entwicklung der Technologie steht uns vielleicht eine Zukunft bevor, in der niemand mehr ohne Stimme bleibt.

Guter Content? Teile ihn gerne!

Autor

Lukas Pierre Bessis

Aktuelle Stories und die wichtigsten News
direkt in dein Postfach!

Zurück zur Übersicht

Verwandte Artikel

Von Kunst bis E-Commerce: Immersive Erlebnisse auf dem Vormarsch

TechnologieVon Timo Weltner27.06.2024

Immersive Erlebnisse haben schon längst einen festen Platz in unserer digitalen Welt eingenommen. Was einst als futuristische Vision galt, ist heute Realität: Von virtuellen Realitätsexperimenten bis hin zu interaktiven Ausstellungen und innovativen Shopping-Erlebnissen – immersive Technologien revolutionieren die Art und Weise, wie wir konsumieren, lernen und uns unterhalten. Doch was bedeutet "immersiv" eigentlich und wie beeinflusst es unser digitales Leben?

Die Bedeutung von Customer Data Platforms (CDPs) für ein nahtloses Kundenerlebnis

E-CommerceVon Timo Weltner29.05.2024

Die Digitalisierung hat das Konsumverhalten revolutioniert. In der heutigen Geschäftswelt reicht es nicht mehr aus, nur qualitativ hochwertige Produkte anzubieten. Da Verbraucher immer höhere Erwartungen an individuelle und konsistente Erlebnisse haben, sind Customer Data Platforms (CDPs) unverzichtbar geworden.

Direct-to-Consumer (D2C) Modelle: Chancen und Herausforderungen

E-CommerceVon Timo Weltner17.05.2024

Die Welt des Handels befindet sich im Umbruch, angetrieben durch den direkten Zugang der Hersteller zu ihren Kunden. Direct-to-Consumer (D2C) Modelle ermöglichen es Unternehmen, ihre Produkte ohne Zwischenhändler direkt an den Endverbraucher zu verkaufen. Dieser Ansatz bietet enorme Chancen, birgt jedoch auch einige Herausforderungen.

Dank KI wieder sprechen können

Technologische Errungenschaft

KI schon weit fortgeschritten

Wie geht es weiter?

Guter Content? Teile ihn gerne!

Autor

Aktuelle Stories und die wichtigsten News direkt in dein Postfach!

Verwandte Artikel

Von Kunst bis E-Commerce: Immersive Erlebnisse auf dem Vormarsch

Die Bedeutung von Customer Data Platforms (CDPs) für ein nahtloses Kundenerlebnis

Direct-to-Consumer (D2C) Modelle: Chancen und Herausforderungen

DIETMAR RIETSCH, PIMCORE

Melden Sie sich für die Masterclass an

MARKUS BÜCKLE & JOSCHA KRUG, MAKAIRA

Melden Sie sich für die Masterclass an

MANUEL FUSS, SHOPWARE

Melden Sie sich für die Masterclass an

MAXIMILIAN REITER, KASTNER.AT

Melden Sie sich für die Masterclass an

STEPHAN GLAMSCH, GOOGLE

Melden Sie sich für die Masterclass an

EBERHARDT WEBER, EMPORIX

Melden Sie sich für die Masterclass an

ANDREAS BAUR, SMART EUROPE

Melden Sie sich für die Masterclass an

Aktuelle Stories und die wichtigsten News
direkt in dein Postfach!