Mluvení bez mluvení: čip umí přeložit náš vnitřní monolog v řeč

Další pokrok v oblasti rozhraní mozek-počítač (brain-computer interface, BCI) se uskutečnil na Zuckermanově institutu na Kolumbijské univerzitě.

Skupina inženýrů z oblasti neurovědu úspěšně vytvořila systém, který myšlenky překládá v rozeznatelnou a smysluplnou řeč. Pokrok umožněný hlasovými syntetizátory a umělou inteligencí by mohl vést k rozvoji technologií založených na přímo komunikaci lidského mozku a počítače.

Prozatím vědci testovali primárně schopnost systému mozkovou aktivitu zachytit a propojit ji s vyřčenými slovy.

Jde o podobnou technologii, na jaké funguje BrainGate2, o němž jsme psali v minulém roce. I ten překládal mozkové signály, ale místo, aby z nich vytvářel řeč, je přímo používal pro ovládání počítače.

Obrázek: Mluvení bez mluvení: čip umí přeložit náš vnitřní monolog v řeč

Budou moci němí lidé promluvit?

Toto rozhraní je však zamýšleno pro podobnou skupinu osob. Znevýhodněným lidem, ať už vlivem vrozené vady nebo jinak, mohou takto pokročilé technologie znatelně pomoci k úplnějšímu a spokojenějšímu životu. Je možné, že práce vědců z Kolumbijské univerzity v budoucnu umožní těžce postiženým pacientům znovu komunikovat se svým okolím, a to nejen prostřednictvím počítače jako u BrainGate, ale i přirozenou řečí.

Studii vedla doktorka Nima Mesgarani, jedna z výzkumnic univerzity specializující se na chování mozku a mozkové vlny.

BCI čip je schopen identifikovat zamýšlená slova tím, že když mluvíme – nebo si mluvení aktivně představujeme – tak mozek vyvolává sice jemné, avšak rozpoznatelné signály. Ty lze dekódovat a následně přetvořit ve verbální projev.

Obrázek: Mluvení bez mluvení: čip umí přeložit náš vnitřní monolog v řeč

První pokusy vědců se setkaly s neúspěchem, počítačové modely založené na analýze spektogramů byly neúspěšné; překvapivě však pomohla technologie, kterou využívá třeba Siri od Applu nebo Alexa od Amazonu – vocoder, elektronický syntetizátor zvuku a řeči. To samozřejmě není nová technologie (pochází už ze 30. let minulého století), avšak ve spojení s pokročilými algoritmy pomáhá zaznamenávat zvuk, řeč a ve výsledku také správně interpretovat mozkovou aktivitu.

Přeložené signály následně „vyčistí“ od přebytečného šumu neuronové sítě. Výsledkem je robotický hlas, který dokáže říct to, co člověk ve své mysli řekl. Přesnost zatím není nejvyšší a složitější věty se chystá tým teprve testovat, technologie je však slibná.

Reálné uplatnění je však přesto roky vzdáleno.

Zdroj: ScienceDaily, Columbia

Obrázek: Doogee má s Českem velké plány. Na MWC 2024 představilo skládací FLIP X a chytrý prsten
Doogee má s Českem velké plány. Na MWC 2024 představilo skládací FLIP X a chytrý prsten
Obrázek: GPU vs. CPU: O kolik akcelerace AI na GPU urychlí práci ve Photoshopu? Změřili jsme rozdíl s NVIDIA RTX 4070
GPU vs. CPU: O kolik akcelerace AI na GPU urychlí práci ve Photoshopu? Změřili jsme rozdíl s NVIDIA RTX 4070
Obrázek: 18 karátů, EKG a cena ojetého auta. Huawei na MWC 2024 ukázal své nejlepší hodinky a notebooky
18 karátů, EKG a cena ojetého auta. Huawei na MWC 2024 ukázal své nejlepší hodinky a notebooky
Obrázek: Jak koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024
Jak koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024
Obrázek: Jak koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024
Jak koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024
Obrázek: Jak rychle nabijete chytrý telefon? Nabíjení Redmi Note 13 Pro+ je rychlejší než vaše ranní káva
Jak rychle nabijete chytrý telefon? Nabíjení Redmi Note 13 Pro+ je rychlejší než vaše ranní káva
Obrázek: Občanka v mobilu od A do Z: Jak nainstalovat a zprovoznit eDoklady?
Občanka v mobilu od A do Z: Jak nainstalovat a zprovoznit eDoklady?
Obrázek: 5 způsobů, jak zjistit zapomenuté heslo K WiFi. Snadno v PC i na mobilu
5 způsobů, jak zjistit zapomenuté heslo K WiFi. Snadno v PC i na mobilu