Avtor: Scientific Reports, M. Š
Ameriški znanstveniki so ustvarili sistem, ki misli prevaja v razumljiv in prepoznan govor. S spremljanjem aktivnosti možganov tehnologija rekonstruira človeške misli in jih prevede v besede. Gre z prvo tovrstno odkritje sploh, objavili pa so ga v strokovni reviji Scientific Reports.
Prebojno odkritje povezuje umetno inteligenco in sintetizatorje govora z možgani ter tudi nakazuje nove možnosti pomoči ljudem, ki ne morejo govoriti, na primer bolnikom z amiotrofično lateralno sklerozo ali tistim, ki okrevajo po možganski kapi.
»Govor je naše bistveno orodje za sporazumevanje z okolico, zato je njegova izguba zaradi poškodbe ali bolezni izjemno neprijetna,« je povedal vodja raziskovalne skupine dr. Nima Mesgarani iz Univerze Columbia.
»Dokazali smo, da s sodobno tehnologijo lahko dekodiramo misli ter jih spremenimo v obliko, ki jo okolica sliši in razume.«
Desetletja raziskav so pokazala, da, ko ljudje govorijo ali si predstavljajo govorjenje,v možganih nastajajo določeni vzorci. Pojavljajo se tudi, kadar poslušamo nekoga, ki govori, ali si predstavljamo poslušanje. Znanstvenikom jih je uspelo posneti in prevesti v verbalno obliko.
Računalniški modeli niso dali rezultatov
Na začetku zahtevnega izziva se je ekipa dr. Mesgaranija osredotočila na preproste računalniške modele, ki so analizirali vizualizirane predstavitve zvočnih frekvenc. Pristop se ni izkazal za uspešnega, saj niso uspeli ustvariti ničesar, kar bi bilo podobno razumljivemu govoru. Potem so uporabili vokoder – računalniški algoritem, ki sintetizira govor na osnovi dejanskih posnetkov govora. Gre za enako tehnologijo, kot jo uporabljajo pametni telefoni.
“S posnetimi nevronskimi vzorci so trenirali vokoder ter – uspeli.”
Prof. Mesragani se je v nadaljevanju projekta povezal z dr. Asheshom Dineshom Mehto, ki operativno zdravi bolnike z epilepsijo. Bolnike so prosili, naj poslušajo izjave različnih ljudi, medtem pa so jim merili možgansko aktivnost. Z dobljenimi nevronskimi vzorci so potem »trenirali« vokoder.
Novo upanje za bolnike z izgubo govora
Nato so raziskovalci prosili iste bolnike, naj preko zvočnikov poslušajo številke od 0 do 9, možganske signale, ki so se pri tem kreairali, pa so vodili skozi vokoder. Sledni je kot odgovor ustvaril zvok, ki so ga analizirali in očistili z sistemom umetne inteligence, ki posnema strukturo nevronov v pravih možganih. Končni rezultat je bil robotski zvok, ki je recitiral zaporedje številk. Ko so ga prevajali skupini prostovoljcev, so ugotovili, da so ga razumeli in ponovili v približno 75 odstotkih primerov.
“Sistem v vsadku bi posnel možganske signale, ki jih ta misel generira, in jih pretvoril v sintetizirani govor.”
V bodoče nameravajo na enak način testirati tudi bolj zapletene besede in stavke ter sistem uporabiti pri možganskih signalih, ki se oddajajo, ko oseba predstavlja govor. Po tem »scenariju« bi uporabnik možganskega vsadka na primer pomislil, da potrebuje kozarec vode (na primer), sistem pa bi posnel možganske signale, ki jih ta misel generira, in jih pretvoril v sintetizirani govor. To bi ljudem, ki so izgubili govor zaradi poškodbe ali bolezni, omogočilo, da se znova verbalno povežejo z okolico.
Sorodne vsebine:
Foto: Bigstock