Otse põhisisu juurde

E-ITSPEA 13 - Teistmoodi IT

Kõnesüntesaator

Oleme tänapäeval jõudnud aega, kus ka puudega inimesed võivad leida tehnikat, mis võimaldaks neil kas üldse arvutit kasutada või nende arvutikasutamist mugavamaks muuta. Selle nädalases blogipostituses tutvusan ühte sellist tehnilist lahendust- kõnesüntesaatorit.

Kõnesüntesaatorit kasutatakse tihti ekraanilugejaga. Midagi keerulist tegelikult ei ole- arvuti või mõni muu masin loeb inimesele simuleeritud häälega etteantud teksti. Seda tehnoloogiat kohtab ka vahel text-to-speech(TTS) nime all.

Kuidas täpsemalt see tehnoloogia siis töötab?

Kõnesünteesi esimene etapp on normaliseerimine. Selle etapi eesmärgiks on vähendada lause ebaselgust. Asju on võimalik lugeda mitmel erineval viisil ja esimene etapp peaks vähendama arusaamatuste tekkimist. Kõiksugused numbrid (kuupäevad, kellaajad), lühendid ja erimärgid muudetakse selles osas sõnadeks. Esimeses etapis peaks ka toimuma ka analüüs, et aru saada kuidas homograafe(sõnad, mida kirjutatakse ühte moodi, aga hääldatakse teistmoodi) lugeda.

Nüüd, kui on olemas täpne tekst, mida lugeda, on vaja nüüd imiteerida häält. Arvutil või programmil on vaja selleks foneemide nimekirja. Programm analüüsib sõna ja paneb sellega kokku õiged foneemid. Alternatiivse variandina võtab programm sõna ja jagab selle ära grafeemideks ja siis genereerib vastavad foneemid.

Viimase etapina on nüüd vaja muuta foneemid heliks. Kust need foneemid saada? On olemas erinevaid variante. Mõned programmid kasutavad inimese poolt öeldud foneeme. Mõned programmid kasutavad foneeme, mis on arvuti poolt genereeritud, kolmas variant imiteerib inimhäält. 

Kõnesüntosaatori kasulikkus

Nägemispuudega inimestel võib kõnesüntosaator olla väga kasuliku abivahendina. Lisaks on see väga kasulik tumma inimese jaoks. Ei pruugi alati sattuda keskkonda, kus inimesed mõistavad viipekeelt, aga inimesel on siiski midagi öelda, sellisel juhul saab inimene siiski osa võtta vestlusest kasutades kõnesüntosaatorit. Kurtide jaoks on leiab kõnesüntees kasutust, kui inimene näiteks soovib midagi vaadata ja sooviks teada, millest video või film räägib. Kõnesüntesaatoriga tekiksid subtiitrid, mis võimaldaksid inimesel filmi- või videolõiku vaadata. Ka autistide jaoks saab kõnesüntees abiks olla. Sellisel juhul valiks inimene mõned pildid, mis siis konverteeritakse sõnadeks ja seejärel lauseteks. 




Kasutatud allikad:

* https://www.explainthatstuff.com/how-speech-synthesis-works.html

*https://www.researchgate.net/publication/291103068_How_Speech_Technologies_Can_Help_People_with_Disabilities


Kommentaarid

Populaarsed postitused sellest blogist

ITSPEA 01 - Ebaõnnestunud projektid IT maailmas

Suurema osa jaoks on IT toodangud pigem see, mida nad kasutavad, seega inimesed teavad pigem edukatest projektidest. Kardina taha jääb ka aga hulgaliselt innovatsioone, mis ei jää pinnale püsima. Selle nädala postituses tutvustan 3 erinevat innovatsiooni/projekti, mida loetakse läbikukkunuks.  Polavision Kõik teavad tänapäeval, mis on polaroid kaamera. Polaroid kaamera on The Polaroid Corporationi kõike kuulsam toode, mis on turul olnud juba aastast 1948. Polaroid oli üks edukaim sõjajärgne firma, kuid nende strateegia ei olnud täiuslik. Nad arvasid,et nende äri on pigem rida tehnoloogilisi väljakutseid ning ei võtnud arvesse turul olevaid väljakutseid. Nende plaan töötas küll teiste toodetega, aga mitte Polavisioniga. Polavision pidi olema nende tehnoloogiline läbimurre- sarnaselt polaroid kaamerale, pidi see tootma kiirfilme. Polavision koosnes kaamerast, filmilindist ning spetsiaalsest filmi vaatamise aparaadist. Tootel oli palju puuduseid- filmilõigud said olla kõigest 2,5 minu...

EITSPEA 04 - Eesti infoühiskonna arengukavast

 Väike hoiatus Lugesin läbi Eesti infoühiskonna arengukava 2020 (https://www.mkm.ee/sites/default/files/elfinder/article_files/eesti_infouhiskonna_arengukava.pdf) Infoühiskonna visioon 2020 peatüki ning üritan selles blogipostituses välja tuua, mida mina tavainimesena tunnen. Kas asjad peavad paika või mitte. Seega ei saa seda blogipostitust võtta kui raudbolt tõenda ja tuleb lugeda pigem sellise pilguga, et vajadusel saaks kommentaarides kaasa arutada. Inimeste parem elu - suures osas realiseeritud visioon Ma ütleks, et see punkt on kõige rohkem täide viidud punkt. Esimene eesmärk selles punktis oli, et Eestis oleks endiselt vaba ja avatud infoühiskond. Seega ei piirata netivabadust. Ma ütleks, et see on mingil määral hea, et inimesed saavad tunda ennast netis vabalt ja saavad ennast väljendada, kuid kahjuks toob see kaasa ka seda, et valeinfo liigub kiiresti ja madalama haritustasemega inimesed tihtipeale ei suvatsegi otsida ja uurida õigeid allikaid vaid usuvad seda, mida esimes...

EITSPEA 9 - erinevad IT juhid

. "The very essence of leadership is that you have the vision. You can't blow an uncertain trumpet."  - Theodore M. Hesburg On erinevat tüüpi juhte, iga firma juht on omapärase juhtimisviisiga, mis võib olla mitu erinevat juhirolli, kuid võib ka suures osas olla tugevalt üks.  Elon Musk Elon Musk on nimi, mida ei pea tänapäeval väga pikalt tutvustama. Elon Musk on ettevõtja, insener, investor ning leiutaja. Musk on SpaceX tegevjuht ja tehnoloogiajuht, Tesla tegevjuht ja tootearhitekt, SolarCity esimees ning OpenAI kaasesimees. Tema alluvuses olevate firma nimekirjast on juba näha, et tegemist on innovatiivse inimesega.  Suures osas on Elon Musk arengumootori rollis, seda teame me kõik, aga kas on ka veel mõni roll, mille alla ta juhtimisstiil võiks minna? Jah, näiteks on ta ka teavitaja/suhtleja tüüpi liider. Elon Musk on liider, kes tahaks teada, kui on mõni probleem. Lisaks sellele on ta ka juht. Ta teab kuhu ta tahab jõuda ja sihikindlalt suunab oma meeskonda selle poo...