Otse põhisisu juurde

E-ITSPEA 13 - Teistmoodi IT

Kõnesüntesaator

Oleme tänapäeval jõudnud aega, kus ka puudega inimesed võivad leida tehnikat, mis võimaldaks neil kas üldse arvutit kasutada või nende arvutikasutamist mugavamaks muuta. Selle nädalases blogipostituses tutvusan ühte sellist tehnilist lahendust- kõnesüntesaatorit.

Kõnesüntesaatorit kasutatakse tihti ekraanilugejaga. Midagi keerulist tegelikult ei ole- arvuti või mõni muu masin loeb inimesele simuleeritud häälega etteantud teksti. Seda tehnoloogiat kohtab ka vahel text-to-speech(TTS) nime all.

Kuidas täpsemalt see tehnoloogia siis töötab?

Kõnesünteesi esimene etapp on normaliseerimine. Selle etapi eesmärgiks on vähendada lause ebaselgust. Asju on võimalik lugeda mitmel erineval viisil ja esimene etapp peaks vähendama arusaamatuste tekkimist. Kõiksugused numbrid (kuupäevad, kellaajad), lühendid ja erimärgid muudetakse selles osas sõnadeks. Esimeses etapis peaks ka toimuma ka analüüs, et aru saada kuidas homograafe(sõnad, mida kirjutatakse ühte moodi, aga hääldatakse teistmoodi) lugeda.

Nüüd, kui on olemas täpne tekst, mida lugeda, on vaja nüüd imiteerida häält. Arvutil või programmil on vaja selleks foneemide nimekirja. Programm analüüsib sõna ja paneb sellega kokku õiged foneemid. Alternatiivse variandina võtab programm sõna ja jagab selle ära grafeemideks ja siis genereerib vastavad foneemid.

Viimase etapina on nüüd vaja muuta foneemid heliks. Kust need foneemid saada? On olemas erinevaid variante. Mõned programmid kasutavad inimese poolt öeldud foneeme. Mõned programmid kasutavad foneeme, mis on arvuti poolt genereeritud, kolmas variant imiteerib inimhäält. 

Kõnesüntosaatori kasulikkus

Nägemispuudega inimestel võib kõnesüntosaator olla väga kasuliku abivahendina. Lisaks on see väga kasulik tumma inimese jaoks. Ei pruugi alati sattuda keskkonda, kus inimesed mõistavad viipekeelt, aga inimesel on siiski midagi öelda, sellisel juhul saab inimene siiski osa võtta vestlusest kasutades kõnesüntosaatorit. Kurtide jaoks on leiab kõnesüntees kasutust, kui inimene näiteks soovib midagi vaadata ja sooviks teada, millest video või film räägib. Kõnesüntesaatoriga tekiksid subtiitrid, mis võimaldaksid inimesel filmi- või videolõiku vaadata. Ka autistide jaoks saab kõnesüntees abiks olla. Sellisel juhul valiks inimene mõned pildid, mis siis konverteeritakse sõnadeks ja seejärel lauseteks. 




Kasutatud allikad:

* https://www.explainthatstuff.com/how-speech-synthesis-works.html

*https://www.researchgate.net/publication/291103068_How_Speech_Technologies_Can_Help_People_with_Disabilities


Kommentaarid

Populaarsed postitused sellest blogist

ITSPEA 01 - Ebaõnnestunud projektid IT maailmas

Suurema osa jaoks on IT toodangud pigem see, mida nad kasutavad, seega inimesed teavad pigem edukatest projektidest. Kardina taha jääb ka aga hulgaliselt innovatsioone, mis ei jää pinnale püsima. Selle nädala postituses tutvustan 3 erinevat innovatsiooni/projekti, mida loetakse läbikukkunuks.  Polavision Kõik teavad tänapäeval, mis on polaroid kaamera. Polaroid kaamera on The Polaroid Corporationi kõike kuulsam toode, mis on turul olnud juba aastast 1948. Polaroid oli üks edukaim sõjajärgne firma, kuid nende strateegia ei olnud täiuslik. Nad arvasid,et nende äri on pigem rida tehnoloogilisi väljakutseid ning ei võtnud arvesse turul olevaid väljakutseid. Nende plaan töötas küll teiste toodetega, aga mitte Polavisioniga. Polavision pidi olema nende tehnoloogiline läbimurre- sarnaselt polaroid kaamerale, pidi see tootma kiirfilme. Polavision koosnes kaamerast, filmilindist ning spetsiaalsest filmi vaatamise aparaadist. Tootel oli palju puuduseid- filmilõigud said olla kõigest 2,5 minu...

ITSPEA 02 - emotikonid ja disketid

Emotikonid Emotion + icon = emoticon Emotikone kasutatakse emotsioonide väljendamiseks. Emotikone ei tohiks segi ajada emojidega. Emotikon on kirjavahemärkide kombinatsioon (näiteks :)), emojid on aga väikesed digitaalsed pildid. Mõnda emotikoni loetakse ka emojiks. Emojid, mis kujutavad nägu, mis annab edasi emotsiooni, loetakse emotikoni kategooria alla. Lisaks nendele kahele on olemas ka kaomojid. Tekkisid emotikonidega umbes samal ajal. Mõned näited: (‐^▽^‐), °˖✧◝(⁰▿⁰)◜✧˖°, (。・ω・。) Esimest korda kasutati emotikoni oletatavalt 1979 aastal. Tõestatud esimene kord oli aga 19. september 1982. Arvutiteadlane Scott Fahlman pakkus välja, et teadetetahvlil :-) ja :-( kasutamine aitaks eristada naljakaid postitusi tõsistest postitustest.  Emotikoni kasutamine on saanud nii kriitikat kui ka toetust. Kriitikud väidavad, et emotikonide kasutamine kahjustab inimeste oskust selgelt suhelda. Nad arvavad,et nii kaob loov eneseväljendamine küberruumis. Mõned on isegi öelnud, et e...

EITSPEA 9 - erinevad IT juhid

. "The very essence of leadership is that you have the vision. You can't blow an uncertain trumpet."  - Theodore M. Hesburg On erinevat tüüpi juhte, iga firma juht on omapärase juhtimisviisiga, mis võib olla mitu erinevat juhirolli, kuid võib ka suures osas olla tugevalt üks.  Elon Musk Elon Musk on nimi, mida ei pea tänapäeval väga pikalt tutvustama. Elon Musk on ettevõtja, insener, investor ning leiutaja. Musk on SpaceX tegevjuht ja tehnoloogiajuht, Tesla tegevjuht ja tootearhitekt, SolarCity esimees ning OpenAI kaasesimees. Tema alluvuses olevate firma nimekirjast on juba näha, et tegemist on innovatiivse inimesega.  Suures osas on Elon Musk arengumootori rollis, seda teame me kõik, aga kas on ka veel mõni roll, mille alla ta juhtimisstiil võiks minna? Jah, näiteks on ta ka teavitaja/suhtleja tüüpi liider. Elon Musk on liider, kes tahaks teada, kui on mõni probleem. Lisaks sellele on ta ka juht. Ta teab kuhu ta tahab jõuda ja sihikindlalt suunab oma meeskonda selle poo...