Google-ov AI tim na svom blogu je objavio kako je nadogradio prepoznavanje govora u Gboard tastaturi funkcijom koja omogućava prepoznavanje po sistemu jednog po jednog slova onako kako su izgovorena, a to sada radi direktno na pametnom telefonu bez potrebe za online servisom u oblaku.
Google kaže da je hteo da napravi prepoznavanje govora koje će biti dovoljno kompaktno da može raditi direktno na telefonu, kako korisnici ne bi više morali da zavise os često nepouzdanim ili nedostupnim Wi-Fi ili mobilnim mrežama.
Prepoznavanje govora obično radi "razbijanjem" izgovorenih reči u manje delove, takozvane foneme, a softver za prepoznavanje analizira redosled, uzorak i kontekst fonema kako bi stvarao rečenice. To obično stvara lag jer morate čekati da softver napravi najbolju pretpostavku o onome što ste rekli. Google-ovi AI stručnjaci kažu da njihov model "izbacuje jedno po jedno slovo kako govorite sa praznim mestima (razmacima između reči) na pravim mestima".
To znači da će Gboard prepoznati svako pojedinačno slovo u rečima koje izgovorite čim ih izgovorite, umesto da prepoznaje foneme kao drugi programi za transkripciju.
Nova funkcija za sada je dostupna samo za američki engleski jezik i radi isključivo na Pixel telefonima, ali Google-ov AI tim je u budućnosti namerava proširiti na više jezika i više uređaja.
Google-ovo prepoznavanje govora radi offline
05:11
nema komentara
Postavi komentar
Vaš komentar: