torstai 26. maaliskuuta 2020

Live Transcribe muuntaa sanelun lennossa tekstiksi

Googlen Live Transcribe on näppärä ohjelma, joka muuntaa sanelun lennossa tekstiksi. Se tukee yli 70 kieltä, myös suomea. Ohjelma on tarkoitettu heikosta kuulosta kärsiville, koska sen avulla pystyy seuraamaan ihmisten keskustelua. Mutta se sopii paljon muuhunkin.

Parasta ohjelmassa on sen käytön helppous. Ei tarvitse kuin käynnistää, ja ohjelma on valmis. Sanelua ei tarvitse sammuttaa eikä käynnistää, se tekee kaiken automaattisesti. Ohjelma tunnistaa myös mikrofoniin käyvän tuulen sekä yskän.

Valmiina kuunteluun.
Kun puhe alkaa, ohjelma muuttaa sen tekstiksi automaattisesti:

Sanelua Hesarin uutisesta.
Teksti säilyy ohjelmassa kolme vuorokautta. Sitä ei tarvitse erikseen tallentaa, mutta kiinnostavat kohdat voi kopioida leikepöydän kautta toiseen sovellukseen.

Oletusarvona on valkoinen teksti mustalla pohjalla, mutta sen voi kääntää. Fonttikokoa voi säätää, kuvassa on pienin (!) vaihtoehto. Koska ohjelma on tarkoitettu apuvälineeksi, tekstin on oltava riittävän isoa.

Kieliä voi valita kaksi, jolloin se litteroi esimerkiksi suomea ja englantia sekaisin (tai ruotsia). Oletusarvona on vain yksi kieli, suomi.

Testasin ohjelmaa toistamalla hallituksen tiedotustilaisuudesta Sanna Marinin ja Ohisalon puhetta. Molemmat puhuvat selkeästi ja sanojen välillä on jopa epäluonnollisen pitkiä välejä. Tulokset olivat sekä hämmästyttävän hyviä että yllättävän huonoja.

Ministeri puhuu, ohjelma tekstittää.
Tekstimuunnos on mielenkiintoinen, sillä teksti "elää" taaksepäin, kun tulkki analysoi asiayhteyttä ja käy vaihtamassa vanhoja sanoja uusiin.

Ministerien puhe tallentui ymmärrettävästi, mutta lauseiden ja sanojen vaihtokohdat ovat yhä ongelmallisia.

Tekoäly ei oikeasti ole älyä. Ilmeisesti Google yrittää koko ajan löytää jo aiemmin käännetyistä teksteistä sopivia vastineita, mikä tuottaa yllätyksiä. Yksi sellainen näkyy kuvassa:

"Oliko se sitten tämä?"
Jostain ohjelma keksii lisätä väliin "Oliko se sitten tämä?" -kysymyksen, vaikka mitään sen kaltaistakaan ei esiintynyt puheessa.

Paikoin tekstitys menee täysin oikein. Esimerkiksi peruspalveluministeri Kiuru kirjoitetaan isolla alkukirjaimella, ei lintulajina.

Ministeri Kiuru isolla K:lla.
Toisaalta iso alkukirjain tulee myös väärään kohtaan:

"Ei siis Anna eduskunnalle"
Tässä tilanteessa anna ei ole naisen nimi vaan verbi.

Yksi ongelma on siinä, että valmistellussakin puheessa ihmiset takeltevat ja sotkevat sanoja, haastatteluista puhumattakaan. Korva osaa ohittaa ne ja korjata virheet ilman, että kiinnitämme edes huomiota koko asiaan, mutta ohjelma ottaa kaiken kirjaimellisesti ja tulkinta menee helposti sekaisin.

Kaiken kaikkiaan Live Transcribe on näppärä apu esimerkiksi omia saneluita varten. Siitä on apua myös kun halutaan esimerkiksi tekstiä kirjan sivulta sähköiseen muotoon: luetaan teksti ääneen ja korjataan ne muutamat virheet, joita tunnistus tekee. Useimmille nopeampi ja helpompi tapa kuin koko tekstin kirjoittaminen näppäimistöltä, jos skanneria ja OCR-ohjelmaa ei ole saatavilla.

Live Transcribe toimii vain Androidissa. iPhone-versiota ei ole. Ehkä jokin toinen sovellus täyttäisi tarpeen? Samsungilla ja muilla puhelinvalmistajilla on omia saneluohjelmia, mutta ne eivät yleensä tue suomen kieltä.

Ei kommentteja:

Lähetä kommentti