Text to speech da voce ad un Atari 2600
di Michele Novarina · Agosto 30, 2020
Ciao a tutti amici di commodoreblog.com, vi ricordate gli albori del text to speech? Quando era una soddisfazione incredibile far pronunciare parole e discorsi al proprio amato computer 8 bit.
Text to speech su Atari 2600
Personalmente passavo ore a cercare di far parlare il mio buon C64 in un italiano più corretto possibile, compresa la pronuncia. Questa passione non ha mai avuto fine, andiamo a leggere cosa è successo.
Mentre gironzolavo on line leggo sul buon sito Hackaday che qualcuno è riuscito a far parlare anche un Atari 2600. Ritorniamo un attimo indietro nel tempo. All’inizio degli anni ’80, c’era una certa moda nel far produrre al computer il linguaggio umano. Si passava a metodi ruspanti e caserecci tramite software a sistemi più elaborati. Infatti esistevano diverse soluzioni hardware per far parlare un computer: si aggiungevano voci ovunque si potesse, dai sistemi telefonici automatizzati alle console per videogiochi.
Text to speech, ecco il SAM
Chi ricorda Steve Jobs che utilizzò questo sistema per introdurre Macintosh nel mondo nel 1984? In precedenza, esattamente nel 1982, è stata rilasciata per la linea di computer Atari a 8 bit una versione software di questa sintesi e da allora qualcuno si è chiesto se potesse funzionare o meno sul 2600, macchina molto limitata a livello sonoro.
Ebbene si, ci sono voluti 38 anni ma la risposta è sì: era davvero possibile portare una variante del Software Automatic Mouth (o SAM) per far parlare l’Atari 2600 senza alcun hardware aggiuntivo.
Che stratagemma è stato utilizzato?
Per essere in grado di adattare un software così complicato per l’epoca in soli 128 byte di RAM, viene utilizzo uno strumento di authoring per pre-calcolare gli allofoni e memorizzare solo quelli nella ROM. In questo modo, il 2600 da solo non può convertire il testo in fonemi, ma c’è abbastanza spazio rimasto per gli allofoni, che vengono convertiti in suono. Praticamente circa due minuti di discorso possono stare in una cartuccia.
È ciò di cui avevamo bisogno adesso
Può sembrare, agli occhi dei giovani d’oggi, una perdita di tempo, qualcosa di inutile. Ma è bello riportare le esatte parole dello scopritore di questo sistema: “Because creating digital swears with 1982 speech synthesis technology on a 1977 game console is exactly what we need right now”
Per questo progetto l’autore, ovvero Rossumur, ha scritto un articolo incredibilmente interessante sulla sintesi vocale per spiegare il motore SAM qui utilizzato. Un personaggio che riesce a far girare software dove non dovrebbe e non potrebbe, come un servizio di streaming simile a “Netflix” o di emulatori di console a 8 bit. Entrambi su nient’altro che un ESP32 microcontroller. Per farvi un’idea del mezzo miracolo vi lascio questo LINK
Ora vi saluto amici lettori, Mic the Biker vi da appuntamento al prossimo articolo. Ora qualche consiglio per voi dal nostro blog.