Talsyntes kommer aldrig att ersätta den mänskliga rösten. Framför allt inte i en ljudbok. Du har säkert hört resonemanget, som bygger på dagens teknik men framför allt gårdagens teknik. Det beror också på att vi ännu inte tagit de sista stegen på trappan till helautomatiskt upplästa böcker, självläsande böcker.
Talsyntes är ingenting nytt. Faktum är att man skulle kunna hävda att skriftspråket endast är ett sätt att lagra talade ord för att de senare ska kunna återges.
När vi väl uppfann tryckkonsten så fanns dessutom ett effektivt sätt att massproducera berättelser. Faktum är att människan långt före Gutenberg försökte bygga maskiner som skulle kunna emulera mänskligt tal. Det första stora framsteget kom 1779 när Christian Gottlieb Kratzenstein konstruerade en modell som kunde återge fem vokalljud: [aː], [eː], [iː], [oː] och [uː].
Den följdes av Wolfgang von Kempelen som 1791 beskrev en maskin som även kunde återge konsonanter. Många år senare byggde Charles Wheatstone vidare på von Kempelens landvinningar med en talande maskin 1837.
Den österrikiske uppfinnaren Joseph Faber ägnade 25 år åt att utveckla sin talande maskin som presenterades 1845. Den innehöll blåsbälg, ett piano och mekanisk replika av ett mänskligt svalg och röstorgan. Genom att trycka på olika tangenter kunde en människa styra maskinen och få den att återge hela meningar på engelska, tyska och franska. Alla med en tysk brytning, noterade journalister vid utställningen i London 1846.
Det skulle dröja nästan ett århundrade innan utvecklingen tog fart på allvar. På 1930-talet utvecklade Bell Labs något de kallade en Vocoder som analyserade mänskligt tal. Denna teknik låg sedan till grund för utvecklingen av den första elektroniska talsynthesizern, The Voder.
FÖR ATT LÄSA RESTEN AV ARTIKELN
KRÄVS EN INSIDER-PRENUMERATION
Bli prenumerant och få Analysbrevet direkt i din mejlbox och tillgång till hela arkivet.
