Text to speech

Provade Elevenlabs text-to-speech och jag tycker att den låter oerhört bra. Inte riktigt som en skådespelare än, men frågan är om man inte skulle stå ut med att lyssna på en hel bok med denna teknik. Nackdelen är att man bara får cirka tio minuter gratis per månad annars hade jag använt det för att korr-lyssna på mina texter. Två timmar per månad kostar mer än hundringen, tio mer än tusenlappen. Men kanske värt att prenumerera på i några månader för att slutlyssna på sin roman och hitta de sista(!!) felen? Min senaste roman, Rubato, skulle ta drygt nio timmar att få uppläst räknade jag ut baserat på exemplen nedan.

Det skapas en ljudfil som man kan ladda ner som man kan lyssna på själv eller låta någon annan lyssna på. På svenska finns tre röster med olika fokus, romaner, reklam mm. Dessutom kan man konfigurera lite hur rösten ska låta.

Först ett prov ur inledningen till Cadenza, min debutroman:
“Johannes stod ensam vid mikrovågsugnen i det trånga lunchrummet för att värma sin matlåda när Klara kom in. Hon hade varit frånvarande under några dagar efter det att hon inte återvänt efter en lunch. När han frågat efter henne visade det sig att varken någon av kollegorna eller hennes chef visste orsaken.
Den allvarliga uppsyn han skönjde i hennes ansikte fick honom att känna en viss oro. I stället för att låta sig dras med i den sa han så obesvärat han förmådde:
– Åh, du är tillbaka?
– Ja.
Utan att se på honom tog hon fram sin egen medhavda lunch ur den ryggsäck som hängde på hennes högra axel, och väntade på sin tur till mikrovågsugnen. Då hon oftast gärna glatt inlett samtal med honom förstärktes hans oro. Deras lunchlådor bytte plats i det av radiovågor intensivt bestrålade utrymmet och under tystnad iakttog de ugnens tidur. Till slut frågade han henne:
– Har det hänt något?
Klara såg länge forskande på honom innan hon med ansträngd röst sa:
– Jag har fått en cancerdiagnos.
Innan han hann säga något fortsatte hon:
– Mitt högra bröst är angripet.”

Sedan ett prov på ett avsnitt ur Rubato, del två i serien om Klara och Johannes. Notera att både ellips och inbäddade tankstreck fungerar. Det finns några underliga konstpauser och betoningar, men annars otroligt bra.

Hon la sig på rygg och försiktigt, försiktigt pressade han. Lirkade. Plötsligt kände han hur hennes mjuka inre omslöt hans hårda yttre. För att inte orsaka henne smärta rörde han sig mycket sakta. Med näsan djupt i hennes nyckelbensgrop andades han långsamt in genom den och lät den fyllas av … henne. Deras rörelser i samklang. Den mörka lena huden gled mjukt mot den ljusa, sträva. Som vore hon de svarta tangenterna på en böljande klaviatur, var han de vita. Blott ett halvt tonsteg skilde dem åt när de framförde sin kärleksduett. Hennes ögon var slutna som om hon inte riktigt var där. Inte ville vara där. Precis som i bilen i början på året kände han sig kluven inför denna fullbordan och de slutna ögonen antydde att hon delade hans känsla. Bilden av den intelligenta – musikaliska – kunniga gick inte riktigt ihop med den av åtrå fyllda. Kanske inte för någon av dem. Inte än.

Här är ett annat exempel med en längre dialog ur samma bok. Betoningarna är kanske inte lika bra här, däremot urskiljer sig ju repliken från den vanliga texten så man förstår direkt att det är någon som talar. Jag noterade att ordet “skrek” i en av replikerna inte tolkades av rösten.

Klockan var närmare nio när han kom in i radhuset och hängde av sig jackan. Det “Hej” han ropade upp till övervåningen där Erika oftast satt, besvarades inifrån vardagsrummet. Han gick fram till trappan som avgränsade vardagsrummet från köket och sa:
– Sitter du här? Jag trodde du jobbade som vanligt.
– Nej. Och du har inte heller jobbat som vanligt eller hur? Det är fredag och klockan är nästan nio när du kommer hem. I går kom du hem mycket sent efter att ha vattnat blommorna hos Cecilia. Sist jag såg på klockan innan jag somnade, var hon nästan elva. Hennes blommor måste ha varit väldigt törstiga. Var har du varit?
– Jobbat.
– Sluta nu! Jag frågar igen. Var har du varit?
Sanningens minut, en gång till. Det hade nu snart gått tre månader sedan han bestämt sig för att bryta med Erika.
– Jag vill att vi separerar.
– Är det helt omöjligt att besvara min fråga. Var fan har du varit? skrek hon och lutade sig mot honom med ena handen stödd mot soffbordet.
Det var en helt ny Erika som satt framför honom. Den lugnt resonerande kvinnan var bortblåst. Med en ansträngd röst sa han nu som det var.
– Jag har varit med Klara. Både i går och i dag. Vi har en kärleksrelation.
Hon lutade sig tillbaka i soffan igen och sa med en mer normal röst:
– Äntligen talar du sanning.
Han övervägde att sätta sig i fåtöljen som stod intill soffbordet, men då den befann sig i fiendeland, stod han kvar. I stället upprepade han sitt haiku-baserade beslut:
– Jag vill som sagt att vi separerar.


Som jämförelse ett exempel på när Word läser en del av dialogen ovan. Sluddrar på flera ställen och rösten är väldigt entonig och svårt att lyssna på under någon längre stund.
– Nej. Och du har inte heller jobbat som vanligt eller hur? Det är fredag och klockan är nästan nio när du kommer hem.


Edit: Om man använder deras app, verkar det vara obegränsat men då får man ingen ljudfil. Jag provade att ladda upp min pågående roman (som just nu är på drygt 250 sidor (~65000 ord)) till appen och det gick utan problem.

Leave a Reply

Your email address will not be published. Required fields are marked *