The Fort Worth Press - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.67297
AFN 70.835625
ALL 86.330302
AMD 388.979073
ANG 1.80229
AOA 915.501353
ARS 1194.921141
AUD 1.545141
AWG 1.8
AZN 1.735859
BAM 1.72067
BBD 2.019048
BDT 121.496602
BGN 1.720695
BHD 0.376986
BIF 2974.752874
BMD 1
BND 1.291083
BOB 6.910295
BRL 5.700504
BSD 1.000022
BTN 84.710644
BWP 13.559277
BYN 3.27258
BYR 19600
BZD 2.008666
CAD 1.37945
CDF 2871.000074
CHF 0.82369
CLF 0.024451
CLP 938.309967
CNY 7.21705
CNH 7.221065
COP 4302.61
CRC 506.081869
CUC 1
CUP 26.5
CVE 97.008754
CZK 21.930982
DJF 178.071646
DKK 6.567202
DOP 58.861052
DZD 132.580769
EGP 50.630303
ERN 15
ETB 134.372869
EUR 0.880135
FJD 2.254349
FKP 0.748092
GBP 0.749115
GEL 2.745051
GGP 0.748092
GHS 13.37451
GIP 0.748092
GMD 70.999787
GNF 8660.537545
GTQ 7.693661
GYD 209.209328
HKD 7.75874
HNL 25.978048
HRK 6.632398
HTG 130.69969
HUF 355.619501
IDR 16514.45
ILS 3.583945
IMP 0.748092
INR 84.781302
IQD 1309.988342
IRR 42112.503473
ISK 128.769553
JEP 0.748092
JMD 158.694409
JOD 0.709299
JPY 143.385496
KES 129.139806
KGS 87.449734
KHR 4003.290617
KMF 433.466171
KPW 899.977045
KRW 1391.099256
KWD 0.306599
KYD 0.8333
KZT 514.510701
LAK 21624.808084
LBP 89598.835086
LKR 299.390713
LRD 199.99736
LSL 18.289183
LTL 2.95274
LVL 0.60489
LYD 5.459024
MAD 9.216381
MDL 17.094491
MGA 4452.011104
MKD 54.132395
MMK 2099.476264
MNT 3576.208671
MOP 7.993577
MRU 39.616417
MUR 45.440201
MVR 15.409451
MWK 1733.996736
MXN 19.627697
MYR 4.238992
MZN 63.898905
NAD 18.29039
NGN 1607.849656
NIO 36.803555
NOK 10.273885
NPR 135.53703
NZD 1.670732
OMR 0.385009
PAB 1.000031
PEN 3.6544
PGK 4.149034
PHP 55.353045
PKR 281.368849
PLN 3.764696
PYG 7991.90604
QAR 3.645449
RON 4.496901
RSD 103.134417
RUB 81.023583
RWF 1436.521448
SAR 3.750841
SBD 8.357828
SCR 14.230954
SDG 600.498647
SEK 9.59708
SGD 1.29148
SHP 0.785843
SLE 22.730137
SLL 20969.483762
SOS 571.45371
SRD 36.850284
STD 20697.981008
SVC 8.749395
SYP 13001.645496
SZL 18.27948
THB 32.701002
TJS 10.374858
TMT 3.5
TND 2.996437
TOP 2.342102
TRY 38.64337
TTD 6.786178
TWD 30.280988
TZS 2707.000204
UAH 41.438877
UGX 3658.997933
UYU 41.868649
UZS 12923.943166
VES 88.61243
VND 25962.5
VUV 120.667614
WST 2.663993
XAF 577.139891
XAG 0.03036
XAU 0.000295
XCD 2.70255
XDR 0.718649
XOF 577.096732
XPF 104.929283
YER 244.499729
ZAR 18.289102
ZMK 9001.202631
ZMW 26.724384
ZWL 321.999592
  • AEX

    0.9900

    896.53

    +0.11%

  • BEL20

    -38.4100

    4427.4

    -0.86%

  • PX1

    -49.2600

    7647.55

    -0.64%

  • ISEQ

    147.3300

    10823.36

    +1.38%

  • OSEBX

    -1.5100

    1507.46

    -0.1%

  • PSI20

    -2.1000

    7006.26

    -0.03%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -52.6900

    2874.47

    -1.8%

  • N150

    -9.7300

    3464.3

    -0.28%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

G.Dominguez--TFWP