The Fort Worth Press - Pour grandir, l'IA générative se tourne vers les livres

USD -
AED 3.673042
AFN 68.112673
ALL 94.198378
AMD 389.366092
ANG 1.801814
AOA 913.000367
ARS 1003.735016
AUD 1.538462
AWG 1.8025
AZN 1.70397
BAM 1.877057
BBD 2.018523
BDT 119.468305
BGN 1.877057
BHD 0.376794
BIF 2953.116752
BMD 1
BND 1.347473
BOB 6.908201
BRL 5.801041
BSD 0.99976
BTN 84.384759
BWP 13.658045
BYN 3.27175
BYR 19600
BZD 2.015164
CAD 1.39805
CDF 2871.000362
CHF 0.89358
CLF 0.035441
CLP 977.925332
CNY 7.243041
CNH 7.25914
COP 4389.749988
CRC 509.237487
CUC 1
CUP 26.5
CVE 105.825615
CZK 24.326204
DJF 178.031575
DKK 7.158304
DOP 60.252411
DZD 134.221412
EGP 49.650175
ERN 15
ETB 122.388982
EUR 0.95985
FJD 2.27595
FKP 0.789317
GBP 0.798053
GEL 2.740391
GGP 0.789317
GHS 15.795384
GIP 0.789317
GMD 71.000355
GNF 8617.496041
GTQ 7.717261
GYD 209.15591
HKD 7.78445
HNL 25.264168
HRK 7.133259
HTG 131.234704
HUF 395.000354
IDR 15943.55
ILS 3.70204
IMP 0.789317
INR 84.43625
IQD 1309.659773
IRR 42075.000352
ISK 139.680386
JEP 0.789317
JMD 159.268679
JOD 0.709104
JPY 154.770385
KES 129.468784
KGS 86.503799
KHR 4025.145161
KMF 472.503794
KPW 899.999621
KRW 1404.510383
KWD 0.30785
KYD 0.833149
KZT 499.179423
LAK 21959.786938
LBP 89526.368828
LKR 290.973655
LRD 180.450118
LSL 18.040693
LTL 2.95274
LVL 0.60489
LYD 4.882192
MAD 10.057392
MDL 18.23504
MGA 4666.25078
MKD 59.052738
MMK 3247.960992
MNT 3397.999946
MOP 8.015644
MRU 39.77926
MUR 46.850378
MVR 15.460378
MWK 1733.576467
MXN 20.428504
MYR 4.468039
MZN 63.910377
NAD 18.040693
NGN 1696.703725
NIO 36.786794
NOK 11.072604
NPR 135.016076
NZD 1.714237
OMR 0.384846
PAB 0.99976
PEN 3.790969
PGK 4.025145
PHP 58.939038
PKR 277.626662
PLN 4.16352
PYG 7804.59715
QAR 3.646048
RON 4.778204
RSD 112.294256
RUB 104.308748
RWF 1364.748788
SAR 3.754429
SBD 8.383555
SCR 13.699038
SDG 601.503676
SEK 11.036204
SGD 1.346604
SHP 0.789317
SLE 22.730371
SLL 20969.504736
SOS 571.332598
SRD 35.494038
STD 20697.981008
SVC 8.748021
SYP 2512.529858
SZL 18.034455
THB 34.480369
TJS 10.647152
TMT 3.5
TND 3.17616
TOP 2.342104
TRY 34.552504
TTD 6.790153
TWD 32.583504
TZS 2659.340659
UAH 41.35995
UGX 3694.035222
UYU 42.516436
UZS 12825.951341
VES 46.55914
VND 25419
VUV 118.722009
WST 2.791591
XAF 629.547483
XAG 0.031938
XAU 0.000369
XCD 2.70255
XDR 0.760497
XOF 629.547483
XPF 114.458467
YER 249.925037
ZAR 18.15566
ZMK 9001.203587
ZMW 27.617448
ZWL 321.999592
  • AEX

    13.6800

    879.8

    +1.58%

  • BEL20

    69.4500

    4228.29

    +1.67%

  • PX1

    41.8400

    7255.01

    +0.58%

  • ISEQ

    17.2700

    9613.97

    +0.18%

  • OSEBX

    3.8100

    1468.66

    +0.26%

  • PSI20

    48.3400

    6409

    +0.76%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    86.5000

    2989.04

    +2.98%

  • N150

    24.5300

    3295.3

    +0.75%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: © AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

M.Cunningham--TFWP