The Fort Worth Press - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.673042
AFN 67.503991
ALL 93.050403
AMD 389.764479
ANG 1.803631
AOA 913.503981
ARS 1004.235604
AUD 1.537504
AWG 1.8025
AZN 1.70397
BAM 1.878951
BBD 2.020559
BDT 119.587668
BGN 1.87874
BHD 0.376864
BIF 2895
BMD 1
BND 1.348865
BOB 6.915269
BRL 5.814704
BSD 1.000769
BTN 84.471911
BWP 13.672019
BYN 3.275129
BYR 19600
BZD 2.017245
CAD 1.397304
CDF 2871.000362
CHF 0.893604
CLF 0.035758
CLP 986.680396
CNY 7.245104
CNH 7.25886
COP 4419.6
CRC 509.751177
CUC 1
CUP 26.5
CVE 106.303894
CZK 24.31704
DJF 177.720393
DKK 7.15473
DOP 60.450393
DZD 134.014702
EGP 49.66904
ERN 15
ETB 123.403874
EUR 0.959345
FJD 2.27595
FKP 0.789317
GBP 0.79789
GEL 2.740391
GGP 0.789317
GHS 15.803856
GIP 0.789317
GMD 71.000355
GNF 8631.000355
GTQ 7.725046
GYD 209.369911
HKD 7.784804
HNL 25.203838
HRK 7.133259
HTG 131.367086
HUF 395.080388
IDR 15924.6
ILS 3.70585
IMP 0.789317
INR 84.443404
IQD 1310.5
IRR 42092.503816
ISK 139.580386
JEP 0.789317
JMD 159.42934
JOD 0.709104
JPY 154.75104
KES 129.503801
KGS 86.503799
KHR 4051.00035
KMF 472.503794
KPW 899.999621
KRW 1404.00035
KWD 0.30785
KYD 0.834002
KZT 499.690168
LAK 21960.000349
LBP 89550.000349
LKR 291.267173
LRD 180.250382
LSL 18.110381
LTL 2.95274
LVL 0.60489
LYD 4.885039
MAD 10.01395
MDL 18.253698
MGA 4671.000347
MKD 59.043972
MMK 3247.960992
MNT 3397.999946
MOP 8.023845
MRU 39.915039
MUR 46.850378
MVR 15.450378
MWK 1736.000345
MXN 20.48747
MYR 4.467504
MZN 63.903729
NAD 18.110377
NGN 1696.703725
NIO 36.770377
NOK 11.07319
NPR 135.155518
NZD 1.714487
OMR 0.384993
PAB 1.000793
PEN 3.794039
PGK 4.026504
PHP 58.964504
PKR 277.803701
PLN 4.158996
PYG 7812.469978
QAR 3.640504
RON 4.774804
RSD 112.246038
RUB 103.352525
RWF 1371
SAR 3.754345
SBD 8.36952
SCR 14.193586
SDG 601.503676
SEK 11.033555
SGD 1.34757
SHP 0.789317
SLE 22.720371
SLL 20969.504736
SOS 571.503662
SRD 35.494038
STD 20697.981008
SVC 8.756761
SYP 2512.529858
SZL 18.120369
THB 34.495038
TJS 10.658046
TMT 3.51
TND 3.180504
TOP 2.342104
TRY 34.54196
TTD 6.797003
TWD 32.548504
TZS 2660.000335
UAH 41.401274
UGX 3697.761553
UYU 42.558915
UZS 12855.000334
VES 46.267833
VND 25430
VUV 118.722009
WST 2.791591
XAF 630.19767
XAG 0.031946
XAU 0.000369
XCD 2.70255
XDR 0.761283
XOF 622.000332
XPF 114.250363
YER 249.903591
ZAR 18.13174
ZMK 9001.203587
ZMW 27.645705
ZWL 321.999592
  • AEX

    13.6800

    879.8

    +1.58%

  • BEL20

    69.4500

    4228.29

    +1.67%

  • PX1

    41.8400

    7255.01

    +0.58%

  • ISEQ

    17.2700

    9613.97

    +0.18%

  • OSEBX

    3.8100

    1468.66

    +0.26%

  • PSI20

    48.3400

    6409

    +0.76%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    86.5000

    2989.04

    +2.98%

  • N150

    24.5300

    3295.3

    +0.75%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

M.T.Smith--TFWP