Découvrir > Création d’images, analyse de visuels, conversation… découvrez toutes les nouveautés de ChatGPT

Written by Florence Santrot• 26 septembre 2023• 23 h 19 min• Découvrir, Inventer, Tech-Sciences

Création d’images, analyse de visuels, conversation… découvrez toutes les nouveautés de ChatGPT

Toujours plus. L’intelligence artificielle ChatGPT se dote régulièrement de nouvelles fonctions, et les toutes dernières sont particulièrement intéressantes.

Le 26/09/2023 par Florence Santrot

OpenAI annonce de nouvelles fonctions (écouter, parler, voir…) à l'IA générative ChatGPT. Crédit : OpenAI.

Avec les avancées continues dans le domaine de l’intelligence artificielle (IA), pas une semaine, voire un jour, ne se passe sans qu’émergent de nouvelles annonces sur d’avancées majeures. OpenAI, la start-up américaine derrière le modèle linguistique innovant, ChatGPT, est souvent la plus suivie en la matière. Le chatbot d’intelligence artificielle générative se dote de nouvelles fonctions : voir, entendre, parler…

Il ne sait pas seulement générer du texte; il comprend désormais les commandes vocales et y répond à voix haute. Il peut aussi traiter les images et en générer de nouvelles avec l’aide de DALL-E 3, une autre IA générative visuelle d’OpenAI. Voilà des avancées qui risquent encore de transformer un peu plus notre manière de communiquer et d’interagir avec la technologie.

Les trois principales nouvelles fonctions de ChatGPT

Vision : ChatGPT peut désormais comprendre et répondre aux images, décrire le contenu d’une image, identifier les objets et les personnes qu’elle contient, et même générer des images de synthèse.
Audition : ChatGPT est maintenant capable de comprendre et de répondre aux sons, décrire le contenu d’un enregistrement audio, identifier les personnes et les objets qu’il contient, et même générer des enregistrements audio de synthèse.
Parole : ChatGPT peut aussi générer du texte vocal qui est à la fois réaliste et fluide. Il peut également traduire des langues, écrire différents types de contenu créatif et répondre à vos questions de manière informative.

« Voir, entendre et parler » : uniquement pour les abonnés payants

D’ici deux semaines, début octobre, des nouveautés maD’ici deux semaines, début octobre, des nouveautés majeures vont apparaître pour les abonnés à ChatGPT Plus (abonnement de 20 dollars par mois). OpenAI a annoncé que son chatbot intelligent « savait maintenant voir, entendre et parler ». Les abonnés « pourront avoir des conversations vocales avec ChatGPT (iOS & Android) et inclure des images à ces conversations (via toutes les plateformes). »

ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023

La start-up donne plusieurs exemples d’utilisation, comme prendre en photo un lieu touristique durant un voyage pour que ChatGPT vous donne des informations et anecdotes sur le lieu. On pourrait aussi imaginer photographier le contenu de son frigo afin que l’IA vous suggère le menu du soir et vous donne la recette de la préparation. Il en va de même pour expliquer un problème de trigonométrie: il suffit de prendre en photo l’exercice.

Discuter avec ChatGPT pour faciliter les échanges

La limitation des échanges écrits avec l’IA peut rebuter certains utilisateurs. Le ton impersonnel, la lenteur des échanges, la difficulté à formuler une idée au travers d’un clavier… certains trouveront très certainement plus simple, plus rapide, plus convivial de converser avec ChatGPT. OpenAI imagine aussi que ChatGPT pourrait inventer un conte à lire aux enfants à l’heure du coucher ou que l’IA serait capable de lancer un débat à table.

OpenAI se base ici sur son nouveau modèle de synthèse vocale, capable de générer un son de type humain à partir de seulement du texte et de quelques secondes d’échantillons de parole. Baptisée Whisper (chuchoter), cette AI vocale est un système de reconnaissance vocale en open source qui est à la fois capable de transcrire du texte en paroles et inversement.

Dans un souci de personnalisation, OpenAI proposera de choisir parmi cinq différentes voix de synthèse vocale pour l’IA. Celles-ci ont été créées avec la collaboration de comédiens professionnels. Cela prouve que l’intervention humaine est – encore – nécessaire.

SOUTENEZ WE DEMAIN, SOUTENEZ UNE RÉDACTION INDÉPENDANTE
Inscrivez-vous à notre newsletter hebdomadaire
et abonnez-vous à notre magazine.

A lire aussi :

ChatGPT sur la voix de l’intelligence artificielle
Le géant de l'IA OpenAI s'apprête à franchir une nouvelle étape en dotant ChatGPT de capacités vocales avancées. Il promet de transformer radicalement notre façon d'interagir avec l'intelligence artificielle.
Perplexity AI : le moteur de recherche IA qui veut bousculer Google
Lancée en 2022, la startup Perplexity AI s'est donné pour mission de révolutionner l'expérience de recherche sur internet. Misant sur la fiabilité et la pertinence de ses résultats, Perplexity AI entend bien transformer la façon dont les internautes naviguent et découvrent l'information en ligne.
L’IA de l’art : comment l’intelligence artificielle s’attaque à la dernière grande frontière, la créativité
Une IA peut-elle faire preuve de créativité ? Ou stimuler la créativité des artistes ? Ces questions, autrefois reléguées à la science-fiction, sont aujourd'hui au cœur d'un débat passionnant dans le monde de l'art et de la technologie.

Nos partenaires :

Les Napoleons : au-delà des sommets
Cette communauté de décideurs et d'acteurs du changement (innovation, environnement, social) organise, chaque année, deux sommets pour favoriser la collaboration et le partage d'idées novatrices. L'occasion aussi de proposer une plateforme pour les penseurs avant-gardistes et, ainsi, inspirer la transition.
« Plus de 1000 start-up françaises sont aujourd’hui des entreprises à impact »
DG de France Digitale, collectif de 2 000 start-up, Maya Noël est la marraine 2024 du Prix Entreprendre pour demain créé par la Fondation Sopra Steria- Institut de France et qui met en avant des start-up qui font sens. Le thème de cette édition ? "Une Tech responsable au service de l’environnement et de la solidarité."
OUI DEMAIN : « Avec le Web3, l’utilisateur reprend le contrôle de ses données »
Hélène Jacquinet, consultante blockchain & crypto, était l’invitée de la nouvelle masterclass OUI DEMAIN, animée par WE DEMAIN pour les étudiants du groupe OMNES Education. Avec pour thème : “Blockchain, cryptomonnaies, metaverse, Web3 : vers une nouvelle ère d'Internet ?”