OpenAI annonce de nouvelles fonctions (écouter, parler, voir…) à l'IA générative ChatGPT. Crédit : OpenAI.
Partager la publication "Création d’images, analyse de visuels, conversation… découvrez toutes les nouveautés de ChatGPT"
Avec les avancées continues dans le domaine de l’intelligence artificielle (IA), pas une semaine, voire un jour, ne se passe sans qu’émergent de nouvelles annonces sur d’avancées majeures. OpenAI, la start-up américaine derrière le modèle linguistique innovant, ChatGPT, est souvent la plus suivie en la matière. Le chatbot d’intelligence artificielle générative se dote de nouvelles fonctions : voir, entendre, parler…
Il ne sait pas seulement générer du texte; il comprend désormais les commandes vocales et y répond à voix haute. Il peut aussi traiter les images et en générer de nouvelles avec l’aide de DALL-E 3, une autre IA générative visuelle d’OpenAI. Voilà des avancées qui risquent encore de transformer un peu plus notre manière de communiquer et d’interagir avec la technologie.
À lire aussi : 15 requêtes pour exploiter pleinement le potentiel de ChatGPT
D’ici deux semaines, début octobre, des nouveautés maD’ici deux semaines, début octobre, des nouveautés majeures vont apparaître pour les abonnés à ChatGPT Plus (abonnement de 20 dollars par mois). OpenAI a annoncé que son chatbot intelligent « savait maintenant voir, entendre et parler ». Les abonnés « pourront avoir des conversations vocales avec ChatGPT (iOS & Android) et inclure des images à ces conversations (via toutes les plateformes). »
La start-up donne plusieurs exemples d’utilisation, comme prendre en photo un lieu touristique durant un voyage pour que ChatGPT vous donne des informations et anecdotes sur le lieu. On pourrait aussi imaginer photographier le contenu de son frigo afin que l’IA vous suggère le menu du soir et vous donne la recette de la préparation. Il en va de même pour expliquer un problème de trigonométrie: il suffit de prendre en photo l’exercice.
La limitation des échanges écrits avec l’IA peut rebuter certains utilisateurs. Le ton impersonnel, la lenteur des échanges, la difficulté à formuler une idée au travers d’un clavier… certains trouveront très certainement plus simple, plus rapide, plus convivial de converser avec ChatGPT. OpenAI imagine aussi que ChatGPT pourrait inventer un conte à lire aux enfants à l’heure du coucher ou que l’IA serait capable de lancer un débat à table.
OpenAI se base ici sur son nouveau modèle de synthèse vocale, capable de générer un son de type humain à partir de seulement du texte et de quelques secondes d’échantillons de parole. Baptisée Whisper (chuchoter), cette AI vocale est un système de reconnaissance vocale en open source qui est à la fois capable de transcrire du texte en paroles et inversement.
Dans un souci de personnalisation, OpenAI proposera de choisir parmi cinq différentes voix de synthèse vocale pour l’IA. Celles-ci ont été créées avec la collaboration de comédiens professionnels. Cela prouve que l’intervention humaine est – encore – nécessaire.
SOUTENEZ WE DEMAIN, SOUTENEZ UNE RÉDACTION INDÉPENDANTE
Inscrivez-vous à notre newsletter hebdomadaire
et abonnez-vous à notre magazine.
Alors que le réchauffement planétaire se rapproche dangereusement du seuil critique de 1,5°C, la COP28…
Souvent négligées dans les débats environnementaux, les rivières intermittentes jouent pourtant un rôle écologique crucial.…
Depuis plus d'un quart de siècle, les Conférences des Parties (COP) rassemblent le monde dans…
Selon le Global Carbon Project, les projections 2023 des émissions de CO2 globales s'inscrivent à…
Spécialiste des coraux, Lorenzo Bramanti sillonne les mers du globe pour comprendre et protéger les…
WE DEMAIN poursuit son immersion au coeur des régions, laboratoires vivants de la transition écologique,…