ChatGPT-4o: traductions, conversations... Les fonctionnalités bluffantes de la nouvelle version
OpenAI passe à la vitesse supérieure. L'entreprise de Sam Altman a dévoilé lundi, lors d'une conférence de presse, un nouveau modèle d'intelligence artificielle (IA) générative. Il ne s'agit ni de ChatGPT-5, ni d'un moteur de recherche boosté à l'IA, mais bel et bien d'une version approfondie de son chatbot actuel: ChatGPT-4o.
Cette variante GPT-4o ("o" pour "omni") sera bientôt accessible à tous, y compris les profils gratuits. Preuve qu'OpenAI veut faire de son robot conversationnel un outil très accessible et multimodal, capable de travailler à partir d'un texte, d'une image ou d'une bande-son.
À en croire Mira Murati - directrice technologique de la start-up californienne - et plusieurs chercheurs, GPT-4o est plus rapide que son prédécesseur, plus performant et avec de meilleures capacités en interprétation de texte, d’image et d’audio. Et ce, dans une cinquantaine de langues différentes. Voici, donc, les trois nouveautés (ou pas) marquantes de la nouvelle version du Chatbot.
1. Des traductions instantanées bluffantes
C'est la grande prouesse de ce nouveau GPT-4o. Une traduction orale en temps réel pour faciliter la communication entre des individus parlant différentes langues. Avec cette évolution, OpenAI promet des interactions plus fluides et compréhensibles.
Dans sa vidéo de présentation, deux ingénieurs indiquent à ChatGPT leur volonté de traduire des propos - dans les deux sens - en anglais et en espagnol. L'agent conversationnel s'exécute parfaitement et prend même le loisir d'ajouter une intonation différente (et un petit accent) suivant la langue choisie.
Le son naturel est aussi l'un de ses atouts. L'outil peut caler des blagues de temps à autre et ajouter des onomatopées dans les réponses, pour accentuer un peu plus le naturel. La tonalité de la voix a aussi été travaillée par OpenAI. Il est désormais capable de raconter une histoire avec différents tons (dramatique, joyeux, robotique etc) et même chanter.
2. Des conversations comme avec un humain
Des "conversations vocales en temps réel". Voici ce dont est capable GPT-4o avec sa fonctionnalité "Voice". Une fonctionnalité qui - rappelons-le - n'est pas nouvelle, puisqu'elle est gratuite pour tous les utilisateurs de ChatGPT depuis novembre dernier.
"Il peut répondre aux entrées audio en seulement 232 millisecondes, avec une moyenne de 320 millisecondes, ce qui est similaire au temps de réponse humain", détaille OpenAI dans son communiqué de presse.
Grande nouveauté: on peut désormais l'interrompre pour rebondir sur des propos donnés ou poursuivre la discussion sur un autre sujet. Il suffit de regarder la conférence tenue par OpenAI pour rendre compte des progrès significatifs de son outil "Voice". Un appareil impressionnant qui répond aux performances de GPT-4 Turbo, mais avec "une amélioration significative" dans les autres langues que l'anglais.
3. Un outil visionnaire, peut-être plus rapide que vous
La troisième nouveauté qui, là encore, n'en est pas vraiment une (puisqu'elle était jusqu'ici payante): ChatGPT "Vision". Où comment l'intelligence artificielle générative est capable de commenter un flux vidéo en temps réel.
Dans sa vidéo de présentation, l'outil dissèque d'abord un calcul mental, dont il va ensuite donner la méthode pour le résoudre. Au fur et à mesure que la méthode de calcul est exécutée par son utilisateur (ici l'un des chercheurs), "Vision" se mue en professeur de mathématiques et congratule même son vis-à-vis une fois le résultat trouvé.
Et lorsque Mark Chen, l'un des chercheurs ayant travaillé sur cette solution, indique à ChatGPT "Vision" qu'il est "sceptique" à propos de son utilisation au quotidien. Le robot conversationnel répond qu'il pourra être utile dans beaucoup de situations insoupçonnées. De la planification de voyages aux calculs complexes...
4. Une arrivée sur MacOS
Autre annonce, et pas des moindres, l'arrivée de ChatGPT sur Mac. L'agent conversationnel ne perdra pas une miette de ses capacités sur MacOS. Une annonce d'une grande importance tandis Apple pourrait conclure un accord avec OpenAI pour intégrer ChatGPT à iOS 18 dans les prochains jours.
"Les fonctionnalités de texte et d'image de GPT-4o commencent à être déployées aujourd'hui (hier, ndlr) dans ChatGPT", indique OpenAI. Pour le moment, cette nouvelle version n'est pas encore disponible gratuitement en France (mais en payant), mais cela ne saurait tarder.