Aller au contenu principal

ChatGPT s’offre enfin un générateur d’images d’un niveau jamais vu

Une avancée majeure

chatgpt
— Ascannio / Shutterstock.com

OpenAI vient d’annoncer le déploiement d’un nouveau générateur d’images disponible avec le modèle GPT-4o. Il est désormais capable de générer des images d’un niveau jamais vu jusque-là. Explications.

Jusqu’à présent, le chatbot utilisait le modèle DALL-E, développé par OpenAI, pour créer des images. Avec cette nouvelle mise à jour, vous pourrez accéder à une nouvelle fonctionnalité appelée « Images dans ChatGPT », qui exploite le modèle phare GPT-4o d’OpenAI. Cette mise à jour est également disponible dans Sora, l’outil de génération vidéo d’OpenAI. Ce nouveau générateur d’images vous permettra d’obtenir des images de « haute qualité à partir de vos demandes, des conversations et des fichiers téléchargés ».

L’utilisateur peut désormais créer une image en indiquant ce qu’il veut dans sa requête. Selon un article de blog, le nouveau générateur d’images peut produire une image de qualité d’une femme vêtue d’un t-shirt noir avec le logo d’OpenAI en train d’écrire sur un tableau blanc et qui est prise en photo par une autre, avec le reflet du photographe dans le tableau.

« Ce modèle représente un changement radical par rapport aux modèles précédents », a déclaré Gabriel Goh, responsable de la recherche. « Le changement le plus notable concerne la façon dont le modèle gère le texte, un problème que lui et ses concurrents ont longtemps rencontré. Les mots avaient tendance à ressembler à du charabia, et le texte lisible paraissait brouillon, rempli d’erreurs de formatage et de fautes d’orthographe. »

Si le générateur d’images peut créer des images d’un niveau jamais vu, OpenAI admet qu’il y a encore des erreurs à corriger : « C’était un processus itératif qui a pris de nombreux mois pour aboutir. Ce ne sont que de petits progrès. Le modèle rencontre encore des difficultés avec les très petits caractères, mais, dans l’ensemble, la qualité du texte est toujours utilisable », a ajouté Gabriel Goh.

Au-delà d’une meilleure écriture, OpenAI affirme que le modèle suivra désormais mieux les instructions, car un problème fréquent avec les anciennes versions était qu’elles ignoraient certains détails dans les invites plus longues. Il a également été amélioré pour générer des images plus photoréalistes.

Selon le créateur de ChatGPT, les utilisateurs pourront se servir de cet outil à des fins professionnelles, car il est capable de générer des infographies, des diagrammes ou encore des visuels promotionnels pour les réseaux sociaux. Plus globalement, il peut générer de nombreux formats, comme une bande dessinée, un poster ou même une carte de visite.

Les utilisateurs pourront également se servir de ce nouvel outil pour modifier des images déjà existantes. Un selfie peut également être transformé en version animée ou en mème. Il est également capable de générer différents formats : une bande dessinée, un poster, une carte de visite…

Par ailleurs, ChatGPT plante si vous tapez David Mayer et personne ne sait pourquoi.

Par Cécile Breton, le

Source: Futurism

Étiquettes: ,

Catégories: ,

Partager cet article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *