En cette ère d’essor fulgurant de l’IA générative, les outils de génération d’images par IA ne cessent de se multiplier et de s’améliorer. Mais dans cette arène virtuelle où s’affrontent les géants de la text-to-image, lesquels tirent leur épingle du jeu ? C’est ce que nous révèle le dernier classement Text to Image Arena d’Artificial Analysis pour le mois d’août 2024. Préparez-vous à découvrir le top 10 des IA génératives d’images les plus performantes du moment !

Text to Image Arena : le classement de référence

Avant de plonger dans le classement, un petit point sur la méthodologie. Text to Image Arena fonctionne sur un système de duels entre deux modèles d’IA générative anonymisés. Les internautes comparent les résultats obtenus pour une même requête et désignent le vainqueur. Un score Elo est ainsi attribué à chaque outil, qui évolue au gré de ses performances. Artificial Analysis met à jour ce classement toutes les heures, garantissant des résultats objectifs et fiables pour guider utilisateurs et professionnels dans leur choix.

Top 10 des IA génératives d’images en août 2024

Place au classement tant attendu ! Voici le top 10 des outils de génération d’images par IA les plus performants selon Text to Image Arena en août dernier :

  • 🥇 Flux.1 [pro] avec un score Elo de 1 151
  • 🥈 Ideogram v2 avec un score Elo de 1 130
  • 🥉 Midjourney v6.1 avec un score Elo de 1 126
  • Flux.1 [dev] avec un score Elo de 1 118
  • Midjourney v6 avec un score Elo de 1 112
  • Stable Diffusion 3 Large avec un score Elo 1 098
  • Flux.1 [schnell] avec un score Elo 1 091
  • Playground v2.5 avec un score Elo 1 046
  • DALL E 3 HD avec un score Elo de 1 041
  • DALL E 3 avec un score Elo de 1 023

Flux.1 : la révélation européenne

La véritable surprise de ce classement, c’est l’arrivée en trombe de Flux.1, développé par la jeune entreprise européenne Black Forest Labs. Dès sa sortie en août, son modèle Flux.1 [pro] s’est hissé directement en tête du classement, choisi par X pour alimenter son assistant conversationnel Grok. Plébiscité par les utilisateurs pour ses performances visuelles exceptionnelles, sa précision et sa flexibilité, il devance même les ténors du secteur. Ses deux autres déclinaisons, Flux.1 [dev] et Flux.1 [schnell], figurent également dans le top 10, respectivement à la 4ème et 7ème place. Une entrée fracassante qui bouscule la hiérarchie établie !

Ideogram v2 et Midjourney complètent le podium

En seconde position, on retrouve Ideogram v2, sorti le 21 août 2024. Cette nouvelle version propose une interface utilisateur web enrichie et un moteur de rendu textuel affiné, permettant un contrôle accru sur les images générées. Idéal pour restaurer l’aspect visuel d’un design.

Détrôné de la première place qu’il occupait en juillet, Midjourney complète néanmoins le podium avec son modèle v6.1. Plus rapide, plus détaillé et plus « intelligent » que ses prédécesseurs selon ses concepteurs, il génère des visuels de très haute qualité. À noter que la v6 pointe à la 5ème position.

DALL E 3 en retrait

Si OpenAI excelle dans la génération de texte avec GPT-3 et 4, force est de constater que ses modèles DALL E 3 et DALL E 3 HD ferment la marche du classement. Un résultat en demi-teinte pour le pionnier de la text-to-image, qui peine à suivre le rythme effréné des avancées dans ce domaine.

En tapant seulement une invite textuelle et en réglant quelques paramètres, vous obtenez une image ! Pas mal non ?

– L’équipe d’Artificial Analysis

Au vu de ces résultats, une chose est sûre : la course à la performance est plus que jamais lancée dans l’arène de la génération d’images par IA. Et dans ce combat de titans, l’Europe semble bien décidée à tirer son épingle du jeu, comme en témoigne l’impressionnante percée de Flux.1. Reste à savoir quelles surprises nous réservent les prochains mois. Une chose est sûre, nous suivrons ces évolutions avec la plus grande attention !