Red Dead Redemption 3 : le destin tragique d’Arthur Morgan se précise dans le prochain opus de Rockstar
24 mars 2025
Comment les services externalisé saisie de données renforcent votre conformité RGPD
4 avril 2025Qu’est-ce que la génération en mode image to image ?
Les générateurs d’images par IA fonctionnent, de base, en mode text to image : on leur donne une description de l’image à générer, et elles renvoient une ou plusieurs images correspondant plus ou moins à ce « prompt ».
Les générateurs en mode image to image sont apparus un peu plus tardivement. On leur donne une image, elles répondent par une ou plusieurs images qui lui ressemblent plus ou moins : palette de couleurs, style graphique, scène, personnages.
Voici maintenant quelques IA qui font de la génération en mode image.
Les générateurs image to image
Midjourney
En 2025, Midjourney reste leader parmi les IA de génération d’images.
Apparu en 2022, Midjourney fonctionne aussi bien en mode text to image qu’en mode image to image, voire en combinant les deux modes pour obtenir un rendu plus précis, plus exact, plus conforme aux attentes. Ce qui en fait un outil précieux entre les mains des graphistes professionnels.
En mode image, Midjourney propose des fonctionnalités intéressantes, via certains paramètres :
- Le paramètre « sref » permet de reproduire le style graphique et les couleurs d’une image, sans reproduire ce qu’elle montre. On peut donc donner un prompt du genre « un couple », joindre une image d’une femme seule sur une plage en style manga, et on obtiendra des images de couple sur une plage en style manga.
- Le paramètre « iw » (image weight, ou poids de l’image) permet d’indiquer quelle importance doit avoir l’image donnée en entrée dans le résultat final.
- Les paramètres « cref » et « cw » (character reference et character weight) permettent de fournir l’image d’un personnage et de contrôler son importance dans la génération de nouvelles images.
Krea AI
Krea AI propose un outil intéressant et innovant dans le monde de la génération image to image.
Une de ses interfaces consiste en un écran divisé en deux. À gauche, on peut réunir des images – par exemple un garçon, un chien, un arbre. À droite, l’IA nous propose des synthèses de ces éléments. On peut changer la composition des images à gauche, changer les tailles, les rapports dessus / dessous etc., et voir en direct live ce que ça donne à droite.
Non seulement c’est assez amusant, mais surtout ça permet d’avoir un contrôle très intuitif sur le rendu final.
Leonardo
Basée sur Stable Diffusion, à quoi elle apporte une interface plus riche et raffinée, l’IA grand-public de Leonardo fonctionne de manière assez semblable à Midjourney.
Elle admet sans problème des images en entrée, qu’elle transforme ensuite à l’aide notamment de ses styles prédéfinis. Les résultats ne peuvent cependant pas être aussi précisément contrôlés qu’avec Midjourney.
Kling AI
Kling AI est une IA de génération de vidéos. Elle aussi peut fonctionner en mode image to image :
- Soit on lui donne une image et un prompt texte (ou même pas de prompt du tout) et elle crée 5 secondes de vidéo qui prolongent l’image initiale.
- Soit on lui donne deux images, une de début et une de fin, et elle crée 5 secondes de vidéo allant de l’une à l’autre (on aura bien sûr un résultat plus cohérent si les deux images se ressemblent suffisamment).
Découvrez de nombreux tutos sur l’IA sur Synthographie.fr
- Faites tourner la roue pour l’anniversaire de Google et participez à la fête - 18 avril 2026
- Comment mettre une note sur 25 sur 20 simplement ? - 17 avril 2026
- Comment conserver les performances d’un SSD dans le temps - 17 avril 2026
