Kling AI s'est imposé comme l'un des générateurs vidéo IA les plus performants du marché, impressionnant constamment les créateurs par sa capacité à produire des séquences de haute qualité à partir de simples invites textuelles.
Aujourd'hui, ils tentent une nouvelle approche avec le lancement du modèle d'image Kling O1, leur premier modèle dédié à la génération d'images. La grande question est : Kling est-il aussi doué pour les images que pour la vidéo ?
J'ai passé beaucoup de temps à tester le modèle d'image Kling O1 en profondeur, et je suis là pour partager mes découvertes. Voyons ce que ce nouveau modèle apporte.
Qu'est-ce qui distingue Kling O1 ?
Avant de plonger dans mes tests détaillés, laissez-moi vous donner un aperçu rapide de ce qui m'a semblé être les caractéristiques les plus impressionnantes de Kling O1 :
Fusion incroyable d'images multiples qui conserve les détails d'origine
L'une des plus grandes forces du modèle d'image Kling O1 est sa capacité à combiner plusieurs images de référence tout en préservant incroyablement bien les caractéristiques d'origine de chaque source.
Contrairement à de nombreux autres modèles qui estompent les détails lors du mélange de plusieurs images, Kling O1 maintient les caractéristiques distinctes de chaque élément avec une précision impressionnante.
Compréhension intelligente des invites et édition précise
Qu'il s'agisse d'ajuster des zones spécifiques d'une image ou de modifier des éléments particuliers, le modèle comprend avec précision les instructions d'édition.
Construit sur le concept puissant du langage visuel multimodal, il donne à l'édition d'images une sensation aussi naturelle que de converser avec un designer.
Mon processus de test : Pousser le modèle d'image Kling O1 dans ses retranchements
Pour évaluer correctement les capacités de Kling O1, je me suis concentré sur deux scénarios de test principaux qui exposeraient à la fois ses forces et ses faiblesses potentielles :
Test 1 : Fusion de références d'images multiples
Le premier test visait à évaluer la capacité de Kling O1 à gérer simultanément plusieurs images de référence et à créer une composition cohérente qui préserve les caractéristiques de chaque source.
J'ai utilisé quatre images :
![]() |
![]() |
![]() |
![]() |
Ensuite, j'ai fourni l'invite suivante :
Veuillez générer une image présentant la fille de l'image 1 tenant le chien de l'image 2, avec l'arrière-plan de l'image 3, et en appliquant la teinte et le style de l'image 4 à l'ensemble de la photo.
Et voici le résultat que j'ai obtenu :

D'après les résultats générés, il est évident que Kling O1 a parfaitement suivi les instructions, même en traitant simultanément du contenu provenant de quatre images. Il n'y a pas eu de chaos ni de déviation par rapport à l'invite, et sa puissante capacité de traitement d'images multiples m'a vraiment surpris.
Cependant, je pense que le réalisme de cette photo pourrait être encore amélioré. Bien que le sujet et l'arrière-plan partagent la même teinte, il y a toujours une sensation quelque peu discordante et artificielle.
Au-delà du mélange de scènes et de sujets, j'ai également testé l'application du style et du matériau.
J'ai utilisé ces deux images :
![]() |
![]() |
Et j'ai défini l'invite comme suit :
Convertissez le sujet de l'image 1 en une personne photoréaliste, en utilisant la texture et le matériau de l'image 2 pour l'écharpe.
L'image finale que Kling O1 a fournie :

Le résultat final démontre que Kling O1 obtient de bons résultats en termes de transformation de style et de remplacement de matériau.
Pourtant, il y a quelques problèmes mineurs : une portion supplémentaire de l'écharpe apparaissant sur la poitrine du sujet et la disparition du nœud papillon. Ces incohérences logiques dans l'image sapent son réalisme global.
Test 2 : Édition itérative de précision
Le deuxième test s'est concentré sur l'évaluation de la capacité de Kling O1 à effectuer des modifications précises et progressives basées sur une seule image de référence.
Cela révélerait si le modèle pouvait gérer des flux de travail d'édition complexes sans dégrader la qualité ou perdre le contexte.
Dans le tableau que j'ai compilé ci-dessous, vous pouvez voir une comparaison côte à côte des performances de Kling O1 sur ce test :
| Image de référence | Invite et résultat 1 | Invite et résultat 2 |
![]() |
![]() Changez l'heure de la journée en soirée, avec un éclairage intérieur chaleureux provenant de lampes suspendues. Laissez tout le reste inchangé. |
![]() Remplacez la tasse de café par un livre. La femme devrait maintenant lire au lieu de regarder par la fenêtre. Conservez les mêmes traits du visage, vêtements et arrière-plan. |
| Invite et résultat 3 | Invite et résultat 4 | Invite et résultat 5 |
![]() Ajoutez une légère pluie visible par la fenêtre. Ajustez le reflet de la fenêtre pour montrer les gouttelettes de pluie. Ne modifiez pas la scène intérieure ni le personnage. |
![]() Changez sa tenue décontractée en vêtements professionnels – un blazer et un chemisier formel. Gardez sa pose, ses traits du visage et l'ensemble de la scène d'arrière-plan identiques. |
![]() Ajoutez une autre personne à l'arrière-plan – un barista travaillant derrière le comptoir. Maintenez le même éclairage, la même heure de la journée et tous les autres éléments existants. |
Les résultats ont été vraiment impressionnants. Kling O1 a démontré une compréhension exceptionnelle de ce qui devait changer et de ce qui devait rester constant.
Chaque itération a maintenu une cohérence remarquable avec les versions précédentes tout en implémentant avec précision les modifications demandées.
Pensées finales : Vaut-il la peine d'essayer Kling O1 ?
Après des tests approfondis, le modèle d'image Kling O1 est clairement un concurrent sérieux dans l'espace de la génération d'images IA.
L'approche multimodale fonctionne très bien – la combinaison d'invites en langage naturel avec des images de référence crée un flux de travail fluide qui semble collaboratif plutôt que frustrant.
La rétention des caractéristiques est vraiment la meilleure de sa catégorie, conservant les caractéristiques distinctes de chaque source lors de la combinaison de plusieurs références. L'édition étape par étape est également remarquablement efficace, vous permettant d'apporter des modifications précises sans perdre le contexte.
Pour les créateurs et les designers qui souhaitent un excellent contrôle et une grande cohérence, le modèle d'image Kling O1 vaut vraiment la peine d'être essayé. Il apporte avec succès l'expertise vidéo de Kling aux images fixes tout en éliminant le changement d'outil fastidieux qui sévit dans de nombreux processus créatifs IA.
Est-ce parfait ? Non. Mais c'est un début prometteur qui montre que Kling AI prend au sérieux la génération d'images.
Prêt à le tester vous-même ? Rendez-vous sur Pollo AI pour essayer le modèle d'image Kling O1, ou explorez d'autres modèles de premier plan disponibles sur le générateur d'images Pollo AI pour trouver celui qui convient le mieux à vos besoins. C'est un investissement en temps qui vaut vraiment la peine pour tout créateur.











