Formation à GPT3 et ChatGPT
Musclez le contenu + SEO
Intelligence artificielle générative

Générer des images avec l'IA consomme moins d'énergie que créer soi-même des images

Contrairement à une idée reçue, générer une image avec l'intelligence artificielle ne consomme pas plus d'énergie que de créer une image soi-même avec son ordinateur. Démonstration.

Raphaël Richard, expert en intelligence artificielle publie le 3 juillet 2025, les résultats de l'étude "Impact Genération Image IA", qui synthétise les données disponibles sur la consommation d'énergie liée à la création d'image par l'intelligence artificielle d'une part et la création d'image "manuelle" avec des logiciels de retouche comme Photoshop ou de création graphique comme Illustrator. 

Les conclusions de cette étude sont sans appel pour Raphaël Richard: dans la plupart des cas, créer une image avec l'IA ne consomme pas plus d'énergie que de créer une image soi-même.

  • Souvent même, cela consomme moins d'énergie.
  • La génération d'une image ordinaire par des modèles d'IA générative consomme entre 0,005 kwh et 0,0135 kwh selon les études, les modèles utilisés et la complexité de l'image.
  • La génération d'une image complexe et en haute résolution peut consommer, consommerait entre 0,029kwh et 0,01141 kwh.
  • La retouche d'une photo sur Photoshop consomme entre 0,05 kwh et 2 kwh.
  • La création d'une image sur Illustrator consomme entre 0,1 kwh et 2 kwh.

Cela va à l'encontre de ce qui a été publié jusqu'ici qui présente la génération d'image par l'intelligence artificielle comme un désastre écologique.

En revanche, il reste difficile d'évaluer l'empreinte écologique globale de la génération d'images par l'IA:

  • Consommation de matières premières liée à la fabrication des serveurs et des data centers 
  • Pollution liée à l'extraction des terres rares ou moins rares
  • Recyclage des serveurs des data centers (il existe peu d'information sur la durée de vie des serveurs utilisées dans l'IA générative)
  • Empreinte eau

Si l'on considérait que l'empreinte écologique globale était directement liée à la consommation d'énergie et, dans ce cas, l'empreinte écologique globale des images générées par l'IA serait, donc moindre que celle de la création d'image manuelle à partir d'un ordinateur. Mais, ce serait très critiquable, par exemple, parce que:

  • le refroidissement des serveurs des data centers consomme de l'eau alors que ce n'est pas le cas d'un ordinateur personnelle qui se refroidit grâce à un micro-processeur 
  • il est très difficile de calculer le nombre d'images générées sur toute la durée de vie d'un serveur et, donc, de calculer la quote part du coût du recyclage à chaque image

Les données utilisées pour comparer l'énergie consommée par les différentes technologies

Dans l'étude, on considère que la génération d'images correspond à deux types d'usage: 

  • Création d'image
  • Création de photo

Pour la création d'image, on a considéré que les modèles d'IA générative produisait des images équivalentes à celles que l'on peut créer avec un logiciel comme Illustrator  et l'on a estimé que le coût énergétique était uniquement lié à l'énergie consommée par l'ordinateur durant toute la durée d'utilisation d'Illustrator par l'infographiste.

Pour la création de photo, on a considéré que les modèles d'IA générative produisait des photos équivalentes à celles que l'on peut créer en retouchant des photos dans Photoshop et l'on a estimé que le coût énergétique était uniquement lié à l'énergie consommée par l'ordinateur durant toute la durée d'utilisation de Photoshop par l'infographiste.

On a, ensuite comparé l'énergie consommée pour la création des différents types d'images ou de photo avec des modèles d'IA générative d'un côté (consommation des serveurs hébergeant les modèles d'IA générative) avec l'énergie consommée par les ordinateurs durant l'utilisation des logiciels Illustrator et Photoshop.

Raphaël Richard s'est tout d'abord appuyé sur une étude qui fait référence sur la consommation d'énergie lors de la génération d'image du Wall Street Journal, d'un côté et de l'étude Power Hungry réalisée par Hugging Face et l'université de Carnegie Mellon, d'un autre côté.

Consommation d'énergie de la génération d'image avec un modèle d'IA générative

Une équipe du Wall Street Journal a estimé, avec l'aide de professionnels des data center que la génération d'une image consommait en moyenne 0,0017 Wh.

Une autre étude, Power Hungry, réalisée par Hugging Face et l'université de Carnegie Mellon, conclut que l'énergie consommée par les modèles d'IA générative pour créer des images en fonction de leur complexité. Ces résultats recoupent, en partie, les estimations du Wall Street Journal.

Type d’image IA générée Description Estimation conso (Wh/image)
Image très simple Icône noir/blanc, fond uni, peu de détails 0,3 à 0,7 Wh
Image simple Portrait ou objet sur fond neutre (512×512 px) 1 à 2 Wh
Image semi-complexe Personnage + décor simple (ex : scène urbaine sans foule) 2 à 4 Wh
Image complexe Scène réaliste avec décor, lumière, textures riches 5 à 8 Wh
Image très complexe / photoréaliste / 4K Plusieurs sujets, environnement complet, haute résolution (>1024 px) 9 à 15 Wh

Consommation d'énergie de la création d'une image avec Photoshop

L'estimation de l'énergie consommée s'appuie sur une consommation de 0,1 kWh/h de l'ordinateur utilisé par l'infographiste. La consommation du moniteur, si moniteur il y a, n'est pas prise en compte.

Type de retouche Description Durée estimée Consommation estimée (kWh)
Corrections basiques Luminosité, contraste, redressement, recadrage 10 à 30 minutes 0,017 à 0,05 kWh
Retouche beauté simple Peau, yeux, cheveux, sans altération forte 30 min à 1h 0,05 à 0,1 kWh
Retouche beauté complexe Remodelage, effet magazine, color grading poussé 2 à 4 heures 0,2 à 0,4 kWh
Montage photo simple Incrustation ou fond modifié proprement 1 à 2 heures 0,1 à 0,2 kWh
Montage complexe / matte painting Plusieurs sources, éclairages harmonisés, textures 6 à 20 heures 0,6 à 2,0 kWh

Consommation d'énergie de la création d'une image avec Illustrator

L'estimation de l'énergie consommée s'appuie sur une consommation de 0,1 kWh/h de l'ordinateur utilisé par l'infographiste. La consommation du moniteur, si moniteur il y a, n'est pas prise en compte.

Type de création Description Durée estimée Consommation estimée (kWh)
Logo simple Typographie + pictogramme basique 1 à 2 heures 0,1 à 0,2 kWh
Logo complexe Travail sur la forme, le sens, déclinaisons, variations 5 à 10 heures 0,5 à 1,0 kWh
Illustration vectorielle simple Icône, pictogramme, mascotte basique 1 à 3 heures 0,1 à 0,3 kWh
Illustration complexe Composition, mise en scène, couleurs, détails 6 à 20 heures 0,6 à 2,0 kWh
Infographie complète Mise en page, données, illustrations, typographie 5 à 15 heures

0,5 à 1,5 kWh

 

La longueur, la complexité du prompt et le modèle de diffusion impactent la consommation d'énergétique

Le coût principal vient du modèle de diffusion, pas du prompt

  • Dans la génération d’image (ex. Stable Diffusion, DALL·E 3, Midjourney), le prompt est d’abord encodé en vecteur via un modèle de langage (comme CLIP ou T5).
  • Ce vecteur sert à conditionner le modèle de diffusion (ou transformer génératif), qui effectue ensuite la génération image → image latente → débruitage → image finale.
  • Le processus de génération est de loin le plus énergivore, bien plus que la lecture du prompt lui-même.

Longueur du prompt : impact marginal jusqu’à un certain seuil

Tant que le prompt reste dans la limite raisonnable des 75 à 150 tokens (ce qui couvre 95 % des cas courants), l’impact énergétique est très faible.

En revanche :

  • Si l'on ajoute des modificateurs complexes (ex. hyperdetailed, photorealistic, 8K, award-winning, Octane render, trending on ArtStation),
  • Si l'on utilise des prompts très longs (300+ tokens),
  • alors le traitement du prompt (encodage) peut prendre plus de temps et mobiliser plus de VRAM, donc consommer un peu plus d’énergie.

Estimation indicative

  • 20–50 tokens : ~1.7 Wh (standard)
  • 100–200 tokens:  ~1.8–1.9 Wh
  • 300+ tokens ou avec nombreux modificateurs:  ~2.0 Wh ou plus, selon le modèle et le sampler utilisé
  • Exemple basé sur des tests internes Hugging Face avec Stable Diffusion v1.5 (source : Luccioni et al., 2023)

Autres facteurs bien plus influents que le prompt

  • Résolution finale de l’image générée
  • Nombre d’étapes de diffusion (50 vs 100)
  • Sampler utilisé (DDIM, Euler, DPM++, etc.)
  • Présence ou non de modèle de contrôle (ControlNet, LoRA…)

L'origine de l'électricité consommée par les principaux fournisseurs

Pour estimer les estimations de CO2 de la génération d'image par l'intelligence artificielle, il faut aussi tenir du mode de production de l'électricité. 

  • Est-elle charbonnée (auquel cas, les émissions de CO2 sont maximales)
  • Est-elle d'origine éolien, solaire (auquel cas, elles sont réduites mais loin d'être nulles à cause des émissions ayant lieu au moment de la fabrication et du recyclage des équipements)
  • Est-elle d'origine hydro-électrique ou nucléaire (auquel cas, les émissions sont très réduites, mais il faut tenir compte d'effets de bord (impact sur la biodiversité pour l'hydro-électricité et problème du stockag des déchets pour le nucléaire).

Malheureusement, il est très difficile de déterminer les volumes des émissions de CO2 associés à chaque générateur d'image attendu qu'il y a peu de transparence sur le mix énergétique exacte de chaque fournisseur.

Modèle / Service Société / Intégration Électricité utilisée (origine)
Imagen / Gemini Image v4 Google Gemini Mix renouvelable + fossile (Google s’appuie sur ses contrats EAC, mix global)
DALL‑E 3 (via ChatGPT‑4o) OpenAI / Microsoft Azure Mix renouvelable + fossile (centres Azure)
Midjourney Midjourney Inc. Non précisé (probablement mix fossile + renouvelable)
Stable Diffusion 3.5 Stability AI / open source Variable (exécution locale possible)
FLUX.1 (Flux 1.1 Kontext, Dev, Pro) Black Forest Labs / xAI / Mistral Variable (exécution locale/API tierce, data centers inconnus)
Adobe Firefly Adobe Sensei / Creative Cloud Mix électricité (Adobe s’alimente via data centers d’Adobe/NVIDIA)
Ideogram Ideogram (startup) Non précisé
Reve Image 1.0 Revelio AI Non précisé
Leonardo.AI (Phoenix) Leonardo Labs Probablement mix data centers (AWS, etc.)
Luma Labs Photon Luma Labs Probablement mix data centers
Google Imagen 4 Imagen via DeepMind (Gemini) Mix renouvelable + fossile
NightCafe NightCafe Labs Probablement mix (hébergé sur cloud)
Freepik Mystic Freepik Inconnu
Kling KOLORS Kling Inconnu
Recraft Recraft Inconnu
Mistral (via Le Chat intégrant Flux Pro) Mistral AI Inconnu

Google (Gemini / Imagen) : Google revendique une empreinte carbone avantageuse, s'appuyant sur des mix énergétiques incluant énergies renouvelables, mais l’essentiel des serveurs reste connecté au réseau électrique du pays, donc un mix fossile/renouvelable

OpenAI (DALL‑E 3 via ChatGPT‑4o) : OpenAI estime ~0,34 Wh par requête (en moyenne pour texte et image) . L’électricité provient des datacenters Azure/Equinix, qui mélangent renouvelables et fossiles, sans distinction claire par requête.

Meta, Google, Amazon investissent dans du nucléaire/renouvelable pour répondre aux besoins de l' IA.

EXCLUSIF

35 Formations
Intelligence Artificielle
Marketing Digital
Ecommerce
Forfait illimité: à partir de 166€/mois

Accès 100 collaborateurs

Découvrir

Recevez des exclus !

Contenus liés

Search