Stable Diffusion

Un article de Wikipédia, l'encyclopédie libre.

Stable Diffusion

Description de l'image Astronaut Riding a Horse (SDXL).jpg.
Informations
Première version Voir et modifier les données sur Wikidata
Dernière version SDXL 1.0 ()[1]
0.0.1 ()[2]Voir et modifier les données sur Wikidata
Dépôt github.com/Stability-AI/generative-modelsVoir et modifier les données sur Wikidata
Écrit en PythonVoir et modifier les données sur Wikidata
Type Prompt art
Latent variable model (en)
Modèle de diffusion (en)Voir et modifier les données sur Wikidata
Licence CreativeML Open RAIL-M (d)Voir et modifier les données sur Wikidata
Site web stability.ai/stable-imageVoir et modifier les données sur Wikidata

Stable Diffusion est un modèle d'apprentissage automatique permettant de générer des images numériques photoréalistes à partir de descriptions en langage naturel. Le modèle peut également être utilisé pour d'autres tâches, comme la génération d'une image améliorée à partir d'une esquisse et d'une description textuelle[3].

Il peut fonctionner sur la plupart des matériels grand public équipés d'une carte graphique même de moyenne gamme et est salué par PC World comme « la prochaine application phare pour votre ordinateur[4] ».

Licence[modifier | modifier le code]

Le code source de Stable Diffusion est public ce qui n'en fait pas un logiciel libre[5], car sa licence, dite CreativeML Open RAIL M License, interdit certains cas d'utilisation, ce qui est contraire à un principe de base de la fondation pour le logiciel libre[6],[7],[8].

Les critiques déplorant la publication du code source peuvent en général être liées aux inquiétudes concernant l'éthique de l'intelligence artificielle. Elles s'appuient sur l'hypothèse que le modèle peut être utilisé pour créer des deepfakes[9] et remettent également en question la légalité de la génération d'images avec un modèle formé sur un ensemble de données incluant du contenu protégé par le droit d'auteur sans le consentement des artistes originaux[10].

Entraînement[modifier | modifier le code]

Stable Diffusion est formé sur un sous-ensemble de l'ensemble de données LAION-Aesthetics V2[11]. Il est construit sur 256 GPU Nvidia A100 pour un coût de 600 000 $[12].

Poursuites en justice[modifier | modifier le code]

En janvier 2023, trois artistes - Sarah Andersen, Kelly McKernan et Karla Ortiz - intentent une action en justice contre Stability AI, Midjourney et DeviantArt, créateurs des générateurs d'art Stable Diffusion, Midjourney et DreamUp, affirmant que ces sociétés ont violé les droits de « millions d'artistes » en entraînant leurs outils d'intelligence artificielle sur cinq milliards d'images extraites du web « sans le consentement des artistes originaux »[13].

Notes et références[modifier | modifier le code]

  1. (en) « Announcing SDXL 1.0 » (consulté le )
  2. « Release 0.0.1 », (consulté le )
  3. (en) « Diffuse The Rest - a Hugging Face Space by huggingface », huggingface.co, sur Hugging Face (consulté le ).
  4. (en) Mark Hachman, « The new killer app: Creating AI art will absolutely crush your PC », sur pcworld.com, (consulté le ).
  5. (en) Emad Mostaque (en), « Stable Diffusion Public Release », Stability.Ai, (consulté le ).
  6. (en) Richard Stallman, « Why programs must not limit the freedom to run them », sur gnu.org, .
  7. « Ready or not, mass video deepfakes are coming », The Washington Post, (consulté le ).
  8. (en) « License - a Hugging Face Space by CompVis », huggingface.co, (consulté le ).
  9. (en) « Deepfakes for all: Uncensored AI art model prompts ethics questions », TechCrunch, (consulté le ).
  10. (en) Luke Plunkett, « AI Creating 'Art' Is An Ethical And Copyright Nightmare », Kotaku, (consulté le ).
  11. (en) « LAION-Aesthetics | LAION », laion.ai (consulté le ).
  12. (en) Emad Mostaque (en), « Cost of construction », Twitter, (consulté le ).
  13. (en) James Vincent, « AI art tools Stable Diffusion and Midjourney targeted with copyright lawsuit », sur The Verge, .

Voir également[modifier | modifier le code]

Liens externes[modifier | modifier le code]