Discussion:Apprentissage automatique

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Remarques de 2006 (aka Preums)[modifier le code]

J'ouvre apparement la page de discussion de l'apprentissage automatique. Est-ce un article qui attire peu d'intérêt ? Je crois qu'il y a vraiment du boulot, comparé par exemple à l'article anglais : http://en.wikipedia.org/wiki/Machine_learning

On peut en faire une traduction, mais peu être peut on revoir l'organisation ?


La version actuelle de l'article me semble donner une vision très limitée de l'apprentissage automatique. La version anglaise pourrait être une bonne base. Je pourrais contribuer à la traduction. Des propositions de modifs par rapport à la version anglaise?


tout à fait d'accord avec toi ! un début de traduction a été fait sur la page Apprentissage des machines il faudrait mettre le contenu ici et supprimer la page Apprentissage des machines qui a un titre plutôt maladroit... et puis continuer la traduction et remplir les inombrables liens rouges qui n'ont de manqueront pas d'apparaitre ;-) Hum du travail en perspective... Sylenius 9 mars 2006 à 21:14 (CET)[répondre]

Fusion du 13 mars 2006 à 13:19 (CET)[modifier le code]

Quelques suggestions pour l'intro[modifier le code]

Je viens de faire une ou deux petites modif de forme ans l'intro, mais j'aimerai faire un remaniement plus general. Je le ferai d'ici peu, mais n'hesitez pas a me donner votre avis d'ici la.

La première partie est bien ecrite, mais le "associées a une IA" me gène. On parle d'UNE IA qui s'occupe d'effectuer la tache, et qui apprend? Ca me semble tres discutable, ca fait un peu SF, et ca introduit radicalement le lecteur en erreur (surtout si il suit le lien IA...). Il me semble qu'il s'agit d'une tache (consideree comme etant) du domaine de l'IA. Ce qui donnerait quelque chose comme:

L'apprentissage automatique fait référence au développement, l'analyse et l'implémentation de méthodes qui permettent à une machine (au sens large) d'évoluer grâce à un processus d'apprentissage, et ainsi de remplir des tâches generalement considerees comme etant du domaine de l'intelligence artificielle (exemple: ...).

Je n'aime pas beaucoup la deuxieme partie (a partir de "ces evolutions"). L'idee de creation d'une machine adaptee au cours du processus d'apprentissage (si j'ai bien compris) n'est pas clair ici, il faudrait un exemple pour que le lecteur comprenne. Et je ne suis pas sur que ca ait sa place dans une intro de 15 lignes sur l'apprentissage automatique. Meme remarque pour le concept de machine (ca se justifierait plus pour expliquer le terme "machine learning", dans une version anglaise).

Le dernier paragraphe (Bien souvent...) aborde un point important, mais me semble egalement a refaire.

Quel flou[modifier le code]

Sans vouloir faire mon relou, je pense qu'un peu de ménage dans les termes ne serait pas superflu.

  • Ne pas mélanger les "modèles" (p.ex modèles de mélanges) et les algorithmes (EM en l'occurence)
  • Le "clustering" n'est pas un algorithme de classification automatique mais uniquement la traduction anglaise du terme

Rilou2000 29 mai 2007 à 20:52 (CEST)[répondre]

Il faudrait entièrement reprendre cet article, j'ai jamais eu le courage... Sylenius 29 mai 2007 à 21:07 (CEST)[répondre]

Refonte de l'article : proposition de plan[modifier le code]

Je viens de voir que cet article demande à être réécrit (d'après les discussions que je vois) et à être complété. Je vous propose d'entamer cette refonte avec le plan ci-dessous qui peut (évidemment) être modifié, complété, critiqué de manière constructive. Je ne suis pas favorable à ce que cet article soit une traduction de l'article anglais, par principe. (Dans ce qui suit il faut remplacer ML par Apprentissage automatique : ce plan est un brouillon)

1 introduction/résumé
2 Définitions
3 Historique

  • d'où on vient
  • pour arriver là où on est aujourd'hui
  • quelles sont les personnes et les organisations importantes dans ce domaine
  • ......

4 Applications

  • comment, qui et pourquoi on s'en sert
  • Big Data, Data Mining, Intelligence Artificielle et Statistiques
  • comment se situe ML par rapport à ces sciences et activités?

5 ML en détail

  • Types d'apprentissage
  • Modèles & Algorithmes
  • Démarche d'un projet ML
  • Analyses prédictives

6 ML et les grands

Microsoft 
Azure ML
Cortana
et les autres
Amazon(?)
Autres

7 ML et les petits

accessible aux individus : amateurs ou chercheurs 
langages et plateformes "classiques"
Autres

8 prospective

 compléter le paragraphe actuel (?)

9 Autres sujets(?)

 formation dans les écoles & universités françaises (?) 
formation dans les universités américaines et chinoises (?)
formation sur internet (?)
......(?)

Jackverr (discuter) 21 août 2015 à 17:40 (CEST)[répondre]

J'aurais tendance à centrer sur la partie 5 de votre plan, c'est quand même le contenu essentiel du ML. Je ne comprend pas la notion de « grand » et « petit ». Chez Google et Facebook, ce sont des individus chercheurs qui font avancer les choses. De plus, j'ai l'impression que c'est redondant avec la partie 4 (je ne vois pas en quoi cela peut s'en différencier a priori). Autre point, l'IA et les stats ne sont pas des application du ML, mais des champs de connaissance s'y rattachant. A mon avis, il vaudrait mieux se baser sur une source secondaire d'ampleur pour l'essentiel (livre de Duda et Hart?) et ajouter des choses sur les applis, les acteurs, etc. Xiawi (discuter) 2 décembre 2015 à 21:26 (CET)[répondre]

Faire et défaire, n’est-ce pas toujours travailler ?[modifier le code]

J’ai trouvé le 30 décembre 2016 cet article dans l’état un peu aride ci-dessous :

https://fr.wikipedia.org/w/index.php?title=Apprentissage_automatique&oldid=133154484

Qu’y découvrait-on ? Pas grand-chose comme on peut le constater : essentiellement des généralités, non illustrées de quoi que ce soit. Quiconque serait venu chercher des informations sur l’apprentissage automatique risquait fort de n’en pas repartir plus avancé qu’en y arrivant, n’ayant vu aucun exemple de ce qui y était mentionné. Dans un premier temps, la vidéo suivante permettait au moins de se faire concrètement une idée de ce qu’étaient un processus d’apprentissage automatique et sa vitesse, et donc de moins perdre son temps :

https://www.youtube.com/watch?v=9yRs0WwLJGE

Le programme correspondant se trouvant dans les dépôts Ubuntu (Open Source, gratuits, et utilisés pour cette raison par nombre de chercheurs y compris ceux de mon labo), il semblait donc pertinent, sauf à créer un article dédié, d’en toucher un mot à ceux désirant tout de suite se familiariser avec le sujet.. De fil en aiguille, on en arrivait à ceci :

https://fr.wikipedia.org/w/index.php?title=Apprentissage_automatique&oldid=133968635

Que l’article, au lieu de rester vague et inconsistant, débouche sur un peu de clair et d’utilisable, a-t-il déplu ? Toujours en est-il que le 26 janvier à l’heure de l’apéritif on put découvrir cette intéressante régression ramenant en grande partie l’article au niveau de flou, d’évasif, d’imprécis, d’indigeste et de nébuleux qu'il avait le mois : pas question d’instruire le lecteur, et encore moins de lui faire découvrir quoi que ce soit d’intéressant. Au contraire, il faut lui faire sans doute croire que c’est un domaine aride où il n’est pas le bienvenu, et que la classification automatique n’est pas devenue tout aussi banale en 2017 que l’usage du tableur en 1997. La suppression de deux illustrations aide considérablement à rendre à nouveau l’article obscur pour le non-spécialiste (ce qui est peut-être l’ambition de toute encyclopédie qui se respecte dans l’optique française universitaire que le monde entier, au cas où les écoles d’ingénieurs hexagonales et limitrophes nous l'envieraient). On admirera aussi l’articulation sans faille des arguments mentionnés :
(actu | diff) 26 janvier 2017 à 11:11‎ Sylenius (discuter | contributions)‎ m . . (18 329 octets) (-6)‎ . . (mef) (annuler)
(actu | diff) 26 janvier 2017 à 11:09‎ Sylenius (discuter | contributions)‎ . . (18 335 octets) (-824)‎ . . (→‎Principes : non) (annuler)
(actu | diff) 26 janvier 2017 à 11:08‎ Sylenius (discuter | contributions)‎ . . (19 159 octets) (-1 516)‎ . . (→‎Pour se familiariser : pub) (annuler)

Il s’ensuivit cette intéressante mini-guerre d’édition, les tenants du vague et du nébuleux semblent insister pour faire prévaloir leur point de vue sur celui des demandeurs d’éclaircissements :

https://fr.wikipedia.org/w/index.php?title=Apprentissage_automatique&type=revision&diff=134013017&oldid=133877031

On remarquera un clair partage du travail entre contributeurs, les uns ajoutant de l’information, les autres l’éliminant afin d’éviter à nos chers lecteurs toute tentation de s’informer, voire - horresco referens – de trouver au sujet un quelconque intérêt.

En tout état de cause, et comme il était demandé avec le {{…}}, c’est bien un complément sur les informations manquantes qui était nécessaire, voire la mention d’autres solutions libres et gratuites utiles, et non la suppression du peu qui existait déjà au motif fort chauvin du not invented here François-Dominique (discuter) 27 janvier 2017 à 13:27 (CET)[répondre]

Je propose donc le retour à cette version de l'article https://fr.wikipedia.org/w/index.php?title=Apprentissage_automatique&oldid=134012985 , sauf à ce qu'un autre avis bâti sur des arguments articulés plutôt que sur tel ou tel caprice individuel, et s'il en existe, soient aligné en sens contraire, puisque mieux vaut tard que jamais ;-) François-Dominique (discuter) 27 janvier 2017 à 13:35 (CET)[répondre]
Désolé, j'ai mis un peu de temps à répondre. Alors, je passe sur les sarcasmes pour discuter directement du fond. Nous sommes ici sur un article extrêmement général, et qui doit le rester. Donner un lien vers un logiciel (qu'elle soit libre et gratuite ne change rien au problème), avec un mini guide d'utilisation est tout à fait contraire à l'esprit Wikipédia et en particulier à Wikipédia:Guide pratique. Rappelez-vous bien que le but des articles de wikipédia est de synthétiser le savoir, pas de faire des guides ou des tutoriels. Cela n’empêche pas de donner de (courts) exemples de temps à autre, avec parcimonie. En l'occurrence, ici il y aurait plus de sens à donner des exemples dans les pages des algorithmes, plutôt qu'ici, où on évoque les grands principes, et il y a fort à faire, cet article n'en effet pas au point du tout. Sylenius (discuter) 29 janvier 2017 à 17:42 (CET)[répondre]
Pourquoi être en effet clair et concret là où on peut se montrer obscur et évasif? H.G. Wells mentionne ce point de vue dans L'Île du docteur Moreau : Il appelait cela « grand penser » pour le distinguer du « petit penser » – lequel concernait les choses utiles de l’existence journalière. (...) Il ne faisait aucun cas de ce qui était simple et compréhensible.
Je me réserve la possibilité d'écrire un article séparé sur MLdemos, qui a tout autant sa place dans la Wik que GNU Octave, LibreOffice, Graphviz ou Kiwix, mais seulement quand j'aurai de quoi en écrire plus de quinze lignes. En attendant, supprimer cette information de l'article évitera au moins aux lecteurs de trop en comprendre quoi que ce soit. Merci pour eux. François-Dominique (discuter) 31 janvier 2017 à 19:02 (CET)[répondre]
François-Dominique (discuter) 31 janvier 2017 à 19:02 (CET)[répondre]

Pour un sujet où nous sommes en plein dedans, que peut de travail ajouté...[modifier le code]

Depuis le 31 Janvier 2017, plus rien n'a été écrit sur un sujet se trouvant dans toutes les discussions, je trouve cela fort triste ! J'ai vraiment très peut de temps, mais de grâce, donnez la forme finale que mérite cet article à la pointe du progrès ( pour notre époque, bien-sûr ) Merci à tous et à toutes. Pascal Musieaux. Pmsx (discuter) 6 octobre 2018 à 08:45 (CEST)[répondre]

Homonymies[modifier le code]

@Vlaam Bruit (homonymie), >Concept, Extrapolation, Similarité – seulement une h. trouvée. AVS (discuter) 11 août 2019 à 08:07 (CEST)[répondre]

Étapes d'un projet[modifier le code]

Le section sur les étapes d'un projet de machine learning me semble plus relever du guide pratique que d'un article encyclopédique. Ne devrait on pas la supprimer ? PAC2 (discuter) 9 avril 2021 à 20:37 (CEST)[répondre]

Bonjour PAC2, à mon avis (de non-spécialiste), cette description fait un peu GP mais est nécessaire car 1) elle place l'apprentissage automatique dans un contexte et une démarche plus générale ; 2) elle montre à quelles étapes certains problèmes peuvent apparaître, développés plus loin dans "Enjeux et limites". — Vega (discuter) 9 avril 2021 à 22:52 (CEST)[répondre]
Bonjour PAC2 et Vega Je pense qu'elle est nécessaire pour expliquer aux néophytes ce qu'est vraiment et concrètement le ML/AA, et démystifier le sujet. Il faut peut être ajouter une ou deux courtes phrases pour mieux expliquer ces étapes. Malo77 (discuter) 10 avril 2021 à 11:09 (CEST)[répondre]

Ref pour CRISP-DM[modifier le code]

Transfert depuis ma PDD — Vega (discuter) 21 avril 2021 à 15:45 (CEST)[répondre]

Bonjour Vega. A propos de cette demande de ref, je tiens à préciser que toutes les ref sont dans l'article wikipedia mis en lien. "On retrouve aussi ces étapes dans la méthode CRISP-DM, qui concerne les projets d'exploration de données et a été développée dès 1996" Je trouve très redondant de rajouter des ref dans l'article Apprentissage automatique alors que cela se trouve déjà dans l'article CRISP-DM, il suffit de cliquer et regarder dans celui-ci. Qu'en pensez-vous ? A la limite je peux supprimer l'année dans l'article Apprentissage automatique. Malo77 (discuter) 21 avril 2021 à 11:43 (CEST)[répondre]

Bonjour Malo77, je ne suis généralement pas partisan de sourcer Wikipédia par Wikipédia, ni pour le principe (sourcer de façon transparente est essentiel), ni pour la pratique (il m'est arrivé de me rendre sur un article et de ne pas y trouver l'info soi-disant citée). Mais à vrai dire, dans le cas présent, cette mention de CRISP-DM me laisse perplexe : il n'y a aucun développement qui enrichisse Apprentissage automatique ; elle ressemble plus à un coup de pub (pourquoi citer ce projet en particulier ?) ; et elle est obsolète, puisque CRISP-DM est mort. Si ce projet a un intérêt historique ou conceptuel qui justifierait la mention, cela n'est pas précisé. On la supprime ? — Vega (discuter) 21 avril 2021 à 15:45 (CEST)[répondre]
Bonjour Vega, je ne souhaite pas sourcer par Wikiepdia, mais simplement faire un renvoi vers l'article détaillé qui contient les développements et sources nécessaires, sans faire du copié-collé d'un article à l'autre ce qui serait maladroit. A ma compréhension ce n'est pas un projet obsolète mais une méthode Projet, et intéressante à ce titre à citer et mettre en parallèle avec avec les étapes d'un projet Data. Depuis j'ai trouvé aussi la méthode SEMMA et quelques sources que je vais certainement ajouter par souci d'équité. Comme toutes les méthodes projets elles datent un peu mais ne sont pas nécessairement obsolètes (penser aux méthodes traditionnelles PERT / GANTT, etc .. des outils de plusieurs dizaines d'années mais toujours enseignées et utiles au niveau conceptuel au moins). C'est à ce que j'ai trouvé une des rare méthode projet faite pour les projets Data de manière spécifique, plus SEMMA ... Aucune pub pour ma part mais simplement souligner qu'il y a une méthode projet data spécifique qui existe, et qu'elle a déjà son article Wikipedia. On ajoute SEMMA en sourçant cela ? Malo77 (discuter) 21 avril 2021 à 16:44 (CEST)[répondre]
Malo77, copier-coller les réfs est parfois un mal nécessaire, pour éviter de promener le lecteur, mais je vois que vous avez ici trouvé une source pertinente (semble-t-il, le site est HS). La question demeure : pourquoi mentionner ces trois méthodes concernant en particulier l'exploration de données, parmi tous les domaines de l'apprentissage automatique ? Maintenant que c'est sourcé et moins "pub", c'est moins gênant en tout cas. — Vega (discuter) 21 avril 2021 à 18:29 (CEST)[répondre]
Vega Malheureusement la redondance alourdi certains des articles Wikipedia à mon sens. Si un article dédié existe c'est à éviter. J'ai trouvé une url alternative pour la même source: dois-je remplacer ? ici cela semble plus facilement accessible: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.686.840&rep=rep1&type=pdf . Au début j'ai mis 1 méthode "CRISP-DM", vous pouvez regarder l'article consacré au sujet, cette méthode est citée/utilisée loin devant par quasiment 50% des sondés donc pertinente. Pour les autres j'ai mis ce que j'ai vu dans les sources, sur les méthodes Data, mais vous pouvez compléter. Je ne comprend pas bien la critique de "la" sélection des 3 méthodes. Je précise que cette liste est dans la source, et qu'on est ici dans le paragraphe méthode/étapes et pas dans une partie sur les algo de ML/AA, à ne pas mélanger. Que mettriez/ajouteriez vous, merci d'être plus précis sur ce point ? Si vous considérez que cela est de la pub il faut demander la suppression de l'article CRISP-DM dont je ne suis pas l'auteur. Merci de ne pas appeler pub un simple lien interne wikipedia. Malo77 (discuter) 22 avril 2021 à 10:52 (CEST)[répondre]