Discussion:Analyse en composantes principales

Une page de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Autres discussions [liste]
  • Suppression
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives

Sur le fond[modifier le code]

Cette forme "Mais un bon professeur s'intéressa aussi au second axe, indépendant du premier, qui mettra probablement en évidence les élèves d'un profil plus littéraire et ceux d'un profil plus scientifique (écart entre la note en français et la note en mathématiques)" suggère qu'un "bon professeur" sait déterminer (!!!) le profil des élèves (c'est peut être bien plus compliqué).

Préférons plus modestement "un professeur voulant pousser l'analyse des résultats, s'intéressa aussi au second axe, indépendant du premier, de sorte qu'un écart apparaisse entre la note en français et la note en mathématiques pour chaque élève (Le même raisonnement va entre l'analyse de résultats pour des matières technologiques et des matières littéraires). "


Attention la quasi-totalité des formules de la page sont fausses (covariances, correlations) car elles n'incluent pas la pondération des individus. En général, les individus sont équiprobables de poids 1/n.

---?


Pour ma part je trouve qu'il faudrait ajouter

l'analyse en composante principale (pca en anglais) est aussi une méthode statistique. Cette méthode essaie de trouver pour un ensembles de points un nouveau système de coordonnées tel qu'on observe si on place les points dans ce nouveau système de coordonnées, la plus grande variance selon le premier axe, la deuxième plus grande variance selon le deuxième axe, ...

Plus précisément,Si l'on considère que l'on est dans un espace à n dimensions, la pca cherche une transformation orthogonale pour projeter les points du système de coordonnées actuel dans le système de coordonnées 'principal', on peut appliquer cette transformation et ensuite ne garder que les m (m<n) dimensions qui 'expliquent' le plus la variabilité des points. On peut utiliser cette méthode pour réduire la dimensionnalité de données tout en essayant de garder un maximum de l'information contenue dans les données.

il faut la distinguer de l'analyse en coordonnées principales qui est plus généralement appelé échantillonnage multidimensionnel ou multidimensionnal scaling (MDS) : pour des points dans un espace à n dimensions pour lesquels nous connaissons la distance ou la similarité entre chaque paire de points. cette méthode donne la position des points dans le système de coordonnées principales (de la pca) telle que les distances entre ces points soient respectées 'pour le mieux'.

Plusieurs notions de distances et de similarités existent, la façon de définir 'pour le mieux' diffère pour les différentes version du MDS.

Néanmoins il faudrait en discuter et je peux dire des bêtises, il est intéressant de consulter wikipédia anglais à propos de la pca et du mds et la conclusion de l'article de gopher(1966) (Some distance properties of latent root and vector methods used in multivariate analysis) pour le lien entre principal components analysis et principal coordinate analysis ) Et de plus cela devrait aussi être décrit de façon plus formelle. Qu'en pensez vous ?

--Dwarfy 22 avril 2007 à 03:30 (CEST)

Sur la forme[modifier le code]

Les deux axes d'une ACP sur la photo d'une gymnaste
une image de plus que je n'utilise pas pour l'instant
  • Mettre des illustrations
  • plus d'explications naturelles







.

Divers[modifier le code]

Critère d'inertie[modifier le code]

Dans cette section, finir un paragraphe autour de :

En effet, la formule d'un inertie d'un nuage de points de autour de l'axe est bien: ...

Si l'on part de l'analyse du triplet <X,M,D> (M produit scalaire "individu", D produit scalaire "variable"), l'inertie projetée sur un axe de vecteur directeur est est la matrice de covariance du nuage de points .

L'ACP usuelle prenant M comme la matrice identité, le résultat final est .

Projection[modifier le code]

Il y avait ce paragraphe dans la version précédente de l'article, il est peut-être possible de la conserver:

Cette réduction de dimension s'accompagne d'une perte d'information, mais elle est minimisée à l'aide d'un changement de base, de sorte que les axes conservés soient les plus représentatifs possibles.
La notion de représentativité d'un axe est par exemple évaluée à l'aide d'un critère de variance. Plus la variance est grande selon un axe donné, plus celui-ci est "représentatif".

Résultats théoriques[modifier le code]

à rédiger en grande partie:

  • valeurs propres
    • loi de Wigner (loi du demi cercle)
    • support de la distribution des valeurs propres (sortir du support?)
    • loi de Brady
  • vecteurs propres
  • distribution des composantes (par rapport à une gaussienne)
  • stabilité au cours du temps

Outils pour générer des exemples[modifier le code]

Intérêt du concept[modifier le code]

Si je pense aux articles qui vont pointer sur l'article ACP, il va draguer des lecteurs qui souhaitent comprendre le sujet de manière générale, sans avoir nécessairement la volonté ou la capacité d'entrer directement dans les détails techniques. Il me semble nécessaire d'ajouter une partie, intérêt du concept et l'intro est un peu aride. Soit le lecteur connaît le sujet et il n'en a pas besoin, soit il ne le connaît pas et il va souffrir. Jean-Luc W 12 avril 2006 à 07:34 (CEST)

tout à fait d'accord, je vais aussi mettre des dessins (c'est plus accrocheur et plus parlant), j'espère arriver à un truc assez proche de ton article sur les valeurs propres que je trouve assez exemplaire... Lehalle

Superbe ton intro, clair, parlante, vraiment sympa. Si j'ose une critique, le choix des dessins n'est pas à mon avis, suffisament instructif. Dans la vraie vie, je ne fais pas d'ACP sur une photo, ma dernière est sur la corrélation entre des primes et des résultats commerciaux. Une centaine de points dans un espace de dimension 16, pour moi c'est plus parlant. Pour établir un pont entre ton travail et les maths. Je te propose un résumé de l'état de l'art un peu éparpillé partout. Valeur propre est clairement un point d'ancrage, mais c'est un point d'ancrage à cause de réduction d'endomorphisme. Il faut donc refondre et étoffer l'article sur la réduction, car fondamentalement c'est ce que tu fais dans ton ACP, tu réduis un endomorphisme. Cette article doit donc devenir pivot. Mais comment réduis tu ton endomorphisme? avec des techniques d'algèbre bilinéaire c'est en fait un endomorphisme autoadjoint. Il faut donc restructurer la réduction pour inclure le cas bilinéaire. Mais cette approche ne fournit que la théorie, or si la théorie doit être présente dans WP, nous ne pouvons nous arréter là, il faut aussi inclure l'aspect appliqué. D'ou la nécessité d'un pendant appliqué. Le modèle commence à s'implémenter dans le cas nilpotent. Si tu as une seconde, regardes matrice nilpotente et endomorphisme nilpotent, c'est la première instance pour utiliser une structure qui répondra à ton besoin. Si elle te plait, dans une quinzaine de jours, tu auras ton bonheur, à la fois en terme théorique et appliqué pour l'ACP. D'autres matheux, travaillent dans la même direction et l'article Déterminant est maintenant surement le plus achevé, qu'en penses tu? Jean-Luc W 16 avril 2006 à 02:04 (CEST)

Ici aussi tu as raison, je vais regarder les articles que tu pointe puis aller vers des exemples plus appliqués. Mon caractère me pousse d'abord à construire une structure à peu près cohérente du point de vue théorique, j'y attacherai ensuite les exemples. Lehalle

Sujets connexes[modifier le code]

  • AFC: Analyse Factorielle des Correspondances, pour les tableaux de contingence (2 variables qualitatives).
  • ACM: Analyse des Correspondances Multiples, pour les tableaux de n variables qualitatives.
  • AFD: Analyse Factorielle Discriminante.

Références externes[modifier le code]

Pour s'en inspirer

Sylvester et ACP[modifier le code]

Avec ta rédaction, et les progrès dans la formalisation en maths, la connexion des stat des maths pure et des maths app, devient infiniment plus clair. Pour les maths pures, l'article entre dans les conséquences du théorème spectral en algèbre bilinéaire, en conséquence des travaux de Sylvester sur le principe de l'inertie. Le cas est aussi traité en algèbre linéaire, théoriquement dans l'article sur la diagonalisation et par les applications dans le cas des valeur propre. Pour l'aspect théorique, l'algèbre linéaire, commence à être nettoyé mais il reste du boulot en bilinéaire (ou il n'y a pas grand chose).

Pour les maths app, à mon avis, il faut une connexion avec matrice diagonalisable et un autre dans le cas de l'algorithmique dans le genre des facteur invariant mais dans le cas symétrique. Je ne sais pas si Factorisation de Cholesky est la plus utilisée dans ton cas Salle pourra nous renseigner.

Un détail, au sens de Sylvester tu minimises le moment d'inertie et tu ne le maximise pas, pense à l'exemple du balais dans valeur propre ton premier axe d'ACP est l'axe 1 qui possède la plus petite inertie (c'est là ou il est le plus facile de le faire tourner). Jean-Luc W 23 avril 2006 à 13:14 (CEST)

corrélation/indépendance[modifier le code]

Attention, l'indépendance statistique n'est pas équivalent à la non-corrélation.

Lisez la page correspondante en langue allemande si vous voulez mieux comprendre ![modifier le code]

Cette page est certainement faite par un mathématicien qui comprend ce qu'il fait, je n'ai pas de doute à ce sujet. Mais elle est relativement mal écrite. Trop de résultats ou calculs ne sont qu'évoqués au fil du texte et certaines formules pourtant centrales sont péniblement compréhensibles en une seule lecture attentive. Un rédacteur avisé préférerait en certains endroits stratégiques du texte former une phrase de plus, dire les choses en deux phrases plutôt qu'en une seule alambiquée. Un rédacteur avisé se donnerait la peine de bien fixer le formalisme employé dans son texte, et ceci non seulement mathématiquement mais aussi didactiquement (un exemple peut ainsi servir à fixer une notation dans la tête du lecteur). Car le sujet n'est pas bien difficile et il doit être possible d'écrire un texte qu'un mathématicien puisse saisir complétement en une seule lecture attentive. Ce devrait du moins être un défi pour un bon enseignant de mathématiques. Je vous propose de prendre exemple sur l'excellent article correspondant de Wikipedia en langue allemande. On sent que le texte allemand a été fait par un bon mathématicien qui est également un bon rédacteur de textes explicatifs et scientifiques et qui fait preuve d'un réel souci didactique. Son texte est léger, clair, intelligent et exact. Et une unique lecture attentive suffit !

Que celui qui veut bien comprendre la question, que celui qui souhaite emmener avec lui davantage que des bribes d'information suite à la lecture d'un article Wikipedia sur le sujet de l'analyse en composantes principales, que celui-là préfère lire le versant allemand de cette page.

...Et que le gentil rédacteur, qui n'est sans doute pas borné et pour sûr prêt (par une heureuse disposition de son esprit) à s'améliorer, ait l'intelligence de s'inspirer de la version allemande pour pondre un meilleur texte. Peut-être ce gentil rédacteur est-il enseignant ? Dans ce cas il devrait se demander en quoi le texte allemand est un peu plus clair que le sien, identifier les points didactiques pertinents afin améliorer sa pratique rédactionnelle. A bon entendeur ! (entre temps, le nouveau que je suis a signé)
Modèle:Galopin

Bonjour, cher inconnu, chère inconnue. Je suis plutôt de votre avis. Cependant, il n'y a pas un gentil rédacteur : 59 personnes ont participé à cet article, à des niveaux divers (voir l'historique). Pourquoi ne pas devenir vous-même un gentil rédacteur ? Très cordialement, Orel'jan (d) 9 janvier 2013 à 15:13 (CET)
Oui, je devrais m'y coller. Il suffit à mon avis de traduire fidèlement l'article allemand en français. Pourquoi refaire un texte lorsque l'on dispose déjà d'une excellente version en une autre langue ?
De façon générale : pour un sujet donné, je consulte l'une et l'autre langue ainsi que la page de discussion pour savoir si le traitement de l'information a été critiqué et si oui, comment. Il arrive assez souvent que la version française soit légèrement inférieure à la version allemande. C'est pourquoi il est bien de passer d'une langue à l'autre. Il ne faut pas le prendre mal. Les allemands n'ont pas comme les français une culture académique élitiste fondée sur les concours d'entrée (napoléoniens) aux dites grandes écoles (un critère de sélection ayant pour but premier de pérenniser la hiérarchie sociale française, une société qui sanctuarise ses savoirs. Il n'y a qu'à voir en philosophie, où l'érudition remplace la pensée et où l'on parle comme dans un livre et où les débats sont convenus). L'élite académique allemande est autre car le produit d'une toute autre sélection sur les bancs d'école (système protestant de la Realschule, XIXe siècle). La culture de l'échange d'informations, de la discussion et de la collaboration ne sont pas parasitées par des velléités de se reconnaître dans une société convenue où l'on pratique l'entreglose. L'auteur français se complaît ainsi davantage dans un formalisme abscons où l'allemand préfère parler Klartext et donner l'exemple qui tue.--178.196.169.115 (d) 10 janvier 2013 à 00:26 (CET)Galopin (Suisse, à la féconde charnière des deux mondes)
Par souci de probité intellectuelle, je fais remarquer que dans le cas de l'article sur l'analyse discriminante (Diskriminanzanalyse), c'est cette fois l'article en français qui me semble un peu mieux. Il vaut donc la peine de comparer sans préjugé les articles dans les deux langues.
Bonsoir, Vous ne pouvez être l'Utilisateur:Galopin, qui est une personne ayant participé à la wikipédia de 2006 à 2007. Vous pouvez créer un compte ici. Votre enrichissement de la wikipédie est toujours apprécié. Vous trouverez ici une aide à vos premiers pas.
Cependant, ne soyez pas si prompt à mordre les contributeurs. Je pense bien que vous n'avez pas vérifié les origines géographiques et sociales des 59 contributeurs à cette page. Tous ne sont pas français, ni issus de grandes écoles ; et, quand bien même, ce genre d'argumentation ad personam n'est pas forcément du meilleur goût. Cordialement, Orel'jan ,(d) 10 janvier 2013 à 20:33 (CET)
Vous avez raison, si ce n'est que ce n'était pas un argument (un argument fonctionne sur le mode déductif : "A donc B", où A est l'argument pour affirmer B). Ce que j'ai fait, c'est 1) constater qu'il y a une différence entre les approches germanique et française, notamment au niveau de l'importance donnée à l'érudition (sanctuarisation du savoir) et 2) proposer une explication de ce fait d'observation. Une éventuelle différence idéologique entre les systèmes de sélection scolaire de la France et de l'Allemagne est un facteur explicatif de premier choix pour la différence constatée. Cette discussion est intéressante mais n'est-ce pas complétement hors-sujet ici ? Vous avez raison, plutôt que de m'intéresser aux différences entre groupes de contributeurs, je pourrais modifier le texte. Le problème est que je n'ose pas tout effacer pour placer une traduction de la version allemande.