SPSS

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
SPSS
Image illustrative de l'article SPSS
Logo

Développeur SPSS
Dernière version 21.0 (21 août 2012)
Environnements Mac, Linux, Windows
Type Logiciel de statistiques
Licence propriétaire
Site web www.ibm.com/software/analytics/spss/products/statistics/index.html

SPSS (Statistical Package for the Social Sciences) est un logiciel utilisé pour l'analyse statistique. C'est aussi le nom de la société qui le revend (SPSS Inc). En 2009, la compagnie décide de changer le nom de ses produits en PASW, pour Predictive Analytics Software[1] et est rachetée par IBM pour 1,2 milliard de dollars[2].

Description[modifier | modifier le code]

La première version de SPSS a été mise en vente en 1968 et fait partie des programmes les plus largement utilisés pour l'analyse statistique en sciences sociales. Il est utilisé par des chercheurs en économie, en science de la santé, par des compagnies d'études, par le gouvernement, des chercheurs de l'éducation nationale, etc. En plus de l'analyse statistique, la gestion des données (sélection de cas, reformatage de fichier, création de données dérivées) et la documentation des données (un dictionnaire de métadonnées est sauvegardé avec les données) sont deux autres caractéristiques du logiciel.

Les nombreuses caractéristiques de SPSS sont accessibles via les menus déroulants ou peuvent être programmées avec un langage en ligne de commande appelé 4GL (licence propriétaire). La programmation par lignes de commande a les avantages de la reproductibilité et de la manipulation et de l'analyse de données complexes. L'interface des menus déroulants génère également une syntaxe de commandes, bien que, par défaut, elle soit invisible à l'utilisateur. Les programmes peuvent être lancés de manière interactive ou de façon non surveillée en utilisant le "Production Job Facility" fourni. Un langage de macro peut être utilisé pour écrire des routines et une extension pour le langage python permet d'accéder aux informations dans les données ou dans le dictionnaire des données et de construire des programmes en syntaxe de ligne de commande de façon dynamique. Cette extension de programmation Python, introduite dans la version 14, a remplacé les scripts SAX Basic moins fonctionnels pour la plupart des besoins, bien que SaxBasic reste disponible. Depuis la version 14, SPSS peut être piloté extérieurement en utilisant un programme en Python ou en VB.NET en utilisant les "plug-ins" fournis.

SPSS impose des contraintes concernant la structure interne des fichiers, les types des données, le traitement des données et les fichiers de correspondance, ce qui en fin de compte simplifie considérablement la programmation. Les séries de données de SPSS ont une structure en tableau à deux dimensions où les rangées représentent typiquement les cas (tels des individus ou des foyers) et où les colonnes représentent les mesures (telles que âge, sexe, ou revenu du foyer). Il n'y a que deux types définis de données : nombres ou chaines de caractères. Tous les traitements de données se déroulent de façon séquentielle les cas à la suite les uns des autres dans l'ordre du fichier. Les fichiers peuvent être comparés un à un, un envers les autres, mais pas plusieurs d'un coup envers les autres.

Différentes versions de SPSS existent pour Windows, Mac OS X et Unix. La version pour Windows est mise à jour plus fréquemment et possède plus de caractéristiques que les versions pour les autres systèmes d'exploitation. SPSS Inc. a annoncé que la mise sur le marché de la version 15.1 de SPSS en 2007 tournera de façon native sur ordinateur Mac muni de processeur Intel x86.

SPSS peut lire et écrire des données à partir et dans des fichiers texte en caractères ASCII (incluant les fichiers hiérarchiques), d'autres paquetages statistiques, des feuilles de calcul et des bases de données (des tables de base de données relationnelles externes via ODBC et SQL).

Les exportations statistiques se font dans un format propriétaire (fichiers *.spo, acceptant les tableaux croisés dynamiques) pour qui, en plus de l'afficheur du logiciel, un afficheur indépendant est fourni. On peut aussi demander que les exportations soient forcées en format texte (lisible avec un éditeur de texte) ou capturées en tant que données (en utilisant la commande OMS) au format texte, texte délimité par des séparateurs, HTML, XML, paquets de données SPSS ou une variété de formats d'images (JPEG, PNG, bitmap et EMF).

Fonctions statistiques incluses dans le logiciel de base :

Des modules peuvent être ajoutés pour augmenter les possibilités du logiciel. Les modules disponibles sont :

  • l'extension de programmabilité SPSS ("SPSS Programmability Extension" (ajouté dans la version 14) qui permet la programmation en Python pour contrôler SPSS.
  • la validation de données SPSS ("SPSS Data Validation") (ajouté dans la version 14) qui permet la programmation du contrôle de la logique des données et donne la liste des valeurs suspectes.
  • les modèles de régression SPSS ("SPSS Regression Models" - Logistic regression, ordinal regression, multinomial logistic regression, and mixed models (modéles multiniveaux).
  • les modèles avancés SPSS ("SPSS Advanced Models" - Multivariate GLM and repeated measures ANOVA (enlevés de la version de base dans la version 14).
  • le module des arbres de classification SPSS ("SPSS Classification Trees") qui crée des arbres de classification et de décision pour l'identification de groupes et la prévision de comportements.
  • les tableaux SPSS ("SPSS Tables"), qui permettent de contrôler la manière d'effectuer les exportations de données pour les rapports.
  • les tests exacts SPSS ("SPSS Exact Tests") permettant le test statistique sur de petits échantillons.
  • les catégories SPSS ("SPSS Categories")
  • SPSS Trends
  • SPSS Conjoint
  • l'analyse de valeur manquante SPSS ("SPSS Missing Value Analysis") qui est une imputation simple à base de régression.
  • SPSS Map
  • le module des échantillons complexes SPSS ("SPSS Complex Samples") (ajouté dans la version 12) qui réalise des ajustements pour la stratification et le groupage et autres biais de choix d'échantillon.

SPSS Server est une version de SPSS avec une architecture client/serveur qui possède des caractéristiques non disponibles dans les versions pour PC fixes. Un exemple est la fonction de score.

SPSS Inc.[modifier | modifier le code]

Le programme SPSS est vendu par SPSS Inc., une société qui commercialise une grande variété de logiciels destinés à l'analyse de marché, aux études statistiques et à l'analyse statistique. Ces autres logiciels incluent AMOS ("Analysis of MOment Structures") pour la modélisation d'équation structurelle, SamplePower pour l'analyse de pouvoir, AnswerTree utilisé pour l'étude de la segmentation du marché, SPSS Text Analysis for Surveys pour coder des réponses ouvertes, Clementine pour l'exploration de données ("data mining") et d'autres paquetages pour CATI et les études en ligne. Le siège social de la société est à Chicago dans l'Illinois.

Autres versions[modifier | modifier le code]

La version 16.0 de SPSS a été portée en Java et est utilisable sur Mac OS X, Windows Vista et Linux.

Voir aussi[modifier | modifier le code]

  • PSPP, un logiciel libre qui peut exécuter des commandes de transformation issues de SPSS et peut produire des statistiques descriptives, de fréquences, examine, crosstabs, test t et analyse de variance unidirectionnelle.
  • Les grands éditeurs d'entrepôts de données IBM, Oracle, Teradata qui la plupart du temps sont les fournisseurs des données nécessaires aux outils de SPSS.

Références[modifier | modifier le code]

  1. Jason Verlen, « Product Naming Guide », sur spss.com, SPSS (consulté le 18 septembre 2009)
  2. « IBM to Acquire SPSS Inc. to Provide Clients Predictive Analytics Capabilities », sur ibm.com, IBM,‎ 28 juillet 2009 (consulté le 18 septembre 2009)
  • SPSS 15.0 Command Syntax Reference 2006, SPSS Inc., Chicago Ill.
  • Raynald Levesque, SPSS Programming and Data Management: A Guide for SPSS and SAS Users, Fourth Edition (2007), SPSS Inc., Chicago Ill. PDF