Pandas

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Pandas
Description de l'image Pandas logo.svg.

Informations
Créateur Wes McKinneyVoir et modifier les données sur Wikidata
Dernière version 1.0.1 ()[1]Voir et modifier les données sur Wikidata
Dépôt github.com/pandas-dev/pandasVoir et modifier les données sur Wikidata
Assurance qualité Intégration continueVoir et modifier les données sur Wikidata
Écrit en PythonVoir et modifier les données sur Wikidata
Type Bibliothèque logicielle Python (d)
Numerical software (d)Voir et modifier les données sur Wikidata
Licence Licence BSDVoir et modifier les données sur Wikidata
Site web pandas.pydata.orgVoir et modifier les données sur Wikidata

Pandas est une bibliothèque écrite pour le langage de programmation Python permettant la manipulation et l'analyse des données. Elle propose en particulier des structures de données et des opérations de manipulation de tableaux numériques et de séries temporelles. Pandas est un logiciel libre sous licence BSD[2].

Les principales structures de données sont les séries (pour stocker des données selon une dimension - grandeur en fonction d'un index), les DataFrames (pour stocker des données selon 2 dimensions - lignes et colonnes), les Panels (pour représenter des données selon 3 dimensions, les Panels4D ou les DataFrames avec des index hiérarchiques aussi nommés MultiIndex (pour représenter des données selon plus de 3 dimensions - hypercube)

Fonctionnalités de la bibliothèque[modifier | modifier le code]

  • l'objet DataFrame pour manipuler des données aisément et efficacement avec des index pouvant être des chaines de caractères ;
  • des outils pour lire et écrire des données structurées en mémoire depuis et vers différents formats : fichiers CSV, fichiers textuels, fichier du tableur Microsoft Excel, base de données SQL ou le format rapide et permettant de gérer de gros volume de données nommé HDF5 ;
  • alignement intelligent des données et gestion des données manquantes (NaN = not a number). alignement des données basé sur des étiquettes (chaines de caractères). tri selon divers critères de données totalement désordonnées ;
  • Redimensionnement et table pivot ou pivot table en anglais (aussi nommé tableau croisé dynamique) ;
  • Fusion et jointure de large volume de données
  • Analyse de séries temporelles

Les voies critiques de la bibliothèque sont écrits en Cython ou C.

Voir également[modifier | modifier le code]

Références[modifier | modifier le code]

Liens externes[modifier | modifier le code]