R (langage de programmation et environnement statistique)
| R | |
|
|
|
| Auteur | Ross Ihaka et Robert Gentleman |
|---|---|
| Développeurs | Projet GNU |
| Paradigmes | Programmation multi-paradigmes : orientée objet, impérative, fonctionnelle, procédurale, réflexive |
| Influencé par | S, Scheme |
| Système d'exploitation | Multiplate-forme |
| Licences | GNU GPL |
| Site web | (en) Site officiel |
| modifier |
|
R est un langage de programmation et un environnement mathématique utilisés pour le traitement de données et l'analyse statistique. C'est un projet GNU fondé sur le langage S et sur l'environnement développé dans les laboratoires Bell par John Chambers et ses collègues. Depuis plusieurs années, deux nouvelles versions apparaissent au printemps et à l'automne. R dispose de nombreuses fonctions graphiques.
R est considéré par ses créateurs comme étant une exécution de S, avec la sémantique dérivée du langage Scheme. R est un logiciel libre distribué selon les termes de la licence GNU GPL et est disponible sous GNU/Linux, FreeBSD, NetBSD, OpenBSD, Mac OS X et Windows. R représente aujourd'hui l'un des objectifs techniques majeurs de la communauté hacker GNU[1].
D'après une enquête menée par Rexer Analytics auprès de 1300 analystes, R est le logiciel le plus utilisé aussi bien chez les analystes qui travaillent en entreprise, ceux qui travaillent dans le monde académique, ceux qui travaillent pour des organismes publics ou des ONG ou encore ceux qui travaillent comme consultants[2].
Sommaire |
Les paquets [modifier]
Si R dispose dans sa version de base de la plupart des fonctionnalités utiles pour la statistique de base, ses possibilités deviennent énormes dès que l'on utilise les paquets (ou « extensions »), souvent écrits en R et mis librement à disposition. Ces paquets couvrent un très large champ et vont de la statistique multivariée aux méthodes de ré-échantillonnage, de l'économétrie à la biométrie, des modèles de régression sur séries chronologiques ou les modèles à équations simultanées, en passant par l'analyse de données écologiques (Ade4 et vegan[3]), sans oublier l'approche bayésienne.
Face au nombre toujours croissant de paquets (on comptait près de 80 nouveaux paquets d'octobre à décembre 2007[4]), une page offre des regroupements des paquets selon les domaines abordés[5].
Parmi ces extensions, on peut également citer celles qui permettent d'interfacer directement R avec des bases de données comme PostgreSQL (via le langage procédural PL/R) et MySQL ou des SIG comme GRASS, celles qui permettent d'exporter ses résultats en LaTeX ou OpenDocument, ou encore celles regroupant des fonctions décrites dans des ouvrages de référence, telles MASS, UsingR ou ISwR.
L'installation des extensions se fait de la manière suivante :
install.packages("nom_du_paquet")
Pour pouvoir l'utiliser, il suffit ensuite d'exécuter :
library(nom_du_paquet)
Aide et support francophones [modifier]
- Forum Web du Groupe des utilisateurs du logiciel R
- Forum Web consacré à R sur developpez.net
- Canal IRC (chat) dédié à R : #Rfr sur le réseau Freenode, également disponible via une interface Web
Interface graphique [modifier]
Il existe des interfaces graphiques pour R, comme
- RGUI, l'interface graphique installée par défaut sous Windows.
- JGR sur Java,
- Rattle sur GTK, qui demande l'installation préalable de GTK,
- Rcmdr une interface de commande en Tcl-Tk,
- RKWard sur KDE, disponible seulement sous GNU/Linux, propose la coloration syntaxique des scripts ainsi que de nombreuses fonctions dans les menus,
- RStudio un IDE multiplateforme,
- Sciviews R GUI sur Windows,
- Sim.DiffProcGUI une interface graphique pour la simulation des processus de diffusion.
- Statistical Lab.
Certains éditeurs de texte proposent également des modes pour R :
- Tinn-R, un éditeur de texte orienté R sur Windows,
- Emacs ESS (Emacs speaks statistics) Un mode pour GNU Emacs dédié (entre autres) à R.
- LyX inclut un module Sweave, outil d'insertion de code R dans les documents LaTeX.
Il est également possible d'exécuter des fonctions R directement sur le Web, sans installer le logiciel.
- Le logiciel SAS interface également les fonctions R depuis SAS/IML Studio 3.2, assurant l'interopérabilité entre SAS et R, comme le portage de R sur de grosses volumétries de données et le calcul distribué.
- Le projet R for MediaWiki qui permet de faire tourner R sur des wikis (mais pas encore sous Wikipedia), voir un exemple.
- R est présent dans l'interface de Sage, un logiciel libre de mathématiques diffusé sous la licence GPL
Éléments permettant la réalisation technique du logiciel R [modifier]
R est un logiciel libre dont les sources sont disponibles dans le dépôt R sources. Il est implémenté dans les langages C, C++, Fortran et Java. Avant de penser à le recompiler, il faut donc installer un certain nombre de composants.
Sous Windows, la plupart des outils ont été regroupés dans un seul exécutable qui s'appelle R-tools (R-tools). De plus, pour travailler sur la documentation du logiciel, il faut installer le compilateur de fichiers d'aide Microsoft (HTML Help Workshop). Il faut aussi l'outil LaTeX (MiKTeX). Enfin pour la création de l'exécutable d'installation, on utilise le classique inno-setup (inno-setup). Pour retrouver ces quelques indications techniques et pour aller plus loin, on peut consulter le lien suivant : « Compile R source » (Archive • Wikiwix • Que faire ?).
Communauté [modifier]
Le projet R a été représenté par Toby Dylan Hocking lors de la réunion hacker GNU organisée à Paris du 25 au 28 août 2011[1] dans les locaux de l'IRILL.
Références [modifier]
- (en) « GNU Hackers Meeting in Paris, 2011 », gnu.org, 22 juillet 2011.
- (en) David Smith, « R users: Be counted in Rexer's 2013 Data Miner Survey », Revolution Analytics Blog, 30 janvier 2013 [texte intégral]
- http://pbil.univ-lyon1.fr/ADE-4/
- Rnews Volume 7/3, décembre 2007, disponible sur le site CRAN sous « Newsletter »
- Voir sous [1] puis « Task View »
Liens externes [modifier]
- (fr) Site collaboratif de partage d'astuces et de scripts R.
- (en) Site officiel du projet.
- (en) GNU R sur le répertoire du logiciel libre.
- (en) Catégorie R de l’annuaire dmoz.
- (fr) Tutoriaux vidéo pour R sur le site de l'Université de Lausanne.