Navigateur sans tête

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
image illustrant Internet
Cet article est une ébauche concernant Internet.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Un navigateur headless, littéralement « navigateur sans tête », est un navigateur web sans interface graphique.

Les navigateurs sans tête permettent d'automatiser les contrôles d'une page web dans un environnement similaire à certains navigateurs populaires sur le marché en ligne de commande. Ils sont particulièrement utiles pour les tests de pages web car ils interprètent correctement l'HTML, les feuilles de styles et l’exécution du JavaScript avec de l'AJAX ; fonctions qui ne sont pas toujours disponibles lors des tests[1],[2]. En 2009, Google a commencé à utiliser des navigateurs sans tête pour aider son moteur de recherche à effectuer l'indexation des site utilisant de l'AJAX[3] .

Cas d'utilisation des navigateurs sans tête[modifier | modifier le code]

Les navigateurs sans tête peuvent être utilisés pour[4],[5]:

  • Automatiser des tests sur des applications web.
  • Effectuer des captures d'écrans sur des pages web.
  • Lancer des tests automatisés pour des bibliothèques JavaScript.
  • Faire du Web scraping pour récupérer des données.
  • Automatiser des interactions avec un site web.

Cas d'utilisation malveillant[modifier | modifier le code]

Les navigateurs sans tête peuvent également être utilisés pour :

  • Effectuer des attaques DDOS contre des sites web[6].
  • Augmenter le nombre de vues (pub par exemple) [7].
  • Rechercher automatique des sites afin de les utiliser de manière frauduleuse[8], par exemple pour la recherche d'identifiants confidentiels.

Liste de navigateurs sans tête[modifier | modifier le code]

Voici une liste de navigateurs proposant des fonctions headless :

PhantomJS 
un navigateur sans tête utilisant le moteur de rendu WebKit pour le rendu de ses pages et JavaScriptCore pour l'exécution du javascript. PhantomJS était initialement développé par Ariya Hidayate en 2010[9],[10],[11],[12],[13].
HtmlUnit 
un navigateur sans tête écrit en Java. HtmlUnit utilise Rhino pour le JavaScript[14],[15] .
TrifleJS 
Une version du navigateur Internet Explorer scriptable utilisant le moteur de rendu Trident et le moteur JavaScript V8. TrifleJS utilise la même API que PhantomJS et fonctionne en utilisant l'objet WebBrowser du framework .NET WebBrowser pour contrôler la version d'IE installée sur la machine[5],[16].
Splash 
un navigateur sans tête avec une API HTTP, du scripting en Lua et un IDE IPython(Jupyter). Splash est écrit en Python et utilise le moteur de rendu WebKit.
Weboob 
une bibliothèque Python.

Navigateur sans tête émulé[modifier | modifier le code]

Ces navigateurs émulent l'environnement d'un navigateur. Alors qu'ils sont en mesure de soutenir des fonctions de navigation communes (parsing HTML, support des cookies, XHR, javascript…), ils ne peuvent pas effectuer de rendu et ont un support limité des événements DOM. Ils s'exécutent généralement plus rapidement qu'un navigateur classique, mais sont incapables d'interpréter correctement de nombreux sites[17],[18],[19].

  • Zombie.js. un enviromment de navigation dédié à Node.js[20],[21].
  • ENVJS. un environnement de navigation écrit en JavaScript pour le moteur Rhino[22].

Navigateurs scriptables[modifier | modifier le code]

Voici une liste de navigateurs qui nécessitent encore une interface utilisateur mais ayant des API et qui sont destinés à être utilisés de manière similaire aux navigateurs sans tête.

Voir aussi[modifier | modifier le code]

Références[modifier | modifier le code]