BigQuery

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

Logo de BigQuery

Adresse cloud.google.com/products/bigquery/
Langue Anglais
Propriétaire Google
Lancement
État actuel En activité

BigQuery est un service web RESTful qui permet l'analyse interactive massive de grands ensembles de données en collaboration avec l'espace de stockage Google. C'est un logiciel en tant que service (SaaS) qui peut être utilisé en complément de MapReduce.

BigQuery est un entrepôt de données d'entreprise de google très adaptable et en mode sans serveur. Il assure l'augmentation de la productivité des analystes de données. Puisque BigQuery est en mode sans serveur, il n'y a pas d'infrastructure à gérer. Les requêtes peuvent être écrites en SQL legacy ou en SQL standard. Cet outils google permet d'analyser les données situées dans un entrepôt logique. Un entrepôt logique peut contenir des datasets qui sont équivalents au bases de données. Les datasets peuvent contenir des tables ou des vues. Le service est gratuit jusqu'à 1 To de données analysées par mois et 10 Go de données stockées[1].

L'histoire[modifier | modifier le code]

Après avoir limité la période de tests en 2010, BigQuery a été rendu globalement disponible en novembre 2011, lors de la conférence Google Atmosphère[2]. En 2014, MapR a présenté le projet Apache Drill, qui vise à résoudre des problèmes similaires[3]. En avril, 2016, les utilisateurs européens du service ont subi une interruption de 12 heures[4]. En mai, 2016, un soutien a été annoncé pour les Feuilles de calcul Google[5].

Conception[modifier | modifier le code]

BigQuery fournit un accès externe à la technologie Dremel[6],[7], un système évolutif, interactif ad hoc sur le système de requête pour l'analyse de la lecture seule de données imbriquées. Pour utiliser des données dans BigQuery, celle-ci doivent d'abord être téléchargées sur le stockage de Google et ensuite importées à l'aide de l'API HTTP de BigQuery. BigQuery exige que toutes les demandes soient authentifiées via un mécanismes d' authentification OAuth.

Fonctionnalités[1][modifier | modifier le code]

  • Entrepôt de données sans serveur.
  • Analyse en temps réel.
  • Haute disponibilité automatique.
  • Langage SQL standard.
  • Requêtes fédérées et entreposage de données logique.
  • Séparation du stockage et des calculs.
  • Sauvegarde automatique et restauration facile.
  • Fonctions et types de données géospatiaux.
  • Service de transfert de données.
  • Intégration à un écosystème de big data.
  • Évolutivité à l'échelle du pétaoctet.
  • Modèles tarifaires flexibles.
  • Chiffrement des données et sécurité.
  • Localité des données.
  • Base pour l'IA.
  • Base pour la veille stratégique.
  • Ingestion flexible des données.
  • Gouvernance des données.
  • Interaction automatisée.
  • Surveillance et journalisation complètes avec Stackdriver.
  • Maîtrise des coûts

Caractéristiques[modifier | modifier le code]

  • La gestion des données - créer et supprimer des tables sur la base d'un schéma codé JSON, importer des données codées au format CSV ou JSON à partir de l'espace de stockage Google.
  • Requête - les requêtes sont exprimées dans la norme du langage SQL[8] et les résultats sont retournés en JSON avec une réponse de taille maximume de 128 MO, ou de taille illimitée, lorsque le critère "grands résultats" est activé[9].
  • Intégration - BigQuery peut être utilisé à partir de Google Apps Script, les feuilles de calcul Google, ou n'importe quel langage qui peut travailler avec son API REST ou les bibliothèques client[10].
  • Contrôle d'accès - il est possible de partager les jeux de données avec l'arbitraire des individus, des groupes, ou dans le monde

Références[modifier | modifier le code]

  1. a et b « google cloud platform », sur cloud.google.com
  2. Iain Thomson, « Google opens BigQuery for cloud analytics: Dangles free trial to lure doubters », (consulté le 26 août 2016)
  3. Neil McAllister, « Is your data boring? MapR wants you to bore it back with Apache Drill: New release adds support for Google-y SQL-on-Hadoop tech », (consulté le 26 août 2016)
  4. Simon Sharwood, « Google Euro-cloud glitch », (consulté le 26 août 2016)
  5. Jordan Novet, « Google BigQuery now lets you analyze data from Google Sheets », (consulté le 26 août 2016)
  6. Sergey Melnik, Andrey Gubarev, Jing Jing Long, Geoffrey Romer, Shiva Shivakumar, Matt Tolton et Theo Vassilakis, « Dremel: Interactive Analysis of Web-Scale Datasets », Proc. of the 36th International Conference on Very Large Data Bases (VLDB),
  7. Kazunori Sato, « An Inside Look at Google BigQuery », Google, (consulté le 26 août 2016)
  8. « SQL Reference » (consulté le 26 juin 2017)
  9. « Quota Policy » (consulté le 26 juin 2017)
  10. « BigQuery Client Libraries » (consulté le 26 juin 2017)

Liens externes[modifier | modifier le code]