Neo4j

Un article de Wikipédia, l'encyclopédie libre.
Neo4j
Description de l'image Neo4j-2015-logo.png.

Informations
Première version [1]Voir et modifier les données sur Wikidata
Dernière version 4.2.6 ()[2]Voir et modifier les données sur Wikidata
Dépôt github.com/neo4j/neo4jVoir et modifier les données sur Wikidata
Écrit en Java et ScalaVoir et modifier les données sur Wikidata
Environnement Machine virtuelle JavaVoir et modifier les données sur Wikidata
Type Base de données orientée graphe
Labeled Property Graph (d)Voir et modifier les données sur Wikidata
Licence Licence publique générale GNU version 3 et AGPL-3.0 (d)Voir et modifier les données sur Wikidata
Site web neo4j.comVoir et modifier les données sur Wikidata

Neo4j est un système de gestion de base de données au code source libre basée sur les graphes, développé en Java[3],[4] par la société suédo-américaine Neo technology. Le produit existe depuis 2000, la version 1.0 est sortie en [5].

Généralités[modifier | modifier le code]

Neo4j permet de représenter les données en tant que nœuds reliés par un ensemble d'arcs, ces objets possédant leurs propres propriétés. Les propriétés sont constitués d'un couple de clé-valeurs de type simple tel que chaînes de caractères ou numérique; celles-ci peuvent être indexées. La modélisation est très proche des concepts métier, il n'est pas nécessaire d'utiliser de clés dans Neo4j, car les relations ont une existence propre. L'absence de modélisation rigide rend Neo4j bien adapté à la gestion de données changeantes et de schémas évoluant fréquemment.[réf. nécessaire]

La base de données Neo4j est construite pour être extrêmement performante pour traiter les liens entre nœuds. Ces performances sont dues au fait que Neo4j pré-calcule les jointures au moment de l'écriture des données, comparativement aux bases de données relationnelles qui calculent les jointures à la lecture en faisant appel aux Index et à la logique de clés. Ce qui fait de Neo4j une technologie adaptée à de larges ensembles de données connectées.[réf. nécessaire]

Les traversées utilisent le langage de requête Cypher[6],[7], standard de parcours des connexions, élaboré dans le but de réaliser plus simplement que SQL les opérations de parcours ou d'analyse de proximité qui sont les plus courantes lorsqu'on traite des données connectées.

Les bases de données de graphes sont des outils puissants pour répondre à des requêtes faisant intervenir des relations entre objets. La recherche du plus court chemin entre deux points du graphe permet par exemple de mettre en place des profils utilisant liens sociaux, géographie et analyse d’impact. [réf. nécessaire]

Exemples d'usages de Neo4j[modifier | modifier le code]

  • Gestion de réseau/analyse d’impact : avoir la main sur son système et identifier en temps réel le client affecté par une maintenance ou une panne ;[réf. nécessaire]
  • Logistique : calculer le meilleur chemin pour livrer un client ;[réf. nécessaire]
  • Social, collaboration : rechercher très facilement qui sont les amis de mes amis ;[réf. nécessaire]
  • Recommandation : définir en temps réel la liste des produits achetés par mes amis que je n’ai pas moi même achetés ;[réf. nécessaire]
  • Master Data Management / Gestion de configuration : construction d’un référentiel standardisé performant et sans redondance pour vos données critiques hiérarchisées : hiérarchie d’entreprise et de produit ;[réf. nécessaire]
  • Droits d’accès : gestion des groupes, utilisateurs et droits rapidement et sans redondance ;[réf. nécessaire]
  • Géo-Spatial : modélisation d’une carte routière et calculs d’itinéraires ;[réf. nécessaire]
  • Biologie, interactions moléculaires : réduire les risques d’effets secondaires des médicaments en calculant en temps réel les interactions entre une protéine et une future molécule.[réf. nécessaire]

De tels exemples pratiques sont accessibles en ligne ou à télécharger sous forme d'études de cas via un site de dépôt associé[8].

Points forts de Neo4j[modifier | modifier le code]

Des requêtes haute performance[modifier | modifier le code]

Le modèle de données du graphe permet l’exécution de requêtes complexes avec une haute performance, inhérentes aux données connectées des applications d’aujourd’hui.[réf. nécessaire]

Des projets livrés plus rapidement[modifier | modifier le code]

Modéliser une base de données de graphes est une procédure simple. Les utilisateurs et clients peuvent capturer rapidement toutes sortes de données, structurées, semi-structurées et déstructurées et ainsi les stocker dans Neo4j. Pour une application industrielle, par rapport à une approche par base de données relationnelle, les temps de développement sont réduits, ainsi que les coûts de maintenance, tout en profitant de plus hautes performances.[réf. nécessaire]

La découverte de nouveaux cas d’usage[modifier | modifier le code]

Très souvent les utilisateurs et clients de Neo4j démarrent un projet car ils n’ont pas pu trouver de solution à un problème bien précis avec d'autres systèmes de gestion de base de données. Puis ils découvrent, par la simplicité du modèle de données de graphes, de nouveaux cas d’usage très utiles dans le monde des startups ou des industries fortement concurrentielles. [réf. nécessaire]

Modèle[modifier | modifier le code]

Neo4j est une base de donnée orientée graphe avec labels et propriétés (Labeled Property Graph), cela signifie que des données sous forme de propriétés peuvent être associées aux différents objets du graphe. Neo4j définit 2 types d'objets dans le graphe: les nœuds et les relations.

Nœuds[modifier | modifier le code]

Les nœuds[9] servent à représenter des entités (objet physique, personne, concepts) et contiennent beaucoup d'informations sous forme de propriétés. Les nœuds peuvent être associés à des catégories grâce à l'utilisation d'un ou plusieurs labels.

Label[10][modifier | modifier le code]

Les labels servent à créer des groupes, des catégories de nœuds. Ils servent à la fois à décrire l'objet du nœud et à filtrer les recherches lors de requêtes. Les labels peuvent être accumulés sans limite de nombre sur un nœud.

CREATE (Keanu:Person:Actor {name:"Keanu Reeves"});
MATCH (p:Person) return p;  # Toutes les 'Person' du graphe
MATCH (a:Actor) return a;   # Tous les 'Actor' du graphe

Par convention, les labels doivent utiliser la mise en forme Camel[11]. Il est possible d'ajouter ou de supprimer des labels présents sur un nœud grâce à la fonction set:

MATCH (keanu:Person {name:"Keanu Reeves"}) set keanu :Director;
MATCH (keanu:Person {name:"Keanu Reeves"}) remove keanu :Actor;

Propriétés[modifier | modifier le code]

Les propriétés décrivent une entité mais sont également le seul moyen de les différentier. Contrairement aux bases de données relationnelles il n'est pas coutume d'utiliser un identifiant unique pour chaque entité, les nœuds sont donc identifiés et différentiés par une combinaison de labels et propriétés.

Exemples de propriétés pouvant être utilisées comme identifiant unique:

  • name pour les personnes
  • title
  • uri ou url pour les livres ou les sites internets

Relation[12][modifier | modifier le code]

Une relation dans Neo4j est une association unidirectionnelle entre 2 nœuds, cependant Neo4j est également performant dans les deux directions de lecture. Une relation doit spécifier quel type de lien elle représente, pour cela le type de relation est spécifié à la construction avec la syntaxe ()-[:TYPE]->(). Comme les nœuds, la relation peut contenir des propriétés.

Il est impossible de supprimer un nœud tant qu'il existera des relations entre ce nœud et un autre. Pour supprimer un nœud et toutes ses relations automatiquement, il existe la commande detach delete n.

Propriété[modifier | modifier le code]

Les propriétés d'un objet sont un ensemble de clé-valeur. Elles peuvent être appliquées sur les nœuds ou les relations. La plupart des formats de données numériques sont supportés comme les chaînes de caractères, les nombres entiers ou flottants, les booléens et les dates[13].

Accès[modifier | modifier le code]

Pour sélectionner les nœuds ou relations qui possèdent une ou plusieurs propriétés , il est possible de les spécifier dans la section MATCH ou la section WHERE. Pour tester l'existence ou non d'une propriétés dans un objet, utilisez la syntaxe EXISTS(o.prop) ou NOT EXISTS(o.prop)[14].

MATCH (p {name:"Keanu Reeves"}) return p;
MATCH (p) WHERE p.name = "Keanu Reeves";

Modification[modifier | modifier le code]

Après avoir sélectionné les objets à modifier, la valeur de la propriété peut être ajoutée ou modifiée avec set o.prop = val, et supprimée avec set o.prop = NULL[15], cela implique qu'une propriété ne peut pas contenir une valeur nulle.

À noter[modifier | modifier le code]

Certains SGBD relationnels s'inspirent désormais de Neo4j pour proposer des extensions de données en graphe en utilisant les mêmes prédicats de navigation que le langage Cypher de Neo4J. C'est le cas en particulier de Microsoft SQL Server 2017 pour laquelle cette fonctionnalité est incluse dans le moteur SQL[réf. souhaitée].

Références[modifier | modifier le code]

  1. « https://neo4j.com/blog/neo4j-1-0-released/ »
  2. « https://neo4j.com/release-notes/neo4j-4-2-6/ »
  3. (en) Todd Hoff, « Neo4j - a Graph Database that Kicks Buttox », High Scalability, Possibility Outpost, (consulté le 24 janvier 2012).
  4. (en) Gavin Terrill, « Neo4j - an Embedded, Network Database », InfoQ, C4Media Inc, (consulté le 24 janvier 2012).
  5. (en) « The top 10 ways to get to know Neo4j », Neo4j Blog, (consulté le 24 janvier 2012).
  6. Cypher.
  7. (en) « Syntax - Neo4j Cypher Manual », sur Neo4j Graph Database Platform (consulté le 22 octobre 2020)
  8. Site de dépôt associé.
  9. (en) « Graph Modeling Guidelines », sur Neo4j Graph Database Platform (consulté le 22 octobre 2020)
  10. (en) « Graph Modeling Guidelines », sur Neo4j Graph Database Platform (consulté le 22 octobre 2020)
  11. (en) « Graph database concepts - Naming rules and recommendations », sur Neo4j Graph Database Platform (consulté le 22 octobre 2020)
  12. (en) « Graph Modeling Guidelines », sur Neo4j Graph Database Platform (consulté le 22 octobre 2020)
  13. (en) « Graph database concepts - Getting Started », sur Neo4j Graph Database Platform (consulté le 22 octobre 2020)
  14. (en) « WHERE - Neo4j Cypher Manual », sur Neo4j Graph Database Platform (consulté le 22 octobre 2020)
  15. (en) « SET - Neo4j Cypher Manual », sur Neo4j Graph Database Platform (consulté le 22 octobre 2020)

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]