Discussion:Deep packet inspection

Une page de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Autres discussions [liste]
  • Suppression
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives

--- RESUME INTRODUCTIF ---[modifier le code]

--PGY5GIOT (discuter) 16 janvier 2019 à 14:40 (CET)

Bonjour. Je suis votre relecteur dans le cadre du parcours TIIR 2018-2019.Je souhaite aider à la rédaction de cet article, et être au plus juste dans mes remarques. Le dialogue est ouvert avec un esprit critique sans animosité. Le sujet est intéressant.J'aborderai section par section la relecture. Cordialement.

Mes 1ères remarques à la lecture du résumé introductif de l'article.

  • Pour la définition de l'inspection profonde des paquets, pourquoi ne pas rester sur l'acronyme ; c'est à dire définir par une analyse de la charge utile des paquets ( au lieu d'un flux de données)au niveau de la couche application principalement ? Je ne sais pas si l'analyse est faite par défaut au niveau de la couche application ( j'ai lu des articles contradictoires sur la couche par défaut application ou réseau ?)
  • Un lien explicatif sur signature est peut-être pertinent. En effet, le DPI est basé sur la recherche de signature dans les paquets.
  • Une phrase manque pour annoncer la 1ère partie de l'article (technologie).Peut-être dire en une phrase l'implémentation du DPI au niveau logiciel et hardware, puis les usages (applications) dans la société, pour annoncer la 2ème partie de l'article.
  • priorisation ou ralentissement: Est-ce que ce sont des domaines d'application de IPP ? Est-ce qu'on utilise IPP pour prioriser ou ralentir le flux ? les tags au niveau des couches 2 et 3 se chargent de ça.

Cordialement.

Bonjour, pas de soucis nous lirons vos commentaires dans un esprit scientifique avec pour objectif l'amélioration de l'article.
Pour votre première remarque, serait-il possible d'avoir plus de précisions sur ce que vous entendez par pourquoi ne pas rester sur l'acronyme.
Vos deux remarques suivantes seront appliquées
Pour ce qui est de la dernière, il faudrait nuancer le propos. L'IPP sert à détecter les flux problématiques/importants qui seront ensuite ralentis ou priorisés (peut-être via des tags aux couches inférieures).
Cordialement, IratanRG (discuter) 21 janvier 2019 à 15:10 (CET)
--PGY5GIOT (discuter) 21 janvier 2019 à 15:42 (CET):: bonjour
j'entends par acronyme l'abréviation de "Deep Packet Inspection" , soit D.P.I
l'acronyme est suffisamment explicite pour expliquer le terme inspection profonde des paquets.On inspecte des paquets ;on peut ensuite inspecter des flux de paquets, comme vous le précisez dans la section ::"Context Based DPI". Mais je vois ça comme un cas particulier de DPI. L'inspection des paquets me semble une définition plus généraliste.
L'inspection profonde de paquets ou en anglais Deep Packet Inspection, abrégée IPP ou DPI est une technique d'analyse des paquets passant dans des équipements réseau au-delà de l'entête. Le matériel recherche des informations dans la charge utile des paquets plutôt que dans les entêtes (à l'inverse des approches classiques). Des signatures sont le plus souvent recherchées pour détecter des types de paquets et/ou des liens entre les paquets mêmes et prendre des actions en conséquence. Il existe plusieurs domaines d'applications: priorisation ou ralentissement de flux particuliers, censure, détection d'intrusion. L'inspection est mise en œuvre par des gouvernements, des FAI et des organisations à ces fins.
Est ce que cette correction vous convient plus ?
IratanRG (discuter) 21 janvier 2019 à 16:05 (CET)
il est toujours difficile de trancher sur une perception: analyse des paquets ou analyse de flux de paquets--PGY5GIOT (discuter) 29 janvier 2019 à 10:41 (CET). La frontière est mince. J'opterai pour analyse des paquets pour la définition de DPI, quoique l'application première de DPI soit l'analyse des flux. C'est une perception, et peut-être que la discussion n'a même pas à avoir lieu tellement la différence est minime entre analyse de paquets et analyse de flux de paquets.

Marine VS2i (discuter) 30 janvier 2019 à 20:48 (CET)

Bonsoir, je suis une relectrice du Master VS2i. Nous sommes deux relecteurs de ce master pour votre article, mais je m'occupe, dans un premier temps, de relire l'abstract, la partie Hardware et la partie Société. Sachez qu'il n'y aura aucune animositée de ma part, je ne fais que commenter ce qui me semble perfectible, libre à vous d'en tenir compte ^^

Premièrement, il me semblerait judicieux de rajouter une partie sur les applications du DPI (sachant que vous en parlez tout du long, mais je trouve qu'une partie complète à consacrer aux applications, usages et utilisations serait pertinente).

Pour cette partie résumé, j'aurai quelques suggestions, les voici :

  • Le matériel ? Quel matériel ? Le matériel utilisé pour l’IPP ? (je ne comprends pas très bien puisqu’on parle d’une technique juste avant)
  • « Prendre des actions » : je suggère plutôt « agir en conséquence » ou « prendre des décisions/mesures » en fonction du sens à donner car on ne « prend pas des actions » à proprement parler
  • là (accent) où elle est utilisée. Cela vient du fait qu’une grande puissance de calcul est nécessaire pour gérer de grandes quantités de trafic.
  • Le terme « grandes quantités de trafic » sonne étrangement, dans le sens où le trafic n’est pas quantifiable. Il peut néanmoins être qualifié de « large » ou d’« énorme ou d’« important » pour souligner son poids.
  • « Le IPP pose aussi des questions quant au respect de la vie privée. » : suggestion : je mettrais plutôt « soulève », car l’on se pose des questions en amont, mais l’on soulève des questions en aval.
  • L’IPP vu qu’on parle d’inspection
  • La virgule se situe avec le « et ce », c’est-à-dire : soit « du trafic, et ce, avec » ou « du trafic, et ce avec » (la seconde virgule n’est pas nécessaire, mais la première l’est)
Bonjour Marine et merci pour vos commentaires.
Je suis globalement d'accord avec vos suggestions. Je pense par contre me souvenir que notre professeur (Mr. Grimaud) nous a dit qu'il fallait dire le IPP; Je n'en suis plus tout à fait sûr. Je reviens vers vous si j'ai une confirmation de sa part, sinon je ferai les modifications (La demande ayant été faite dans plusieurs sections).
J'applique par contre le reste de vos demandes.
Cordialement,
Toomai93 (discuter) 31 janvier 2019 à 12:53 (CET)

--- Hardware ---[modifier le code]

Il manquerait une bref introduction comme pour les algorithmes, c'est à dire résumé rapidement pourquoi du hardware dans le IIP.

Nowitsover (discuter) 21 janvier 2019 à 14:56 (CET)

La modification a été faite, tu peux nous dire si c'est bon.
Toomai93 (discuter) 21 janvier 2019 à 15:36 (CET)
Très bien, c'est bon pour moi
Nowitsover (discuter) 21 janvier 2019 à 15:44 (CET)

Marine VS2i (discuter) 30 janvier 2019 à 20:57 (CET)

  • Globalement, je pense que cette partie pourrait être expliquée de façon plus simple et compréhensible. Certains éléments arrivent sans être introduit et le sens de ce paragraphe est difficile à comprendre. Il serait éventuellement possible de rajouter un schéma primitif pour permettre à un lecteur de mieux visualiser vos explications avec les bascules, ainsi que les correspondances entre les caractères.
  • Les implémentations des automates peuvent être programmées de façon logicielle (je rajouterais une virgule, un point-virgule ou un point «. Pour pousser… » pour couper la phrase) mais pour pousser l'optimisation et les gains de performances, il est possible d'utiliser des solutions matérielles dédiées.
  • « Les FPGA permettent l'optimisation du IPP grâce à la mise en place d'algorithmes de correspondance de chaînes de caractères ou d'automates grâce à l'implémentation de ces algorithmes directement en circuit logique. » On retrouve deux fois le mot grâce, peut-être en remplacer un par « à travers » ou modifier la phrase pour la condenser : « Grâce à l’implémentation d’algorithmes de correspondance de chaînes de caractères ou d’automates directement en circuit logique, les FPGA permettent l’optimisation de l’IPP » ou bien « Les FPGA permettent l’optimisation de l’IPP grâce à la mise en place d’algorithmes de correspondance de chaînes de caractères ou d’automates à travers leur implémentation directement en circuit logique » (je ne sais pas si mes phrases changent le sens de ce que vous souhaitiez dire à la base, mais elle permet de retirer la répétition du « grâce » ainsi que d’ « algorithmes »)
  • Mettre une majuscule à Déterministes
  • Remplacer « une bonne méthode » trop subjectif par une « méthode efficace »
  • « Chaque état de l'automate est une bascule, que ce soit un automate fini non déterministe ou un automate fini déterministe. », il faudrait rajouter un tiret entre non et déterministe.
  • « La différence qui caractérise l'AFND, à savoir plusieurs branches de sortie vers différents états, sera représentée en logique par une sortie de bascule qui peut être connectée à plusieurs entrées d'autres bascules » Emploi du futur alors que le présent est utilisé tout du long (même dans la proposition suivante avec le « peut »). De même pour la phrase suivante « Différentes structures logiques seront utilisées pour l'implémentation des AFND. ». Par la suite, l’emploi du futur est correct car il est hypothétique.
  • « La construction de l'automate fini non-déterministe prend un temps de construction que ce soit en FPGA ou avec un ordinateur classique. » Le problème est que vous dites ici « la construction prend un temps de construction ». Si cette phrase est liée à la suivante, je mettrais plutôt « Pour la construction de l’automate fini non-déterministe, l’utilisation d’un FGPA permet un gain de temps en comparaison à un ordinateur classique. En effet, si l’on considère un temps de traitement d’un caractère de l’ordre de O(1), le temps de construction d’un FGPA sera de l’ordre de O(n), tandis que celui d’une machine séquentielle sera de l’ordre de O(2n). »

--- FPGA/ASIC ---[modifier le code]

Première ligne : des ces algorithmes devrait s'écrire : de ces algorithmes.

Nowitsover (discuter) 21 janvier 2019 à 15:14 (CET)

Done
Toomai93 (discuter) 21 janvier 2019 à 15:36 (CET)

--- Usage ---[modifier le code]

Une seul référence pour ce paragraphe, il faudrait en trouver une autre pour l'utilisation de l'IPP dans la qualité de service (QoS). (Deep Packet Inspection as a Service : Abstract)On y retrouve du Qos/QoE, équilibrage de charge.


Nowitsover (discuter) 21 janvier 2019 à 15:23 (CET)

Marine VS2i (discuter) 30 janvier 2019 à 20:59 (CET)

  • Du fait qu’il y ait deux usages, je mettrais le titre au pluriel.
  • Emploi de l’expression « l'inspection de paquet profonde » alors que depuis le début, il est utilisé « Inspection Profonde de Paquets ». Il est nécessaire de choisir l’un des deux termes.
  • « sont multiples, et peuvent », la virgule avant le « et » n’est pas nécessaire.
  • «  du fait de l'utilisation de port aléatoire », soit l’on dit « d’un port aléatoire », soit « de ports aléatoires »
  • «  grâce au IPP », remplacer par « grâce à l’IPP »
  • «  le IPP », remplacer par « l’IPP »
  • « En effet, pouvoir identifier précisément quel type de contenu passe permet de pouvoir sélectionner quel contenu aura la priorité sur les autres. » je remplacerais la répétition de « quel-quel » par : « En effet, pouvoir identifier précisément le type de contenu qui passe permet de sélectionner celui qui aura la priorité sur les autres ».
  • « Cela peut servir en entreprise pour s'assurer » je le remplacerais par « En entreprise, cela peut être utile pour s’assurer que certains services disposent de la bande passante nécessaire, ou bien, pour que les fournisseurs d’accès à internet puissent vendre de la bande passante à certains sites web. » (n’y a-t-il pas un problème avec la neutralité du net ?) de plus la source n’est pas citée.
bonjour, juste une remarque au niveau du plan pour la section USAGE. N'est il pas plus judicieux de regrouper dans les usages les sections Copyright et Censure développées plus loin, puis dire que certains de ces usages ne sont pas si vertueux et enchainer avec les problèmes juridiques, législatifs développés plus loin dans cet article.--PGY5GIOT (discuter) 4 février 2019 à 14:56 (CET)

--- Société ---[modifier le code]

Ajouter une phrase introductive pour lier les IPP et la société ?

Nowitsover (discuter) 21 janvier 2019 à 15:27 (CET)

Done
Toomai93 (discuter) 21 janvier 2019 à 15:45 (CET)

Marine VS2i (discuter) 30 janvier 2019 à 21:00 (CET)

  • « En effet » virgule à rajouter après
  • « Le IPP » à mettre l’IPP
  • « pose des questions » je remplacerais par « soulève des questions » et mettre « protection » au singulier

--- Juridique ---[modifier le code]

Il manque une brève introduction sur l'impact juridique de l'utilisation de l'IPP.

Nowitsover (discuter) 21 janvier 2019 à 15:31 (CET)

Done
Toomai93 (discuter) 21 janvier 2019 à 15:45 (CET)

Marine VS2i (discuter) 30 janvier 2019 à 21:02 (CET)

Pour la partie Copyright :

  • « L’inspection de paquet profonde » à remplacer par « l’inspection profonde de paquets » pour rester cohérent
  • « Peut être utilisé », utilisée au féminin
  • « l’usage du IPP » à remplacer par «  de l’IPP »
  • La source 33 n’est pas correctement référencée, car directement dans les références et non dans la bibliographie

--- Législation ---[modifier le code]

Je pense que ce serait intéressant d'avoir la législation française sur le IPP.

Nowitsover (discuter) 21 janvier 2019 à 15:43 (CET)

Pour ce point, il était assez diffcile de trouver des sources concordantes à ce sujet. En effet, la loi renseignement de 2015 est assez floue sur l'usage du IPP. Nous pouvons rajouter une section pour expliquer ce flou si tu trouves cela légitime.
Toomai93 (discuter) 21 janvier 2019 à 15:50 (CET)
D'accord, je vous fait confiance sur ce point. Je pense que oui c'est une bonne chose de montrer cette zone de flou, surtout dans un pays qui nous concerne directement.
Nowitsover (discuter) 21 janvier 2019 à 15:55 (CET)

--- Vie privée ---[modifier le code]

Partie un peu légère, on pourrait la mettre en sous partie de juridique, qu'en pensez-vous ? Ne serait-ce pas le même flou que pour la législation française ? Atteinte ou pas à notre vie privée ?

Nowitsover (discuter) 21 janvier 2019 à 16:12 (CET)

--- Censure ---[modifier le code]

Ajouter une brève introduction sur ce en quoi l'IPP peut amener à une censure et qui pourrait appliquer ces censures ?

Nowitsover (discuter) 21 janvier 2019 à 16:14 (CET)

--- FAI ---[modifier le code]

Modifier le titre « Belgique » en Scarlet ? Comme dans cette partie on parle bien des FAI et non des états ? Vous pourriez préciser dans le paragraphe le pays de cet FAI ?

Nowitsover (discuter) 21 janvier 2019 à 16:25 (CET)

Je ne suis pas d'accord avec toi. Scarlet n'est que la FAI à qui on a demandé d'agir et de bloquer, mais elle n'a pas pris cette décision.
IratanRG (discuter) 21 janvier 2019 à 16:35 (CET)
D'accord, on pourrait précisé que l'infraction a pû être identifier grâce à l'IPP si c'est le cas ? Sinon on le comprend plus comme une demande de censure envers un FAI mais sans réel lien avec l'IPP.
Nowitsover (discuter) 21 janvier 2019 à 16:51 (CET)

--PGY5GIOT (discuter) 25 janvier 2019 à 21:15 (CET)== --- AUTOMATE --- FORME ==

--PGY5GIOT (discuter) 23 janvier 2019 à 10:54 (CET):Ces commentaires concernent la forme de la section Automate. La section est bien structurée et rédigée avec clarté.

Attention cependant à l'accord avec le pluriel : "fonction du nombre de condition" "augmentation linéaire du nombre d'état" "une explosion d'état ils ne sont, bien souvent, pas représentable " "Les numéros d'états sont alors remplacé " "pour ceux de type non déterministes"
Bonjour, je corrige ça.
Toomai93 (discuter) 23 janvier 2019 à 17:30 (CET)

--PGY5GIOT (discuter) 24 janvier 2019 à 22:21 (CET)--PGY5GIOT (discuter) 24 janvier 2019 à 22:21 (CET)== --- AUTOMATE ---- CONTENU ==

--PGY5GIOT (discuter) 23 janvier 2019 à 12:05 (CET):mes commentaires concernent le contenu de la section Automate. Je commente d'abord les caractéristiques des automates finis déterministes et non déterministes, puis les optimisations. Petite remarque concernant plutôt la forme: La référence 2 (nombre minimum d'états) pointe sur une ressource (Hazler 2010,p10) pas liée à un document de Bibliographie. Vous pouvez peut-être créer un lien vers l'article Wikipédia "minimisation d'un automate fini déterministe". Les phrases " Les automates non déterministes quant à eux ...." et "Tout automate non déterministe peut être transformé en ....." sont des assertions et pourraient être appuyées par des articles universitaires. De même, le contenu du tableau représentant la complexité et le coût en mémoire. Le lien complexité sur l'article Wikipédia " Analyse de la complexité des algorithmes " est très intéressant, notamment la section "Complexité, comparatif". Cependant, j'ai trouvé un article Wikipédia ( Expression régulière , section "Implémentations et complexité algorithmique" contredisant des valeurs du tableau.

Dernières remarques pour clore la section Automate: la section est bien détaillée et rigoureuse pour explorer toutes les solutions d'optimisation des automates.Peut-être éviter de référencer des ébauches d'article ; les articles "snort" et "bro" référencés sont encore à l'état embryonnaire.Corriger d'autre part la référence 9 "Becchi" mappée avec aucun document de la Bibliographie.

Bonjour, j'ai corrigé la référence cassée.
Pour Snort, je peux lier la page en anglais qui n'est pas détectée comme une ébauche. L'article reste quand même léger. Pour ce qui est de Bro (Zeek sous son nouveau nom) par contre, la page Wikipédia (même en anglais) n'est pas exceptionnelle. Je peux lier au portail web de l'applicatif si cela vous convient. Je ne suis pas sûr que cela apporte beaucoup à la compréhension de l'article par contre. En effet, il suffit juste de savoir qu'il s'agit d'un IDS. Dites-moi ce que vous préférez.
Cordialement, Toomai93 (discuter) 28 janvier 2019 à 10:04 (CET)



* Bonjour, la référence était cassée, je l'ai réparée. J'ajoute aussi un lien vers la page de Wikipedia
* Pour ce qui est des deux phrases, je vais essayer de trouver des sources pour étayer le propos
* Pour ce qui est du tableau, j'ai une source qui dit le contraire. Je ne sais pas si il faut plutôt faire confiance à la page Wikipédia. Je vous fais une référence vers l'article, dites moi ce que vous en pensez.
Toomai93 (discuter) 23 janvier 2019 à 17:47 (CET)
Bonjour, la référence est très bien !
cordialement.

--PGY5GIOT (discuter) 25 janvier 2019 à 21:38 (CET)== -- CONTEXT BASED DPI --- ==


La section est bien rédigée et est également claire.Par contre, peut-être aurait il fallu un autre exemple pour étoffer cette section et ne pas créer de déséquilibre entre les sections trop développées et celles trop peu développées.Dernière remarque : je trouve un peu dommage de référencer des articles pas finalisés (Ipsec de Wikipédia). On a beaucoup d'articles sur Ipsec dans IEEE par exemple.

Pour ce qui est de l'article d'IPsec, nous n'avons fait que bleuir le texte pour que le lecteur puisse avoir une définition basique de ce qu'est IPsec pour qu'il puisse comprendre l'article. Effectivement, la page n'est pas complète mais il faudrait améliore la page d'IPsec avec de meilleures référence pour expliquer ce que c'est plutôt que d'intégrer ça dans notre article.
Bien à vous, IratanRG (discuter) 28 janvier 2019 à 15:36 (CET)


Marine VS2i (discuter) 30 janvier 2019 à 21:03 (CET)

  • « L’inspection de paquet profonde » à remplacer par « l’inspection profonde de paquets » pour rester cohérent
  • « ceux ci » à remplacer par « ceux-ci »
  • « Le IPP » à mettre l’IPP
  • « ambigue » à remplacer par « ambigüe »
  • « Depuis 1996 au Royaume-Uni, l'IWF (Internet Watch Foundation) un organisme fondé par l'Union Européenne et les acteurs de l'Internet a développé », il faut mettre « Depuis 1996 au Royaume-Uni, l'IWF (Internet Watch Foundation), un organisme fondé par l'Union Européenne et les acteurs de l'Internet, a développé » (ajout de virgules)
Bonjour,
Mis à part le problème de "Le IPP" dont j'ai parlé dans les commentaires sur le résumé introductif, les modifications sont faites.
Cordialement,
Toomai93 (discuter) 31 janvier 2019 à 13:04 (CET)

--- MAP REDUCE -- forme[modifier le code]

--PGY5GIOT (discuter) 27 janvier 2019 à 15:52 (CET)La section de MAP REDUCE est bien structurée. ATTENTION cependant aux fautes d'orthographe : "emergeance" "un gros serveurs" " des compromis sont fait" "tolérence aux pannes" "on fini" "de grande quantités" "il choisi" "leurs tailles" "éceuil" "ou N est" "le nombre de collecteur". D'autre part écrire en toute lettre "3 phases" et "4 phases". Cordialement.

--PGY5GIOT (discuter) 4 février 2019 à 14:21 (CET)== --- MAP REDUCE -- contenu ==

--PGY5GIOT (discuter) 27 janvier 2019 à 18:38 (CET)Je n'ai pas vraiment bien compris le fonctionnement de StreamMineg3G, et encore moins en quoi StreamMineg3G apporte des solutions à MapReduce. Le lien vers StreamMineg3G n'est pas très explicite.(StreamMineg3G et non streamine3G) Peut être utiliser le lien "StreamMine3G OneClick -- Deploy and Monitor ESP Applications with a Single Click" de IEEE Explore plus complet.

Bonjour, j'ai modifié un peu le premier paragraphe qui traite de StreamMine3G. J'y ai un peu plus détaillé son fonctionnement ainsi que les avantages qu'il présente par rapport à Hadoop. J'ai aussi ajouté des références vers l'article que vous avez mentionné (Merci d'ailleurs). Je ne sais pas si je dois aller plus en profondeur dans le fonctionnement du framework ? Dites-moi ce que vous en pensez.
Cordialement, Toomai93 (discuter) 28 janvier 2019 à 09:52 (CET)
J'ai bien compris à présent les gains en performance de StreamMine3G. Par contre dans un souci d'allègement du texte sur StreamMine3G, je ne développerais pas les explications sur les phases. D'ailleurs, seule la phase capture a été développée, et je la supprimerais : "la capture des paquets est faite directement sur les liens .......ceux-ci seront présentés en temps réel dans diverses interfaces".--PGY5GIOT (discuter) 29 janvier 2019 à 10:26 (CET)
J'ai fait la modification demandée. Ca ne nuit effectivement pas nécessairement à la compréhension, on perd cependant un peu de détail à propos de la forme d'un enregistrement (llés, une machine est chargée de transformer ces captures en flux analysable par le logiciel. Un enregistrement du flux est composé d'un hash des adresses et ports source et destination, le protocole, la durée du flux, le nombre de paquets, le nombre d'octets dans le flux, les 10 premières charges utiles des paquets). Ca ne gêne pas ?
Cordialement,
Toomai93 (discuter) 29 janvier 2019 à 14:31 (CET)
Aucunement
Cordialement.