Voix sur IP
| Pile de protocoles | |
|
|
| Modèle Internet | |
| Modèle OSI | |
| modifier |
La voix sur IP, ou « VoIP » pour Voice over IP, est une technique qui permet de communiquer par la voix (ou via des flux multimedia : audio ou vidéo) sur des réseaux compatibles IP, qu'il s'agisse de réseaux privés ou d'Internet, filaire (câble/ADSL/optique) ou non (satellite, Wifi, GSM, UMTS ou LTE). Cette technologie est notamment utilisée pour prendre en charge le service de téléphonie sur IP (« ToIP » pour Telephony over Internet Protocol).
Sommaire |
Le transport de la voix[modifier]
Le transport de la voix sur IP est relativement complexe. La première étape est la numérisation du signal acoustique. C'est le codage. Ensuite, les informations sont découpées en trames pouvant circuler sur un réseau informatique. Divers protocoles peuvent alors être utilisés pour acheminer les informations au(x) destinataire(s). Ainsi le protocole RTCP est utilisé pour contrôler le transport des paquets RTP.
Le codage de la voix[modifier]
La voix est ce qui permet aux humains d'échanger de l'information, de communiquer, et de faire passer des émotions. Il s'agit d'un phénomène physique complexe. Lorsque l'on parle, nous produisons un ensemble de sons possédant des niveaux de fréquences différents (grave, médium, aigüe…).
Un son « pur » (diapason) possède une fréquence stable, et se représente par le biais d'une sinusoïde. La voix, quant à elle, produit une multitude de fréquences à des vitesses très variées. Si on affichait la discussion d'une personne grâce à un oscilloscope, cela produirait non pas une sinusoïde mais un signal complexe, composé de plusieurs sinusoïdes de fréquences, d'amplitudes et de phases différentes.
La voix provoque donc une superposition de signaux sinusoïdaux, c'est-à-dire analogiques. Pour l'envoyer sur un réseau TCP/IP (numérique), il va falloir convertir ce signal analogique en un signal numérique en format PCM (Pulse Code Modulation), par exemple à 64 kb/s.
Une fois convertie, la voix, ainsi numérisée, doit être compressée grâce à un codec (Compresseur/Décompresseur) pour l'insérer dans un paquet IP. Le codage doit offrir une qualité de voix la meilleure possible, pour un débit le plus faible possible, et un délai de compression le plus court possible.
Il existe plusieurs techniques de codage, chacune étant mesurée de façon totalement subjective par une masse de population prise au hasard. Elle doit noter chaque codage par un chiffre de 1 à 5 (1 = Insuffisant - 5 = Excellent). Cette technique s'appelle le MOS.
| Nom du Codec | Débit du Codec | MOS du Codec |
|---|---|---|
| G.711 (PCM) | ~64 kb/s | 4.1 |
| G.723.1 | ~6,4 kb/s | 3.9 |
| G.726 | ~32 kb/s | 3.85 |
| G.729 | ~8 kb/s | 3.92 |
Real-time Transport Protocol[modifier]
Real-time Transport Protocol est le protocole basé sur UDP/IP qui permet de transporter la voix sur IP.
Les modes de diffusion[modifier]
Le terme « VoIP » est en général utilisé pour décrire des communications « point à point ». Pour la diffusion de son ou de vidéos sur IP en multipoints, on parlera plutôt de streaming pour une simple diffusion, comme les radios Web par exemple. Le terme multipoints sera réservé à des visioconférences dont le nombre de participants est plus grand que deux.
La voix ou le son sur IP peut se faire en mode Unicast, broadcast ou Multicast sur les réseaux, c'est-à-dire en mode « point à point », en mode « une émission et plusieurs réceptions » (comme un émetteur TV, par exemple) et en mode « une émission pour plusieurs réceptions » (mais le signal n'est routé que s'il y a des récepteurs) comme les radios Web. Le protocole H.323 ne fonctionne qu'en mode Unicast.
Le transport de communication sur IP est très dépendant du délai de latence d'un réseau. Ce délai influe beaucoup sur la qualité psycho-acoustique d'une conversation. Avec l'avènement des réseaux 100 Mbit/s et ADSL, les temps de latence deviennent acceptables pour une utilisation quotidienne de la voix sur IP. À l'inverse, les connexions par liaison satellite souffrent d'un temps de latence souvent trop important pour prendre en charge les applications de voix sur IP. En moyenne, le temps de latence sur ce type de liaison est estimé entre 400 et 800 millisecondes. Une connexion filaire (fibre optique ou cuivre) bénéficie d'un temps de latence de 60 à 200 millisecondes. Plus que la latence, c'est la gigue ((en)jitter) qui pénalise la voix sur IP. En effet, s'il y a des fluctuations du signal en amplitude et fréquence, il faudra un mécanisme de remise en ordre des paquets afin de restituer le message vocal, processus qui se traduira par des blancs et des attentes.
La signalisation[modifier]
Les principaux protocoles utilisés pour l'établissement des connexions en voix sur IP sont :
- H.323 ;
- IAX (Asterisk) ;
- Jingle, fondé sur le protocole de messagerie instantanée standard ouvert Jabber ;
- MGCP ;
- SCCP (propriétaire Cisco Systems) ;
- SIP ;
- UA/NOE (propriétaire Alcatel-Lucent) ;
- UNISTIM (propriétaire Nortel).
Contrainte[modifier]
Perte de paquets (Packet Loss)[modifier]
Lorsqu’il y a saturation, les mémoires tampons ont besoin de libérer une partie de la bande passante, négligeant ainsi certains paquets. Néanmoins, le trafic VoiP est transmis au-dessus de la couche UDP, ce qui implique qu’aucun mécanisme de contrôle de flux ou de retransmission des paquets perdus n'est offert par la couche transport. Cela implique qu’il faut accorder une forte importance aux protocoles RTP et RTCP (Real-Time Transport (Control) Protocol) qui vont permettre de calculer le taux de perte de paquets, et de réagir en conséquence au niveau de la couche applicative.
Latence[modifier]
La latence est le décalage entre le temps écoulé entre l'envoi d'un paquet et sa réception par le destinataire. Plus la latence est importante, plus le transfert est long et sera donc décalé.
Pour garantir une communication optimale, la maîtrise du délai de transmission est un point important afin de réduire l’effet d’écho ou la sensation de voix métallique. Le temps de transmission de paquets dans un réseau de type IP dépend de nombreux éléments tels que :
- Le nombre d’équipements actifs traversés dans le réseau
- Le débit de transit disponible
- Le délai de propagation de l’information
Variation du délai (gigue)[modifier]
La gigue est la variation de délai de transmission de bout en bout entre des paquets appartenant à un même flux de données. Elle est due à la variance du temps de transmission des paquets (en l’occurrence : les échantillons de voix) dans le réseau de télécommunication et peut entrainer, si elle est trop élevée, une détérioration de la qualité vocale. La cause de ce problème peut être due à la différence des chemins empruntés par les paquets dans le réseau, à une congestion ponctuelle du réseau ou encore à un souci d’encapsulation des paquets IP…
Bande passante[modifier]
C'est le terme utilisé pour évoquer le flux de connexion. C'est une unité souvent prise pour une unité de débit, mais elle ne définit en réalité que la plage de fréquence et le débit en dépend, d'où la confusion.
Sécurité[modifier]
La sécurité de la téléphonie est souvent restée un sujet à part dans l’entreprise. Désormais, les risques associés aux systèmes téléphoniques peuvent avoir des conséquences graves sur le système d’information et sur l’entreprise. Par ailleurs, la liste des failles historiques de la téléphonie est toujours d'actualité maintenant qu’elle intègre les standards IP.
VoIPshield Laboratories, une entreprise spécialisée dans la sécurité des systèmes VoIP, a découvert en novembre 2008 une faille de sécurité au sein du protocole RTP[1]. La faille en question n'a pas été présentée en détail mais le laboratoire a annoncé qu'elle permettrait de mener des attaques par déni de services sur les utilisateurs de logiciel utilisant le protocole RTP, soit près de 250 millions d'ordinateurs[2] dans le monde.
Aspect logiciel[modifier]
Avec la banalisation des réseaux haut débit, le nombre d’applications possibles a considérablement augmenté. Les applications de VoIP (Voice over IP) sont une des nouvelles possibilités offertes. L’augmentation des débits et les connexions permanentes offrent des possibilités de développement de la voix sur IP (Internet Protocol).
Le développement de la VoIP a entraîné les concepteurs de plates-formes de programmation à développer des API (Application Programming Interface) spécifiques à la voix sur IP. L’intégration de nouveaux besoins dans une plate-forme de développement permet d’attirer les concepteurs de logiciels qui doivent intégrer des fonctions de voix sur IP dans leurs applications. Elles implémentent le protocole SIP.
Les API de VoIP peuvent être utilisées dans de nombreuses applications, la plus simple étant les téléphones logiciels (soft phones). D’autres applications peuvent intégrer de la VoIP comme besoin secondaire. Par exemple les applications de messagerie instantanée qui intègrent de plus en plus souvent la possibilité de parler directement avec ses contacts ou bien toutes les applications nécessitant une interaction textuelle entre les différentes applications clientes comme les jeux vidéo.
Logiciels de voix sur IP[modifier]
Plusieurs solutions existent pour faire de la Voix sur IP. Soit des solutions avec logiciels propriétaire et une infrastructure à base de serveur d'un fournisseur de services comme Skype ou Yahoo! Messenger. D'autre solutions telles que NetMeeting ou KPhone, peuvent fonctionner dans un réseau d'égal à égal ou s'interconnecter via des protocoles standards à une infrastructure de téléphonie indépendante. Enfin, certains constructeurs proposent des solutions de PABX IP comme Aastra, Cisco, Alcatel, Wildix, Sipleo[3] ou la solution libre Asterisk.
Les paramètres nécessaires sont ceux :
- du propriétaire de réseau : nom, mot de passe, N° de tel, nom APN ( mobile)
- du service Voip : nom, mot de passe, ip/FQNDN domain, stun server, outBoound Proxy
Matériel[modifier]
On trouve de plus en plus de matériel directement compatibles VoIP par exemple des téléphones Wi-Fi tout en un, ou bien des passerelles VoIP qui permettent de raccorder un ancien poste de téléphone classique à un service de Voix sur IP. Certains matériels sont liés, dans leur fonctionnement, aux solutions propriétaires comme les téléphones Skype, alors que d'autres sont fondées sur le protocole ouvert SIP, offrant ainsi une compatibilité avec une variété de services VoIP.
Il existe des cartes d'interface PCI (exemple : Digium) qui permettent aux logiciels PBX (tels qu'Asterisk) de se raccorder à une ou plusieurs lignes analogiques (classiques). Pour une meilleure compatibilité VoIP, celles-ci doivent respecter les normes TIA/EIA, ISO/IEC ou Cenelec du câblage informatique Ortronics en fibre optique ou cuivre.
IPv6[modifier]
La Voix sur IP devrait être améliorée par le protocole IPv6 lorsqu'il sera généralisé. La qualité de service intégrée dans sa conception permet de gérer indépendamment divers flux tels que la voix[4], la navigation internet (dont téléchargements qui accaparent grandement la bande passante).
De cette manière, la qualité de la voix devrait être de qualité optimum et constante.
Notes et références[modifier]
Voir aussi[modifier]
Articles connexes[modifier]
- Centrex IP
- Fax over IP
- VoIP mobile
- Qualité de service
- Sécurité des systèmes téléphoniques
- Visiophonie
