Lorsque le transport des signaux de parole passe de la commutation de circuits à la commutation par paquets, il est indispensable de respecter les critères de qualité du service vocal. Pour résoudre les problèmes complexes posés par cette transformation, les structures de réseau doivent évoluer vers celles du NGN, apportant également de grands avantages économiques.
I – Principe de VoIP
Le principe de VoIP repose sur la numérisation des signaux vocaux et sur le transport de ceux-ci en mode paquets. La transformation des fréquences vocales en une suite convenue de 0 et de 1 doit en principe épargner des ressources dans le réseau et, en groupant les appels de même direction dans des canaux utilisant le protocole Internet (sur Internet ou sur canaux réservés en dehors d’Internet), la mise en paquets devrait être efficace et économique.
Pour assurer toutes les connexions demandées, il va de soi que tout appel en VoIP, filaire ou radio, doit pouvoir atteindre un abonné quelconque, VoIP ou non, de type filaire ou radio. Des passerelles de transformations de signaux vocaux sont donc nécessaires dans tous les réseaux, ainsi que pour toutes les signalisations les plus indispensables (ce qui reste encore à mettre au point pour assurer une bonne qualité de service ou une qualité jugée acceptable).
II – Les aspects techniques
2.1 - Codeurs de signaux vocaux
L’histoire récente du numérique a mis en place chez les exploitants et dans les entreprises des codeurs de signaux de parole de type très hétérogène. Les vendeurs de plateforme et de passerelle VoIP ne s’embarrassent pas à prendre en compte tous les codages vocaux normalisés ou de type propriétaire. Ils se limitent à deux ou trois types de codeur (dont le G.711 du MIC) qui fournit un débit à 64 ou 56 kbit/s, les autres étant des codeurs à bas débit. Or, si dans la chaîne de transmission, le couple codeur décodeur n’est pas parfaitement appairé, la dégradation est certaine et des retards sont introduits en transmission. Si, au cours du trajet, les paquets de parole subissent plusieurs transformations de ce genre avec de codeurs décodeurs non appairés, la dégradation s’aggrave encore. Si l’on veut réduire le nombre de type de codeurs, il serait préférable, pour maintenir une bonne qualité vocale en VoIP, de s’en tenir aux codeurs de voix de type G.711 (64 kbit/s), G.726 (13 kbit/s), G.728 (16 kbit/s) ou G.729 (8 kbit/s). Il est clair qu’un codage optimisé permettrait de réduire le débit d’un facteur qui peut atteindre une valeur comprise entre 8 ou 16 (d’où l’intérêt économique sur les grands axes de transport). Dans la réalité, l’optimum consiste sans doute à coder la voix à 32 kbit/s et de rajouter des informations de façon à obtenir un débit de paquets "voix" à 40 kbit/s maximum environ.
2.2 - Suppression des silences
Lorsque l’on doit acheminer un grand nombre de communications, on peut utiliser les temps morts de l’expression vocale pour glisser des éléments d’autres conversations. Il suffit de placer un détecteur d’activité vocale (VAD, Voice Activity Detector) sur chaque circuit d’entrée et de commuter convenablement les supports à grande distance pour gagner un facteur de l’ordre de 2 en transmission. En réception, il est nécessaire de restituer un silence de confort au destinataire afin de lui donner une sensation de "présence lointaine" de son homologue. Les bruits multiples de coupure occasionnés à ce propos en VoIP justifient de demander aux codeurs à bas débit de gérer cette situation, comme le font déjà ceux qui répondent aux normes G.726 et G.729E. La suppression des silences et le traitement des signaux rajoutent aux avantages économiques du codage un facteur théorique compris entre 2 et 4.
2.3 - Pertes de paquets
Indéniablement, avec l’emploi du protocole UDP qui ne garantit pas la livraison des paquets, des pertes de paquets sont possibles. Au dessus de 5 % de perte, on constate en effet une dégradation inacceptable de la qualité de service de VoIP. Les études montrent que la distribution dans le temps de ces pertes de paquets joue un effet essentiel. Avec des codeurs de parole type G.711 (à 64 kbit/s, un paquet dure 20 ms) des pertes de paquets inférieures à 1 ou 2 % permettraient de délivrer une qualité de service égale à celle du téléphone classique. A 5 %, des rafales de pertes de paquets rendent l’écoute incompréhensible. Ces valeurs concernent des équipements en bon état et un écoulement de trafic raisonnable.
2.4 - Temps de propagation
Depuis l’édification des premières liaisons internationales, il est apparu nécessaire de limiter le temps alloué aux signaux pour la traversée des équipements. La recommandation G.114 de l’UIT-T stipule que le temps maximum du parcours des signaux vocaux entre deux correspondants distants de 27 500 km doit être inférieur à 150 ms afin de ne pas gêner l’échange conversationnel. Les promoteurs de la VoIP ont cherché à contester ce critère, voire à casser le thermomètre, car les codeurs, la mise en paquets et le traitement de l’information dans le réseau lui-même allongent le temps total de propagation. Aussi, il est espéré que la clientèle de VoIP s’adaptera à la nouvelle technologie et prendra en compte cette caractéristique de l’allongement du temps de propagation qui porte celui-ci à une valeur comprise entre 150 et 200 ms.
2.5 - Echos
Le phénomène d’écho est désagréable, car le locuteur s’entend parler avec un décalage dans le temps qui ressemble à un écho. Ceci peut l’interrompre ou le faire bégayer. Aux interfaces entre réseaux hétérogènes, les exploitants de réseau ont coutume de placer des suppresseurs d’écho (SE). Ces derniers équipements (répondant à la norme G.168 de l’UIT-T) sont utilisés sur les liaisons satellites, les câbles sous marins et les réseaux de téléphonie mobile connectés au réseau général. Il n’est pas facile de régler le problème d’écho en VoIP avec des suppresseurs d’écho classiques. De nombreuses expérimentations ont été faites sur différents supports (en DSL, sur réseau câblé, etc.), car la nature du support introduit un écho complémentaire différent et il semblerait qu’en réglant en terminal le SE type G.168 à 8 ms (ou à 16 ms), le phénomène d’écho soit minimisé. Il va de soi que des réseaux hétérogènes présentent des interfaces générant des échos (cas d’un réseau Wi-Fi, connecté à un réseau WiMAX, lui-même connecté à une liaison d’accès ADSL, etc.). La mise en cascade de suppresseurs d’écho peut rendre une communication inaudible.
2.6 - Variation du temps de propagation (gigue)
En commutation de circuits, le temps de transmission entre deux points du réseau ne change pas au cours d’une conversation. En commutation de paquets, ce temps varie puisque les paquets utilisent le parcours qu’ils trouvent et que des congestions peuvent retarder par moment le flux reçu. La gigue peut aussi varier avec la taille des mémoires tampons disposées sur le parcours. Jusqu’ici, on observe que dans les réseaux d’entreprise en IP la gigue est inférieure à 10 ms. Il est clair que l’emploi de protocoles de réseau (type MPLS, ou qualité temps réel) et de liens privilégiés devrait entraîner une réduction de la valeur de gigue. La mise en tandem de plusieurs réseaux, au contraire, aggrave les choses.
III - L’architecture de VoIP
Le Réseau d’accès assure la connectivité entre les équipements situés chez l’utilisateur et les passerelles d’accès du fournisseur d’accès.
La Passerelle d’accès (AG) est située dans le réseau du fournisseur d’accès. Elle assure l’interface du côté ligne vers le réseau central IP. Elle gère les paquets et assure le contrôle de l’écho.
La Passerelle à grande distance (TG) effectue l’interface à grande distance ver le RTPC et à l’occasion dirige les flux IP vers le réseau de paquets. Elle effectue la conversion circuits paquets et la gestion et la commutation des paquets à grande distance.
L’Agent d’Appel (CA) est situé chez le réseau du fournisseur de service et fournit les fonctions logiques d’appel et de supervision des liaisons établies. La plupart des Agents d’appel ont aussi un rôle avec les serveurs d’application pour fournir des connexions qui ne sont pas hébergées sur le serveur. Les agents d’appels sont aussi appelés "Softswitches", contrôleurs d’appel, MGC (Media Gateway Controlers).
La Passerelle de Signalisation (SG) fournit l’interface de signalisation entre le réseau IP et le réseau de signalisation du RTPC. Elle coordonne les liaisons en signalisation N°7 et fournit les fonctions MTP (Message Transport Part) niveau 1 et 2. Les SG travaillent avec leur CA associé pour la supervision des connexions établies.
Architecture VoIP
Le Serveur de média (MS) est situé dans le réseau du fournisseur de service et utilise un protocole de commande comme H.248 ou MGCP, sous le contrôle du CA ou le serveur d’application, afin de fournir les réponses ou tonalités attendues par l’utilisateur et rassembler ses informations.
Le Serveur d’application (AS) est situé dans le réseau du fournisseur de services et fournit la logique de service pour les applications ou les services qui ne sont pas hébergées sur le CA. Le CA achemine les demandes vers les serveurs d’applications concernés qui sont extérieures au CA.
Les communications unifiées (UC), ou "services enrichis", sont assurées sur des liaisons en protocole IP, coordonnées par une signalisation à distance appelée "SIP Trunking", qui traverse des autocommutateurs privés IP-PBX. Parmi les applications offertes dans le cadre du travail collaboratif figurent un certain nombre d’options très appréciées dans le monde de l’entreprise. Les applications UC impliquent que la voix compressée sur protocole IP (VoIP) soit transportée à distance avec un protocole de signalisation SIP unique (SIP Trunking). La diversité des réalisations des autocommutateurs (IP-BX), des protocoles SIP et du "SIP Trunking" explique la déception des entreprises face à la mauvaise qualité des applications UC. Un "SIP Trunking" efficace nécessite une collaboration plus étroite entre industriels et exploitants.
Les offres en UC sont disponibles sur le plan commercial, bien que non normalisées encore. Au titre des UC, sont fournies à distance des applications de communication, messagerie vocale, messagerie électronique, visioconférence, télécopie, conférence à trois, transfert d’appel, signalisation DTMF, etc. Sur le plan des objectifs de qualité de service (SLA, Service Level Agreement) de chacune des applications proposées, les variantes sont aussi nombreuses que l’éventail des prix est ouvert. Néanmoins, le marché des UC est très actif et il semble que cette activité devrait se stabiliser autour de normes et de paramètres mieux définis autour de 2012.
Le protocole de télécopie T.30 qui a été mis en place dans les années 1980 ne fonctionne pas de façon satisfaisante sur les liaisons VoIP et, pour cette raison, la télécopie doit être exploitée selon le protocole T.38 jusqu’à son point de terminaison en rapport avec le SIP Trunking.
IV - Qualité de service globale de VoIP
Depuis sa première apparition, en 1995, VoIP a évolué et connaît aujourd’hui plus de 400 compétiteurs qui offrent cette application aux Etats-Unis sous des formes différentes. On peut distinguer deux grandes catégories de VoIP, l’une qui est fournie par des exploitants de réseau et qui utilise la signalisation numéro 7 et le protocole SIP dans l’une de ses versions actuelles, et la seconde qui résulte de logiciels propriétaires associés à des connexions de réseau en Peer-to-Peer (P2P). La première catégorie de prestations devrait s’améliorer dans le temps. Le nombre de variantes témoigne du dynamisme de la technologie contemporaine.
Les observations faites en matière de qualité de service sur les réseaux IP montrent que l’application VoIP est sensible à l’appariement des couples codeurs décodeurs, à la perte de paquets qu’il convient de réduire en dessous de 1 % et au temps de propagation qui doit rester inférieur à 200 ms. L’écho et la modélisation des réseaux IP demeurent encore du domaine des études futures.
V – Mythologie de VoIP
Gratuité : VoIP suppose un accès numérique au réseau d’un exploitant et une entrée chez un fournisseur de service de la Toile. Des équipements spécifiques sont nécessaires (microphone sur une clé USB de l’ordinateur, ou un terminal téléphonique spécifique, ou un adaptateur sur réseau Ethernet). En entreprise, le coût est estimé entre 200 et 400 dollars par employé. Les coûts d’usage en VoIP sont pratiquement au niveau du coût des appels locaux pour le trafic national et à la moitié des tarifs usuels pour l’international. En gros, la tarification VoIP est intéressante pour l’usager au dessus d’un volume de trafic de l’ordre de 400 minutes par mois. Pour les exploitants, la commutation en IP est très bon marché, mais il reste nécessaire d’assumer un transport des signaux vocaux paquétisés le plus efficace possible.
VoIP peut se substituer au RTPC classique : VoIP est utilisé sur les réseaux mobiles GPRS et 3G, en IEEE802.11, en WiMAX, et récemment en Bluetooth. Il peut aussi être mis en œuvre sur les réseaux filaires, sur les réseaux câblés, mais dans ce cas, l’adressage est celui de l’ordinateur et non pas celui de la ligne fixe. Alors que tous les RTPC sont édifiés de la même façon et ont donc les mêmes caractéristiques, les applications VoIP diffèrent d’un exploitant à l’autre dans leur mise en œuvre et sur le plan de la qualité de service.
VoIP tire profit de la grande disponibilité en débit des réseaux : En fait, VoIP tire profit des performances des processeurs qui participent au traitement de la parole et de la qualité des logiciels disponibles. Dans les années 1970, les ressources de débit en ligne étaient rares et plusieurs solutions ont été proposées pour comprimer les signaux numériques de parole. Trop de solutions concurrentes nuisent à la nécessité des conversions nécessaires à chaque fois que le message vocal doit traverser un nouveau réseau et il faudra un jour réduire le nombre d’options possibles de codage de la parole. Une des difficultés de VoIP est liée à l’encombrement du réseau et à la latence des signaux. Il est important de disposer, dans le réseau d’accès d’un débit suffisant pour utiliser VoIP avec le minimum de contraintes. Si par ailleurs, l’acheminement sur le réseau à grande distance est bloqué, le message vocal ne parviendra pas à destination, sans renvoi d’information de non remise à son expéditeur.
La QoS de VoIP ne peut pas être améliorée : Les exploitants de réseau sont en mesure d’améliorer la QoS de VoIP en fonction des demandes de leurs clients sur les axes désignés. De nouveaux protocoles doivent être encore mis en place (MPLS) pour améliorer la QoS et la normalisation devrait un jour jouer son rôle traditionnel sur ce point. Il faut souligner qu’il existe un grand nombre de façons de réaliser la voix sur IP, en particulier en sélectionnant des supports privilégiés (VPN dédiés) ou, cas extrême, en utilisant un routage propre au réseau (P2P) mais qui n’offre aucune garantie. La façon de réaliser VoIP et l’organisation des supports en transmission conditionnent la QoS de VoIP.
VoIP est un service vocal comme les autres : Actuellement, VoIP demeure encore une application (vocale ou de données, selon les pays) qui n’est pas encore définie comme un "service" sur le plan international. En effet, elle ne permet pas les appels d’urgence (décrits dans la recommandation E.112) qui exigent un traitement prioritaire que IP ne sait pas gérer, ni la localisation des appels (à cause des adresses en IP). Elle pose un gros problème (encore non résolu) de rémunération des exploitants assurant le transit et l’acheminement terminal des appels vers les destinataires. Dans certains pays, pour cette raison, VoIP met en cause la politique de financement des services publics. Mais la Voix sur IP de la 3G est proche de la qualité du RTPC, car elle est assurée sur conduits de type VPN des exploitants de réseau (avec réservation de débits et signalisations spécifiques). Des exploitants peuvent très bien gérer la VoIP comme un service particulier dans un réseau IP conçu à cet effet (accès privilégiés, routage sélectionné, gestion avec d’autres exploitants). Actuellement, il n’existe pas encore de règles communes reconnues sur le plan mondial pour VoIP, mais la question est en étude.
VoIP n’est pas sécurisée : Ce point soulève encore des controverses, car tout dépend de quoi l’on parle. Skype utilise, non sans raison, un protocole AES (Advanced Encryption Standard) avec des clés de cryptage de 256 bits. Des pirates peuvent en effet entrer sur un IP-BX et tout dépend de l’habileté du constructeur à placer des protections. Dans le RTPC, les intrusions de "plombiers étourdis" sur la ligne d’abonnés laissent des traces. Sur Internet, les intrusions laissent peu de traces, en particulier pour ce qui concerne les écoutes passives. Evidemment, les terminaux demandent une alimentation secourue, afin de ne pas être victimes des pannes de secteur, ce qui est aussi vrai aujourd’hui pour toute la péritéléphonie.
Le groupe d’industriels réunis sous le nom de "Voice over IP Security Alliance" a signalé que la multiplication des points d’accès liés à la convergence des réseaux filaires et mobiles introduisait un point faible sur le plan de la sécurité des informations de l’entreprise. Des mesures particulières sont préconisées par les spécialistes en sécurité (voir PortWise 4.0).
La disponibilité, la confidentialité et la permanence des transmissions ne peuvent être garanties que dans la mesure où l’exploitant assure de bout en bout la responsabilité de la transmission (support propriétaire, VPN de l’exploitant, règles de mises en œuvre communes entre exploitants partenaires, etc.). L’ADSL ne dispose pas du même degré de qualité que le réseau RTPC classique. Le protocole IP présente une fragilité intrinsèque du point de vue de la capacité en écoulement du trafic et il ne dispose pas de canaux de signalisation distincts de ceux utilisés pour la transmission de messages.
VoIP demeurera une application spécifique : Il a toujours été très difficile de lancer des pronostics à la cantonade. VoIP rend aujourd’hui de grands services aux entreprises, car cette application peut être couplée à des informations extraites de bases de données (cas des centres d’appel, appelés aussi Centres de contact). Les exploitants attendent les évolutions apportées par les TIC et par les composants qui devraient leur permettre de ne disposer que d’un seul réseau (le NGN) et de réduire ainsi le montant de leurs investissements en transmission et en commutation. Cette évolution a lieu sous le régime de la concurrence, ce qui laisse peu de marges d’erreurs aux exploitants historiques et peu de possibilités d’action aux exploitants de la concurrence. VoIP peut conduire à une mise en œuvre très rapide (et concertée) du NGN, car celui-ci devrait générer immédiatement des économies importantes sur le plan des investissements, la fusion (ou "convergence") des réseaux fixes et mobiles (GSM/GPRS/EDGE/3G/Wi-Fi/WiMAX, etc.) et une très forte réduction des coûts d’exploitation.
VI – Le marché de VoIP
Actuellement, le marché VoIP représenterait près de 50 % du volume de trafic téléphonique fixe et mobile en France (toutes normes confondues). Trente pour cent des entreprises utiliseraient VoIP en 2010, le changement de PBX constituant un obstacle.
Deux marchés principaux sont identifiables aujourd’hui (le cas de la 3G et du LTE mis à part) : celui des résidentiels avec un modèle de terminaison numérique de réseau qui est reconfigurable par logiciel (ou passerelle résidentielle – RG, Residential GateWay - de type "Free-Box" ou "LiveBox" et celui des entreprises, sur liens IP dédiés ou non, notamment pour les Centres d’appels en IP, les IP-BX, la visioconférence ou l’audioconférence, le télétravail, le téléenseignement, etc. VoIP permet un certain nombre d’applications originales, notamment en multimédia (visiophonie) et en mobilité.
Le service Centrex permet en reliant les autocommutateurs d’entreprise (IP-PBX) d’offrir à ces entreprises des applications UC, telles que la télécopie sur IP (avec le protocole T.38) compatible avec tous les télécopieurs du monde externe, ce qui permet de conserver le serveur de télécopie de Groupe IV et de supprimer en interne les télécopieurs classiques.
Le succès actuel de VoIP conduit à accélérer la mise en place du NGN en cherchant des solutions aux critiques portées. Les exploitants sont aujourd’hui aussi motivés dans ce sens que les utilisateurs, la voix sur LTE devant aussi être associée.
Le travail collaboratif ne peut trouver son efficacité avec les communications unifiées que si les facilités liées à ces dernières sont bien définies sur le plan mondial et bien exploitables, à l’intérieur du réseau multisite de l’entreprise et avec les postes de communication externes à celle-ci. Sous tendues par les protocoles IP et SIP, les communications unifiées nécessitent une normalisation plus effective de SIP et des fonctions associées au "SIP Trunking".
Sources : IEEE Communications, IEEE Spectrum, Réunion-débat de l’Irest, etc.
Salon INTERNET WORLD , Du 24 au 26 Avril 2012 à Londres, INTERNET WORLD : l’évènement ... [suite] Séminaire IPv6, Le 11 Avril 2012, à Telecom ParisTech., Le G6 organise un séminaire ... [suite]