La voix sur réseau IP, ou « VoIP » pour Voice over Internet Protocol, est une technique qui permet de communiquer par la voix via l'Internet ou tout autre réseau acceptant le protocole TCP/IP. Cette technologie est notamment utilisée pour supporter le service de téléphonie IP (« ToIP » pour Telephony over Internet Protocol).
Schématiquement, le transport de la voix se fait ainsi. Le codec audio de l'émetteur numérise et compresse la voix, ces données numériques sont acheminées jusqu'au destinataire dans des paquets IP. Le codec du destinataire effectue les opérations inverses (décompression, puis restitution du son).
Pour assurer une certaine qualité à la voix, il y a plusieurs facteurs à considérer. Par convention, l'information voyage dans des datagrammes UDP (on ne parle en effet de paquet qu'après encapsulation IP), un protocole qui ne garantit pas la livraison, en échange de moins de traitement tout au long de son voyage sur le réseau. Selon les conditions du réseau, engorgement surtout, certains datagrammes UDP sont détruits. Le protocole UDP n'effectuant aucune vérification concernant la perte de paquets, les informations liées à ces datagrammes sont perdues puisqu'ils ne sont pas retransmis.
La numérisation est un processus discret, c'est-à-dire que plusieurs fréquences contenues dans la voix ne sont pas numérisées ni restituées, ce qui amène une perte d'information. Il est possible d'augmenter la qualité de la voix, mais au prix de demander plus de bande passante. Pour la voix, sans compression, la bande passante est de 64 kbps (codec G711), il existe de nombreux autres codecs dont le G729 moins consommateur et dernièrement des normalisations autour de codecs larges bandes comme G729-EV, permettant d'améliorer sensiblement la qualité vocale des communications.
Pour des raisons techniques, le phénomène d'écho est, à degré variable, omniprésent dans ce type de communication. Les logiciels qui compensent cet effet sont souvent propriétaires. Supposons que l'appareil A utilise le logiciel A et que l'appareil B utilise le logiciel B. Les deux logiciels risquent de traiter l'écho de façon légèrement différente, ce qui amène des effets de bord non contrôlés. Par exemple, des sifflements se font entendre pendant la communication. Finalement, la latence variable du réseau Internet fait que les données voyagent plus ou moins vite. Alors que cette variabilité est acceptable pour des données, elle ne l'est pas pour la voix, phénomène physique qui demande une certaine continuité pour que les gens puissent se comprendre.
La transmission des fax et les services d'urgence (112, 18, 17, 911,…) sont aussi des défis importants à résoudre pour la téléphonie IP dite grand public. En effet, l'utilisation d'adresse IP est relativement indépendante de la localisation de l'utilisateur (contrairement à l'utilisation d'une ligne de cuivre traditionnelle qui identifie formellement la localisation de l'usager), ce qui complexifie le routage des appels vers le service d'urgence le plus proche.
En dehors de la VoIP sur Internet, la VoIP se retrouve aussi dans le milieu opérateur en cœur de réseau pour remplacer les infrastructures TDM traditionnelles. On trouve principalement 2 usages résidentiels opérateurs :
* l'utilisation de call server IP et de passerelle VoIP résidentielles (Livebox, Freebox, ClubBox, Wenbox, Annabox,…) pour utiliser l'ADSL pour transporter la voix plutôt que la bande basse de la ligne analogique
* l'utilisation de call server IP et passerelles voix dans les DSLAM qui permettent de faire de la voix sur IP à partir d'un téléphone traditionnel et de manière transparente pour l'utilisateur.
Ces évolutions d'usages amènent les grands opérateurs à revoir leurs infrastructures cœur pour le traitement d'appel. Les normalisations européennes ETSI normalisent pour ces usages TISPAN qui instancie et fédère les normalisations 3GPP IMS pour un usage convergent fixe mobile sur IP.