Comment les agents vocaux IA se connectent aux numéros de téléphone : trunk SIP et BYOC (2026)
Comment les agents vocaux IA se connectent aux numéros de téléphone : trunk SIP et BYOC (2026)
Les agents vocaux IA sont du logiciel — c'est le trunk SIP qui en fait un service appelable par un client. Voici comment fonctionnent le SIP trunking et le BYOC, et comment placer Bitcall sous votre agent.

Qu'est-ce qu'un trunk SIP pour un agent vocal IA ?
Un trunk SIP est une ligne téléphonique virtuelle qui transite par internet. Il relie une application vocale au PSTN — le réseau téléphonique classique — afin que l'application puisse passer et recevoir des appels vers des numéros ordinaires.
Pour un agent vocal IA, le trunk SIP est ce qui transforme un logiciel en un service que le client peut réellement appeler. L'agent gère la conversation (transcription, raisonnement, parole). Le trunk SIP gère le numéro, l'émission de l'appel et la connexion vers l'opérateur qui achemine finalement l'appel jusqu'à un vrai combiné.
En clair : la plateforme IA est le cerveau ; le trunk SIP est la ligne téléphonique. Les deux sont nécessaires, et ils proviennent généralement de deux entreprises distinctes — la plateforme IA d'un côté, et un opérateur télécom comme Bitcall de l'autre.
Comment un agent vocal IA passe-t-il et reçoit-il des appels ?
Chaque appel téléphonique IA traverse trois couches :
- La couche PSTN / opérateur. Un trunk SIP fourni par un opérateur procure le numéro de téléphone (un DID) et achemine l'appel depuis et vers le réseau téléphonique public.
- La couche média SIP. Un serveur média ou un session border controller (SBC) — intégré à la plateforme IA, ou le vôtre — termine l'appel SIP et transmet l'audio au pipeline IA.
- La couche de traitement IA. La reconnaissance vocale (STT) transforme l'audio entrant en mots, un LLM décide quoi dire, et la synthèse vocale (TTS) reconvertit la réponse en audio, renvoyé sous forme de RTP (le flux média temps réel).
Un appel entrant type ressemble à ceci :
L'appelant compose votre numéro → l'opérateur envoie un SIP INVITE au serveur média de la plateforme IA → l'audio de l'appel circule en RTP vers le moteur STT → la transcription va au LLM → la réponse du LLM va au TTS → cet audio est renvoyé en RTP via l'opérateur jusqu'à l'appelant.
Le trunk SIP est le lien entre la couche 1 et la couche 2. La plateforme IA possède le lien entre la couche 2 et la couche 3. Votre choix d'opérateur, de codec et de routage influence à la fois la qualité de l'appel et la rapidité de réponse de l'agent — c'est pourquoi la couche téléphonie « ennuyeuse » mérite d'être bien réglée.
Qu'est-ce que le BYOC, et pourquoi est-ce important ?
BYOC signifie « bring your own carrier » (apportez votre propre opérateur). Au lieu d'utiliser les numéros et les minutes intégrés à la plateforme IA (souvent revendus par un unique grand fournisseur), le BYOC vous permet de connecter votre propre trunk SIP et vos propres DID à la plateforme.
Les équipes adoptent le BYOC pour quatre raisons concrètes :
- Coût à la minute réduit. La téléphonie intégrée comporte généralement une marge. Connecter directement un opérateur de gros supprime cette couche.
- Meilleure couverture géographique. Votre propre opérateur peut fournir des numéros locaux et une terminaison compétitive dans les régions mal desservies par le fournisseur par défaut de la plateforme.
- Votre propre stock de numéros et caller ID. Vous gardez le contrôle de vos DID et du caller ID affiché sur les appels sortants.
- Relations existantes et contrôle du routage. Si vous achetez déjà des minutes ou des numéros, vous regroupez tout sur un seul réseau.
Le compromis : vous configurez vous-même la connexion — mais sur les grandes plateformes, c'est une procédure courte et bien documentée, présentée plus bas.
Quelles plateformes vocales IA prennent en charge votre propre trunk SIP ?
La plupart le font. Le BYOC est désormais une fonctionnalité standard chez les principales plateformes, même si le mécanisme exact diffère :
| Plateforme | Comment connecter votre propre trunk | Remarques |
|---|---|---|
| Vapi | Un credential byo-sip-trunk plus une ressource byo-phone-number |
Les appels entrants sont routés vers une URI SIP Vapi ; l'auth par identifiant/mot de passe est recommandée plutôt que l'auth IP sur les passerelles partagées |
| Retell AI | SIP trunking personnalisé / élastique | Nécessite généralement une configuration de trunk entrant et sortant distincte |
| Bland AI | Endpoint SIP personnalisé (BYOC) | Demande en général un peu plus de configuration que Retell |
| ElevenLabs (Conversational) | Via une intégration / un SDK Twilio | Le BYOC passe par Twilio |
| LiveKit / Pipecat / Dograh | Vous exploitez vous-même le pont SIP / serveur média | Open-source ; contrôle total, plus de responsabilité |
L'idée clé pour quiconque évalue des fournisseurs : si une plateforme passe des appels, elle vous laisse presque certainement apporter votre propre trunk SIP. C'est la porte d'entrée pour qu'un opérateur comme Bitcall se place sous chacune d'elles.
Quels réglages de trunk SIP comptent vraiment pour la voix IA ?
La voix IA est plus sensible à la couche téléphonie qu'un système téléphonique de bureau classique, car chaque milliseconde supplémentaire et chaque paquet perdu se ressentent dans la conversation. Les réglages les plus importants :
- Utilisez G.711. Il évite le transcodage dans le pipeline audio IA. Transcoder vers ou depuis des codecs compressés ajoute de la latence et peut dégrader la précision de la transcription. N'utilisez Opus ou G.722 que si la plateforme les prend explicitement en charge de bout en bout.
- Gardez un chemin média court. Choisissez un opérateur dont les routes et serveurs média sont raisonnablement proches de l'endroit où la plateforme IA exécute son inférence, pour que le RTP ne fasse pas un détour.
- Timing de paquets standard de 20 ms (ptime). Certaines plateformes prennent en charge 10 ms pour une latence légèrement plus faible — vérifiez leur documentation.
- DTMF RFC 2833 (hors bande). Nécessaire pour la navigation IVR à touches. Le DTMF en bande ne survit pas proprement à un pipeline audio IA.
- SRTP pour le média chiffré, que de nombreuses plateformes IA attendent.
- Concurrence élastique. Les campagnes IA connaissent des pics. L'opérateur doit gérer de nombreux appels simultanés sans bridage.
C'est précisément la couche que la plupart des documentations de plateformes IA survolent — et précisément là où l'expertise d'un opérateur télécom fait la différence.
Pourquoi les appels vocaux IA coupent-ils après environ 30 secondes ?
Réponse directe : la cause la plus fréquente est un timeout d'inactivité RTP pendant les silences de « réflexion » de l'agent. Pendant que l'IA génère sa réponse, aucun audio n'est parfois envoyé un court instant. Si rien ne circule, un équipement intermédiaire — un SBC, un pinhole NAT ou un proxy RTP — peut juger le flux média mort et raccrocher l'appel, souvent autour de la barre des 30–60 secondes.
Le correctif comporte trois volets :
- Activez les keepalives RTP ou la génération de bruit de confort pour qu'un flux de bas niveau continue à circuler pendant le silence.
- Augmentez le timeout d'inactivité RTP sur votre serveur média ou PBX à au moins 60 secondes.
- Vérifiez les problèmes de NAT sur le chemin média — assurez-vous que le SDP annonce une IP publique joignable, et non une IP privée, et que votre pare-feu autorise la plage de ports RTP/UDP.
Un problème voisin est « l'appel se connecte mais l'agent ne répond jamais », ce qui correspond presque toujours à un RTP qui n'atteint pas du tout le serveur média (mauvaise IP dans le SDP, ou plage UDP bloquée).
Quelle latence la couche téléphonie ajoute-t-elle ?
La latence conversationnelle est le temps entre la fin de la phrase de l'appelant et le moment où il entend l'agent commencer à répondre. Une conversation naturelle exige qu'elle reste sous environ 1,5 seconde.
L'important est de comprendre où passe le temps. La couche IA domine le budget ; la couche téléphonie ne devrait en représenter qu'une petite part :
| Couche | Contribution approximative | Ce qui la contrôle |
|---|---|---|
| Réseau SIP / RTP + timing des paquets + codec | moins de ~100 ms au total | proximité de l'opérateur avec l'IA, ptime 20 ms, G.711 (sans transcodage) |
| Reconnaissance vocale (fin d'énoncé) | ~100–300 ms | STT en streaming, bonne détection d'activité vocale |
| LLM (premier token) | ~200–800 ms | modèles plus petits/rapides, sortie en streaming |
| Synthèse vocale (premier audio) | ~50–200 ms | TTS en streaming |
À retenir : on ne corrige pas un LLM lent avec un meilleur trunk SIP — mais un opérateur mal choisi (routes longues, transcodage forcé, pertes de paquets) peut tout à fait ajouter un délai évitable et nuire à la précision de la transcription. Ramenez la couche téléphonie à son plancher d'environ 100 ms et laissez la couche IA faire le reste.
Comment connecter Bitcall à un agent vocal IA ?
Bitcall est la couche opérateur sortante qui se place sous votre agent IA — le trunk SIP, le routage et le caller ID via lesquels votre agent compose. Votre plateforme d'agent gère la conversation ; Bitcall achemine l'appel sortant vers le réseau téléphonique.
Dans les grandes lignes, connecter Bitcall à n'importe quelle plateforme vocale IA revient à :
- Créer un compte SIP dans Bitcall pour obtenir vos identifiants SIP.
- Pointer le trunk SIP BYO/personnalisé de la plateforme vers Bitcall : passerelle
gateway.bitcall.io, port5060, avec votre nom d'utilisateur et mot de passe SIP. L'auth par identifiant/mot de passe est la méthode recommandée pour les plateformes IA dont la signalisation provient de serveurs partagés. - Définir le caller ID (CLI) que votre agent présente sur les appels sortants, et l'enregistrer comme numéro sortant sur la plateforme.
- (Facultatif) Valider vos listes d'appel avec le HLR Lookup avant une campagne, pour ne pas payer à composer des numéros morts ou portés.
- Recharger et passer un appel sortant de test.
Périmètre aujourd'hui : Bitcall alimente actuellement le côté sortant — origination, routage et caller ID. Les appels entrants et vos propres numéros virtuels (DID) sont sur la feuille de route, et ce guide sera mis à jour lorsque l'entrant sera disponible.
Pourquoi les équipes placent Bitcall sous leur agent vocal :
- Terminaison A-Z dès 0,01 $/min avec facturation à la seconde vers plus de 195 pays — y compris des routes CLI/NCLI solides en Afrique, au Moyen-Orient, en Asie et en Europe.
- Sans contrat, sans minimum mensuel, et recharges prépayées par carte, PayPal ou crypto (Bitcoin, USDT, ETH).
- Natif SIP avec SRTP et TLS, ce qu'attendent les plateformes IA.
- Contrôle du caller ID (CLI) et validation des numéros par HLR pour des campagnes sortantes propres et efficaces.
- Conçu pour le sortant à fort volume — concurrence élastique et routes optimisées pour le trafic de centres d'appels et de campagnes.
Questions fréquentes
Les agents vocaux IA sont-ils livrés avec un numéro de téléphone ? La plupart proposent un numéro intégré pour démarrer, mais il est généralement revendu avec une marge. En production — surtout à l'international ou à fort volume — les équipes connectent leur propre trunk SIP et leurs DID (BYOC) pour maîtriser coût, couverture et caller ID.
Puis-je utiliser mon propre opérateur avec Vapi ou Retell ? Oui. Vapi prend en charge un « BYO SIP trunk » personnalisé, et Retell prend en charge le SIP trunking personnalisé/élastique. Les deux permettent de connecter un opérateur comme Bitcall au lieu de leur téléphonie par défaut.
Quel codec utiliser pour un agent vocal IA ? G.711, dans la quasi-totalité des cas. Il évite le transcodage dans le pipeline audio, ce qui réduit la latence et protège la précision de la transcription. Ne passez à Opus ou G.722 que si la plateforme le prend en charge de bout en bout.
Pourquoi mon agent IA se connecte-t-il mais ne répond-il jamais ? L'audio de l'appel (RTP) n'atteint pas le serveur média IA. Les causes habituelles : une IP privée annoncée dans le SDP, ou un pare-feu bloquant la plage de ports RTP/UDP. Corrigez le chemin média et l'agent entendra l'appelant.
Apporter son propre trunk SIP est-il réellement moins cher que les numéros de la plateforme ? Souvent, oui — les minutes intégrées incluent généralement une marge sur la terminaison de gros. Les économies augmentent avec le volume, et le BYOC débloque aussi de meilleurs tarifs internationaux et votre propre caller ID.
Ressources associées
Centre d'aide Bitcall :
- Configurer votre premier compte SIP
- IP de confiance vs identifiants SIP : quelle différence ?
- Modifier ou gérer votre caller ID (CLI)
- Configurer Bitcall sur 3CX (mode Trunk)
- Qu'est-ce que Bitcall et comment ça marche ?
Guides Bitcall + voix IA :
Appels sortants Vapi : comment utiliser votre propre trunk SIP (et pourquoi)
Pas d'article suivant
Related posts
Appels sortants Vapi : comment utiliser votre propre trunk SIP (et pourquoi)
Meilleurs fournisseurs de trunk SIP sortant pour agents vocaux IA (2026)
Appels sortants Retell : comment utiliser votre propre trunk SIP (et pourquoi)
Sur cette page
Qu'est-ce qu'un trunk SIP pour un agent vocal IA ?
Comment un agent vocal IA passe-t-il et reçoit-il des appels ?
Qu'est-ce que le BYOC, et pourquoi est-ce important ?
Quelles plateformes vocales IA prennent en charge votre propre trunk SIP ?
Quels réglages de trunk SIP comptent vraiment pour la voix IA ?
Pourquoi les appels vocaux IA coupent-ils après environ 30 secondes ?
Quelle latence la couche téléphonie ajoute-t-elle ?
Comment connecter Bitcall à un agent vocal IA ?
Questions fréquentes
Ressources associées
Bitcall Team
authorBesoin d’aide supplémentaire ?
Vous ne trouvez pas ce que vous cherchez ? Notre équipe support est là pour vous aider.
Contactez-nous