
Abandonnant les anciens systèmes de réponse automatique rigides et peu intelligents, de nombreuses entreprises adoptent désormais des solutions d’IA capables de mener des conversations fluides, de comprendre le contexte et de répondre rapidement. Le résultat ? Une efficacité accrue, des coûts réduits et potentiellement une meilleure expérience utilisateur.
De l’assistance au commerce : l’essor de l’IA vocale
Parmi les pionniers de cette adoption figure eHealth, une place de marché d’assurance qui utilise des agents vocaux IA pour gérer les premières étapes du contact avec les clients, en particulier aux heures d’affluence ou en dehors des heures de bureau. « Avec l’évolution de la technologie, nous avons réalisé que ces voix artificielles devenaient incroyablement similaires à celles des humains », explique Ketan Babaria, directeur numérique chez eHealth. « Nos clients ont désormais du mal à distinguer l’agent virtuel d’un agent réel ».
Selon Tom Coshow, analyste chez Gartner, le saut technologique s’est produit plus rapidement que prévu : « Nous avons des agents vocaux IA qui peuvent s’interrompre, faire des suggestions logiques et parler sans délai perceptible. Je pensais que nous y serions dans deux ans ».
Cette tendance est soutenue par une vague d’investissements : selon CB Insights, les financements accordés aux start-ups du secteur de l’IA vocale sont passés de 315 millions de dollars en 2022 à plus de 2,1 milliards en 2024. Selon les estimations de Gartner, d’ici 2028, 75 % des nouveaux centres d’appels intégreront des capacités génératives, vocales ou textuelles.
Les acteurs de l’innovation
Parmi les protagonistes de la nouvelle ère de l’IA vocale, on trouve des laboratoires tels que OpenAI, avec son modèle vocal GPT-4o et son système de transcription Whisper, et des entreprises émergentes telles que Anthropic, Deepgram, Assembly AI, ElevenLabs et Cartesia, qui ont affiné la qualité et le naturel des voix synthétiques.
Mike Droesch, partenaire chez Bessemer Venture Partners, souligne que les nouveaux modèles couvrent un éventail linguistique plus large que les anciens IVR (Interactive Voice Response), qui échouaient souvent à comprendre l’intention des utilisateurs. Certains systèmes modernes sont même voice-native, c’est-à-dire qu’ils traitent directement l’audio sans étapes intermédiaires, ce qui augmente la vitesse et la précision.
L’avenir : réservations et ventes automatisées
La prochaine étape ? Des agents vocaux IA capables d’effectuer des actions complexes par téléphone : réserver des restaurants, conclure des ventes, commander des produits. Mais selon les analystes, la question reste posée pour de nombreuses entreprises : rester fidèle aux fournisseurs traditionnels ou passer aux nouveaux acteurs de l’IA ?
Selon Gartner, la réponse est de commencer à expérimenter dès maintenant. Les progrès sont trop rapides pour être ignorés. Cependant, même dans un avenir automatisé, il y aura toujours une place pour l’interaction humaine, en particulier dans les cas les plus importants ou les plus sensibles. « Ce n’est pas la fin des centres d’appels », conclut M. Coshow, « mais leur profonde refonte ».