Sommaire
Bon, on le sait tous, ChatGPT c’est la star en ce moment ! Mais savez-vous comment ses voix ont été choisies ? (Spoiler : ça n’a pas été une mince affaire). OpenAI, la société à l’origine de ce phénomène d’intelligence artificielle, a dû passer au crible des centaines de candidatures pour trouver les perles rares qui donneraient vie à son assistant virtuel.
Les critères de sélection : la quête du graal vocal
Eh oui, lancer un nouveau produit, surtout dans le domaine de l’IA, c’est un sacré défi ! Pour ChatGPT, OpenAI a défini une série de critères très précis pour trouver les voix parfaites :
- Des acteurs d’origines diverses ou capables de parler plusieurs langues (histoire d’avoir un beau panel)
- Une voix qui semble intemporelle (on n’a pas envie qu’elle ait un son « années 80 »)
- Une voix accessible qui inspire la confiance (parce qu’on ne rigole pas avec l’IA)
- Une voix chaleureuse, engageante, charismatique, avec un ton riche (bref, le jackpot vocal)
- Une voix naturelle et facile à écouter (qui n’a pas envie de se faire mal aux oreilles ?)
Autant dire que la barre était haute ! Mais OpenAI était déterminée à trouver les candidats idéaux pour incarner ChatGPT.
L’appel à talents : plus de 400 candidatures pour 5 voix seulement
En mai 2023, l’agence de casting et les directeurs de casting d’OpenAI ont lancé un véritable appel à talents. Et le moins qu’on puisse dire, c’est que ça a été un succès ! En moins d’une semaine, ils ont reçu plus de 400 candidatures d’acteurs et de comédiens.
En mai 2023, l’agence de casting et les directeurs de casting d’OpenAI ont lancé un appel à talents. En moins d’une semaine, ils ont reçu plus de 400 candidatures d’acteurs et de comédiens.
Pour l’audition, les acteurs ont reçu un script de réponses ChatGPT et ont été invités à les enregistrer. Ces échantillons allaient de la réponse à des questions sur la pleine conscience au brainstorming sur des projets de voyage, en passant par des conversations sur la journée d’un utilisateur.
Le processus de sélection : de 400 à 14, puis aux 5 voix finales
Jusqu’en mai 2023, l’équipe de casting a examiné et sélectionné de manière indépendante une liste initiale de 14 acteurs. Ils ont encore affiné leur liste avant de présenter à OpenAI leurs meilleures voix pour le projet. OpenAI, quant à elle, a parlé avec chaque acteur de la vision des interactions vocales entre l’homme et l’IA, des capacités de la technologie, de ses limites et des risques encourus, ainsi que des mesures de protection mises en œuvre. Il était primordial que chaque acteur comprenne la portée et les intentions de Voice Mode avant de s’engager.
Une équipe interne à OpenAI a ensuite examiné les voix du point de vue du produit et de la recherche. Et après un examen approfondi, les voix de Breeze, Cove, Ember, Juniper et Sky ont finalement été sélectionnées (eh oui, ce sont les petits noms officiels des voix de ChatGPT !)
Les sessions d’enregistrement et les réunions en personne
Mais le travail ne s’arrêtait pas là ! En juin et juillet, OpenAI a envoyé les acteurs en avion à San Francisco pour des sessions d’enregistrement et des réunions en personne avec les équipes de produits et de recherche.
En juin et juillet, OpenAI a envoyé les acteurs en avion à San Francisco pour des sessions d’enregistrement et des réunions en personne avec les équipes de produits et de recherche d’OpenAI.
Pfiou, ça fait beaucoup de va-et-vient ! Mais c’était nécessaire pour s’assurer que les voix soient parfaitement intégrées à ChatGPT. L’ensemble de ce processus a nécessité une coordination poussée avec les acteurs et l’équipe de casting, sur une période de cinq mois.
Le lancement des voix dans ChatGPT
Après tout ce travail, le grand jour est enfin arrivé : le 25 septembre 2023, OpenAI a lancé les voix de Breeze, Cove, Ember, Juniper et Sky dans ChatGPT. Vous pouvez désormais choisir la voix qui vous convient le mieux pour interagir avec l’assistant virtuel (perso, j’ai un petit faible pour Juniper).
Les futures options vocales dans ChatGPT
Mais ce n’est pas fini ! OpenAI continue de collaborer avec les acteurs, qui ont contribué à un travail supplémentaire pour la recherche audio et les nouvelles capacités vocales dans GPT-4o. L’entreprise prévoit d’ailleurs de donner accès à un nouveau mode vocal pour GPT-4o en alpha aux utilisateurs de ChatGPT Plus dans les semaines à venir.
Avec GPT-4o, l’utilisation de la voix de l’utilisateur pour interagir avec ChatGPT sera beaucoup plus naturelle. Ce modèle gère les interruptions en douceur, s’adapte au ton, filtre les bruits de fond et gère efficacement les conversations de groupe. À l’avenir, les clients d’OpenAI peuvent s’attendre à encore plus d’options vocales, car l’entreprise prévoit d’introduire d’autres voix dans ChatGPT afin de mieux correspondre aux divers intérêts et préférences des utilisateurs.
Résumé / TL;DR
- OpenAI a lancé un appel à talents pour trouver les voix de ChatGPT, recevant plus de 400 candidatures
- Les critères de sélection étaient très précis : voix diversifiées, intemporelles, inspirant la confiance, chaleureuses et naturelles
- Après un processus de sélection rigoureux, 5 voix ont été retenues : Breeze, Cove, Ember, Juniper et Sky
- Les acteurs ont participé à des sessions d’enregistrement et des réunions en personne avec OpenAI
- Les voix ont été lancées dans ChatGPT le 25 septembre 2023, avec d’autres options vocales à venir