AccueilActualités informatiqueIntelligence artificielle : le modèle linguistique GPT-3 disponible sans liste d'attente

Intelligence artificielle : le modèle linguistique GPT-3 disponible sans liste d’attente

La société OpenAI, axée sur l’apprentissage automatique, propose désormais l’accès à son API publique sans liste d’attente. Ainsi, toutes les personnes intéressées par l’interface du modèle linguistique GPT-3 peuvent s’enregistrer, à condition qu’elles proviennent des bons pays. L’IA de programmation Codex, qui se base sur GPT-3, est également disponible publiquement via l’API.

De son propre point de vue, OpenAI a maintenant mis en œuvre suffisamment de mesures de sécurité pour empêcher l’utilisation abusive du modèle de langage. GPT-3 est considéré comme un générateur de langage extrêmement puissant, mais qui, comme tous les modèles d’apprentissage automatique, tire ses connaissances d’entrées humaines.

Sommaire

Ainsi, le modèle reprend dans ses textes non seulement les connaissances grammaticales des personnes, mais aussi leurs préjugés. Ce biais est globalement un problème dans les applications d’apprentissage automatique. En 2018 déjà, Amazon avait mis un terme à son système d’évaluation des candidatures basé sur la ML, car il désavantageait les candidates par rapport aux candidats masculins.

Au début de l’année, une analyse de GPT-3 a conclu que le modèle nourrissait des préjugés profondément ancrés contre les musulmans. Il les avait repris des innombrables textes trouvés sur Internet qui avaient servi à l’entraînement du modèle.

Les mesures de sécurité incluent un filtre de contenu, qui est actuellement en version bêta, et qui permet de classer les textes en tant que safe, sensitive ou unsafe ou non. En outre, la documentation contient des procédures recommandées pour une utilisation sûre de l’API.

Enfin, OpenAI a publié des directives pour l’utilisation de l’API qui, d’une certaine manière, établissent un système de feux de signalisation – des applications qui sont presque toujours approuvées, en passant par des évaluations au cas par cas, jusqu’aux applications interdites. Parmi ces dernières, on trouve notamment des applications qui créent des tweets ou des posts Instagram automatisés ou qui partagent d’une autre manière des contenus sur les médias sociaux. L’utilisation de l’API dans le but d’influencer des décisions politiques est également taboue.

Des directives existaient déjà pendant la phase non publique. En septembre, un développeur a dû désactiver son chatbot GPT-3 parce qu’il avait enfreint les règles d’OpenAI et n’avait notamment pas intégré de filtre ni de techniques de surveillance contre les sujets abusifs.

En principe, l’API est désormais ouverte à tous les développeurs, à condition qu’ils ne soient pas originaires des mauvais pays. Au lieu d’une liste de tabous, OpenAI a publié une liste de « pays supportés ». Il fallait s’attendre à ce que la Corée du Nord, l’Iran, l’Afghanistan et la Chine ne figurent pas sur la liste, et l’absence de la Russie n’est guère surprenante non plus. L’Ukraine ne figure pas non plus sur la liste positive, mais l’Irak et le Saint-Siège sont explicitement mentionnés séparément.

Outre GPT-3, OpenAI ouvre également, selon la page de présentation de l’API, l’interface avec le modèle Codex, qui traduit le langage naturel en code. Il constitue la base de GitHub Copilot et a été lancé en bêta privée en août. Sur la page du projet Codex, un lien vers la liste d’attente est toutefois toujours présent.

OpenAI a vu le jour en 2015 en tant que projet de recherche, et Elon Musk faisait partie de ses fondateurs. Au début, l’organisation a publié de nombreux projets dans le domaine du Reinforcement Learning. Le modèle de langage GPT-3, acronyme de Generative Pre-trained Transformer 3, a permis à OpenAI d’attirer une large attention. En 2019, OpenAI a fait ses adieux à l’activité purement non lucrative et investit désormais elle-même dans des start-ups dans le domaine de l’apprentissage automatique – dernièrement avec 100 millions de dollars US.

Pendant ce temps, d’autres entreprises développent des alternatives à GPT-3. Microsoft et Nvidia ont présenté en octobre le Megatron-Turing Natural Language Generation Model (MT-NLG), et l’entreprise allemande Aleph Alpha mise sur un modèle multimodal, considéré comme la réponse européenne à GPT-3. En attendant, le GPT-4 est déjà en cours d’élaboration et devrait, comme son prédécesseur, devenir un modèle purement textuel.

De plus amples détails sur l’ouverture de l’API peuvent être trouvés sur le blog OpenAI. Pour utiliser GPT-3, il faut d’abord créer un compte. OpenAI a mis à disposition une série d’exemples d’applications qui devraient servir d’aide au démarrage.

Plus d'articles