GPT-3 : une IA générant des textes cohérents

GPT-3 : une IA générant des textes cohérents

08/09/2020 Non Par Guillaume Pruvost

La dernière version du générateur de texte de l’entreprise OpenAI, que le désormais milliardaire Elon Musk a fondé, peut rédiger des articles scientifiques ou offrir une analyse médicale. Une progression vers l’IA générale ?

Sommes-nous dans une ère de révolution par rapport à l’intelligence artificielle ? Sans aucun doute. En effet, il y a quelques années, beaucoup d’avancées avaient déjà été effectuées par rapport au traitement et à la reconnaissance d’images. Par la suite, ce sont notamment la reconnaissance faciale et la voiture autonome qui ont été mis en avant. Désormais, c’est bel et bien la rédaction de texte sur lequel l’IA s’attarde. Preuve en est avec GPT-3. Il s’agit donc de la troisième version logicielle d’un générateur de texte de l’entreprise OpenAI, ayant vu le jour il y a cinq ans.

Une quantité conséquente de données personnelles avec GPT-3

Le programme a été conçu sans aucune supervision humaine. L’intelligence artificielle s’est débrouillée avec un gigantesque corpus de textes venant de Internet mais aussi via des livres numérisés. La totalité des articles en anglais de la plateforme Wikipédia (ce qui correspond tout de même à six millions d’articles) correspondait à près de 0,6% des informations avec lesquelles l’IA a pu effectuer son entraînement. Dans ses écrits, on retrouve notamment des recettes de cuisine, des histoires fantastiques ou encore des livres d’informatique. Point essentiel : GPT-3 n’a pas accompli de tâche particulière et bien définie.

Il y a quelques jours, la fonction de saisie semi-automatique a été proposée dans sa version bêta. Des experts s’en sont rapidement servis afin d’effectuer une multitude d’expériences avec des résultats incroyablement cohérents. Ainsi, certains ont pu concevoir du code informatique, des écrits de sciences, un chatbot permettant un échange entre personnages historiques, des pastiches littéraires (ce sont des imitations mais sans plagiat) d’auteurs connus, ou encore des diagnostics de santé.

Des réponses peu cohérentes durant les tests

Néanmoins, il y a des réserves par rapport à cette IA. En effet, les scientifiques ont seulement partagé ce qui marchait. En réalité, certains tests produisent des réponses peu cohérentes, voire même très bizarres. Or, les chercheurs affirment que le programme va s’optimiser au fil du temps, à chaque changement d’échelle de la bases de données. Puis, sur le long terme, une IA générale aboutira : cela signifie que l’intelligence artificielle aura des compétences cognitives identiques à celles des humains.

Si GPT-3 peut arriver à ce genre de résultat, c’est car il a été formé sans aucune supervision humaine. Cela lui a offert la possibilité d’amasser une quantité considérable de données à une allure folle et à une échelle incomparable. En effet, il n’a pas subi un tri fatiguant et cher effectué par les humains. Néanmoins, cet avantage est également un point faible.

Un corpus faussé

GPT-3 s’est nourri autant de contenus qualitatifs que du reste. Ainsi, il a engrangé dans ses bases des contenus scientifiques mais aussi racistes, complotistes ou encore sexistes. Par conséquent, ses bases de données sont biaisées.

Un Français, salarié du géant Facebook, a dévoilé sur le réseau social Twitter des exemples abominables de posts de l’IA avec des mots-clés sensibles tels que juif, noir ou femme. Malgré cet aspect, l’intelligence artificielle GPT-3 a dévoilé des facultés uniques. Or, elle doit désormais se perfectionner avec le temps et être utilisée par les bonnes personnes pour ne pas devenir, par exemple, une arme de propagande.