Les rouages de ChatGPT (et d’autres grand modèles de langage)

Écrivain: Oscar He

Rédacteur: Adrian

Dès la sortie de ChatGPT le 30 novembre 2022, ChatGPT est probablement devenu un des outils les plus influents du siècle. En seulement deux mois, le service numérique a réalisé environ 100 millions d’utilisateurs, ce qui lui rend une des applications en pleine croissance les plus rapides en ce qui concerne le nombre d’utilisateurs. En fait, des centaines de millions de personnes l’utilisent pour des raisons variées, comme pour expliquer des idées, aider avec des tâches, ou même pour résoudre avec des problèmes juridiques! Même si tant de gens l’utilisent au quotidien, la majorité des personnes qui l’utilisent ne savent pas comment il fonctionne! Après avoir lu cet article, tu auras une meilleure idée de comment cette technologie fascinante fonctionne.

ChatGPT peut être classifié comme un grand modèle de langage. Cette technologie est reliée au concept d’intelligence artificielle générative. Malgré sa popularité, ChatGPT n’est pas le premier grand modèle de langage fonctionnel. En fait, il y avait d’autres modèles qui existaient avant sa création. Quelques exemples en ordre chronologique de ce genre de technologie qui ont précédé ChatGPT incluent GPT-1, GPT-2 et GPT-3. Cependant, les rouages de ces modèles sont très similaires. En termes simples, tous ces modèles sont essentiellement des machines créées spécifiquement pour générer des réponses “humaines” à des messages en prédisant le meilleur prochain choix de mot ou ponctuation. Le meilleur mot ou caractère est donc choisi et ce processus continue jusqu’au point où le modèle décide que la réponse est finie. Le produit final (en supposant que le modèle est assez capable) est une réponse cohérente.

Mais comment est-ce que ces modèles sont capables d’apprendre à choisir le meilleur mot ou caractère basé sur le contexte de la question posée par l’utilisateur? Cette capacité est obtenue grâce à l’apprentissage automatique et les méthodes d’entraînements employés par les ingénieurs. Ces types de modèles sont typiquement entraînés avec diverses sources, comme des livres, des articles en-ligne, et des sites-webs. En général, avec plus d’informations d’entraînement disponible au modèle, il sera mieux capable d’apprendre les connexions entre les mots et caractères, et en conséquence, les plus cohérentes les réponses du modèle. L’entraînement est essentiel pour que le modèle puisse formuler de bonnes réponses peu importe la question de l’utilisateur.

En conclusion, ChatGPT est une technologie qui emploie l’apprentissage automatique pour découvrir des motifs et formuler des connexions dans l’écriture et pour nous générer des réponses logiques. C’est une technologie extrêmement excitante et qui va certainement améliorer encore à l’avenir.

Works Cited

“B.C. lawyer who used fake, AI-generated cases faces law society probe, possible costs | Globalnews.ca.” Global News, 31 January 2024, https://globalnews.ca/news/10263897/fake-ai-cases-b-c-supreme-court/. Accessed 7 April 2024.

“What Are Large Language Models (LLMs)?” IBM, https://www.ibm.com/topics/large-language-models. Accessed 7 April 2024.

Leave a comment