Semaine 2 > 10/10 - 14h | Interrogez vos documents avec des LLM : découvrez la méthode RAG

Interrogez vos documents avec des grands modèles de langage : découvrez la méthode RAG

Pierre Poulain
Laboratoire de Biochimie Théorique
CNRS et Université Paris Cité

Maître de conférences en bioinformatique à l'Université Paris Cité, Pierre Poulain enseigne la programmation Python et l’analyse de données. Au sein du Laboratoire de Biochimie Théorique, il travaille sur le partage et la réutilisation des données de simulations de dynamique moléculaire dans un contexte de science ouverte. Il y développe notamment des méthodes d'extraction et de génération de métadonnées à partir d'approches de machine learning et d'intelligence artificielle.

Présentation

Les grands modèles de langage (LLM) sont entrainés sur des corpus de données généralistes et fixés dans le temps, ce qui peut produire des réponses obsolètes et parfois inexactes. La génération augmentée par récupération (RAG) permet d'enrichir un LLM avec des ressources externes textuelles (fichier PDF, site web, documentation, etc.) afin de générer des réponses pertinentes et actualisées.
Cette présentation sera illustrée par un projet d'innovation pédagogique qui visait à créer un assistant conversationnel en employant la méthode RAG pour accompagner les étudiants dans l'apprentissage de la programmation Python.

Programme

  1. Présentation de la méthode RAG (génération augmentée par récupération) ;

  2. Construction d’un RAG : base de connaissance, comparaison de morceaux de textes, démonstrations et code source ;

  3. Comparaison entre le RAG et le fine-tuning (apprentissage profond) ;

  4. Cas d’usage : accompagner l’enseignement à la programmation Python avec un assistant conversationnel pédagogique.
Chargement... Chargement...