Génération augmentée par récupération (RAG) : guide pour exploiter les données de sa TPE PME avec l’IA générative

Fiche pratique | Publié le 03 décembre 2024 | Mis à jour le 06 janvier 2025

La génération augmentée par récupération (RAG), qui permet de connecter les données de l’entreprise à une IA générative, peut apporter des gains significatifs en termes de productivité et de qualité de service. La DGE publie un guide pour aider les entreprises à déployer cette technologie et à en tirer le meilleur parti.

La Direction générale des Entreprises publie un guide détaillé sur la génération augmentée par récupération (RAG). Intitulé Guide de la génération augmentée par récupération (RAG), il explique comment utiliser cette technologie pour améliorer les réponses de l’IA générative en connectant les données de l’entreprise

Cette approche vise à aider chaque entreprise, quelle que soit sa taille, à bénéficier des gains de temps et de productivité offerts par l'IA générative pour réaliser de tâches d’ordre général (rédaction d’e-mails, de comptes-rendus de réunion) ou des tâches nécessitant une recherche d’informations (par exemple, dans des documents juridiques, des textes de loi, des contrats, de la documentation technique).
 

Qu'est-ce que la génération augmentée par récupération (RAG) ?

La génération augmentée par récupération, ou RAG (pour retrieval augmented generation), est une technologie qui consiste à améliorer les réponses des modèles d'IA générative en les alimentant avec des connaissances issues des bases de données internes de l'entreprise. Cette approche permet aux modèles d'IA de "consulter" les données spécifiques de l'entreprise en temps réel avant de fournir une réponse. 

Le RAG améliore la pertinence et la précision des informations générées mais aussi la traçabilité de l’information et contribue notamment à réduire le risque d’hallucinations (réponses absurdes) par rapport à la simple utilisation d’un modèle d’IA générative. 

Cette solution est accessible à toutes les entreprises, quelles que soient leurs taille et secteur d’activité. En effet, elle ne nécessite pas de compétences en IA ni même en informatique en interne pour être adoptée, et les données utilisées pour la mettre en place peuvent aussi bien être des e-mails, documents textuels et PDF du quotidien que des bases de données juridiques ou techniques d’une grande complexité.

Pourquoi utiliser la génération augmentée par récupération ? 

Gains de temps ou de productivité

Un système de RAG peut proposer aux employés des e-mails prérédigés, des comptes-rendus de réunion prérédigés ou chercher à leur place l’information qui leur est nécessaire dans une base documentaire de grande ampleur, ce qui peut leur faire gagner un temps considérable ;

Amélioration de la qualité du travail effectué

Pour toute tâche nécessitant de la recherche d’informations préalable dans une base de connaissances particulièrement vaste, le système de RAG pourra être plus exhaustif qu’une recherche manuelle, ce qui peut améliorer le niveau d’information dont disposera l’employé utilisateur du système de RAG donc la qualité de son travail ;

Formation des salariés / des utilisateurs

Un système de RAG peut également constituer un outil de formation interne ou de formalisation et de partage des connaissances susceptible de répondre aux questions des employés pour les faire progresser.

Dans quel cas est-il pertinent d'utiliser la RAG ? 

La RAG particulièrement adapté à l'exploitation des données textuelles, est pertinent pour de nombreux cas d'usages, qui intéressent des secteurs d'activités et des types d’information variés. Il peut, par exemple être utilisé pour créer un :

  • Assistant d'entreprise généraliste : pour la rédaction de comptes-rendus, la gestion des e-mails et des plannings ;
  • Assistant juridique : pour la vérification de la conformité et l'aide à la rédaction de contrats ;
  • Assistant RH : pour la rédaction de documents RH et la recherche dans les données RH internes ;
  • Assistant de recherche en documentation technique : pour les métiers de la maintenance en industrie et les bureaux d'études ;
  • Assistant à la création de nouveaux produits : pour l'historique des produits et les échanges les concernant ;
  • Assistant commercial : pour la description détaillée des produits de l'offre commerciale.

Pour les entreprises ne disposant pas de bases de données bien organisées ou de grande
ampleur les cas d’usage simples tels que la rédaction automatique d’e-mails peuvent
apporter des gains de productivité importants grâce à un système de RAG basé sur
le serveur de courriels de l’entreprise.

Cinq questions à se poser pour évaluer la pertinence de recourir à la RAG

L’IA générative, à travers la RAG, peut automatiser ou assister les tâches qui nécessitent une recherche dans une base documentaire (contrats, e-mails, documentation technique…). 

Une fois une telle tâche identifiée au sein de votre entreprise, quelles questions se poser pour savoir si la RAG est pertinent pour y répondre :

1. Cette tâche met-elle en jeu des bases documentaires de grande ampleur, internes à l’entreprise ?

2. Ces bases documentaires changent-elles souvent (ajouts ou modifications de documents) ?

3. Ces bases documentaires sont-elles organisées en une base de données structurée ?

4. Les résultats de la recherche documentaire doivent-ils être intégrés à une réponse rédigée en langage naturel ?

5. Cette tâche nécessite-t-elle une traçabilité de l’information (pouvoir citer les références des documents de la base documentaire employés pour répondre) ?

5 questions à se poser pour évaluer la pertinence de recourir à la RAG

L’IA générative, à travers la RAG, peut automatiser ou assister les tâches qui nécessitent une recherche dans une base documentaire (contrats, e-mails, documentation technique…). 

Une fois une telle tâche identifiée au sein de votre entreprise, quelles questions se poser pour savoir si la RAG est pertinent pour y répondre :

  • Cette tâche met-elle en jeu des bases documentaires de grande ampleur, internes à l’entreprise ?
  • Ces bases documentaires changent-elles souvent (ajouts ou modifications de documents) ?
  • Ces bases documentaires sont-elles organisées en une base de données structurée ?
  • Les résultats de la recherche documentaire doivent-ils être intégrés à une réponse rédigée en langage naturel ?
  • Cette tâche nécessite-t-elle une traçabilité de l’information (pouvoir citer les références des documents de la base documentaire employés pour répondre) ?

Comment déployer la génération augmentée par récupération dans sa TPE PME ? 

Le guide aborde les principaux aspects à aborder pour déployer une RAG et présente des exemples d'entreprises qui l'utilisent.  

Choix du mode d’intégration et de l’hébergement du système de RAG

Le guide explore différents modes d'intégration de la RAG, allant des solutions clés en main (logiciels sous licence ou SaaS), aux solutions sur mesure (développement par un intégrateur ou en interne). Si chaque mode a ses avantages et inconvénients en termes de coût, de personnalisation, et de délai de mise en place, les TPE PME, privilégions généralement les solutions clés en main, plus accessibles. 

Pour l'hébergement, les entreprises peuvent avoir recours à des serveurs internes ou à des serveurs distants (cloud privé, cloud public et solutions SaaS). Le choix de l'hébergement dépend de la vitesse de déploiement souhaitée, des exigences en matière de sécurité des données, et du nombre de requêtes attendues.

Prétraitement des données pour la RAG

Le prétraitement des données est une étape cruciale pour garantir la performance du système de RAG. Cela inclut la conversion des données, le nettoyage, la segmentation, l'enrichissement avec des métadonnées, et la vectorisation. Le guide souligne que le prétraitement des données constitue un investissement durable qui profite à l'ensemble de l'entreprise.

Évaluation et maintenance du système de RAG

L'évaluation régulière du système de RAG est essentielle pour garantir sa performance et sa fiabilité. Cela inclut le recueil des retours des utilisateurs, l'utilisation de mesures quantitatives, et l'évaluation par un grand modèle de langage. La maintenance continue assure la performance du système malgré l'évolution des données et des besoins.

Éthique et sécurité

La protection des données sensibles des entreprises est un enjeu crucial. La protection des données, la conformité au règlement IA européen et l'explicabilité des décisions sont des points critiques. Aussi est-il primordial de s’assurer que les risques de fuite de données via le système de RAG restent maîtrisés.

Importance de la recherche

La qualité du module de recherche est cruciale pour l'efficacité de la RAG. Attention à ne pas négliger l’importance de la recherche qui doit être pertinente et exhaustive afin que le l'IA dispose des meilleures informations possibles pour formuler sa réponse. 

Télécharger le Guide de la génération augmentée par récupération (RAG)

Ce guide, réalisé par la DGE, vise à aider les entreprises de toute taille, à adopter la RAG pour tirer parti de l’intelligence artificielle (IA) au quotidien. Il traite avec pédagogie des prérequis, des coûts, des divers choix technologiques, des bonnes pratiques et des cas d’usage pour mener à bien un projet de déploiement d’une solution de RAG dans une entreprise. 

Je télécharge le guide (pdf ; 24 p. 2,87 Mo)

Julien Karachehayas | Licence etalab-2.0

Dans la même thématique

Cette page vous a-t-elle été utile ?

Suivez-nous sur les réseaux sociaux et Abonnez-vous à notre lettre d’information