Interroger un Excel de 50 000 lignes en langage naturel

4 juillet 2026 by

AISkillsPro

Cinquante mille lignes de ventes, et une question simple : « Quel est mon chiffre d'affaires par région, hors retours ? » Avant, c'était une formule, un tableau croisé dynamique, vingt minutes de manipulation. Aujourd'hui, vous glissez le fichier dans ChatGPT ou Claude et vous posez la question en français. La réponse tombe en quelques secondes — et elle est calculée, pas devinée. À condition de comprendre comment ces outils s'y prennent, et pourquoi il faut quand même garder un œil critique.

50 000 lignes, ce n'est pas le problème

Évacuons d'emblée la fausse inquiétude. Un fichier de cinquante mille lignes ne « déborde » pas l'outil : il s'agit de quelques mégaoctets, bien en deçà des limites (de l'ordre de 50 Mo pour un tableur côté ChatGPT, jusqu'à 500 Mo par fichier côté Claude). Aucune contrainte ne porte d'ailleurs sur le nombre de lignes. Le vrai sujet n'est pas la taille : c'est de savoir si l'IA calcule réellement votre réponse, ou si elle la devine.

La distinction qui change tout : deviner ou calculer

Voici le point que tout le monde devrait comprendre avant d'interroger un tableau avec une IA (Fig. 1). Un grand modèle de langage est, par nature, une machine à prédire le mot le plus probable. Demandez-lui de faire une addition « de tête » sur une colonne, et il produit un nombre plausible — pas le résultat d'un calcul. La recherche est sans ambiguïté : les modèles sont structurellement médiocres en arithmétique mentale, parce qu'ils ne calculent pas, ils estiment.

Deux chemins : à gauche l'IA lit le tableau et renvoie un nombre probable (risque d'erreur) ; à droite l'IA écrit un programme exécuté par un interpréteur qui calcule le résultat exact — Fig. 1 — Deux façons de répondre. Seule l'exécution de code garantit le calcul.

La solution, connue des chercheurs sous le nom de Program-Aided Language Models, est élégante : au lieu de répondre directement, le modèle écrit un programme et confie le calcul à un interpréteur déterministe. Le gain de fiabilité est net — sur un banc d'essai mathématique de référence, écrire le code l'emporte sur la réponse « au fil du raisonnement » (de l'ordre de 72 % de bonnes réponses contre 66 %). La leçon : tant que le programme est correct, le calcul est exact. C'est exactement ce que font les outils grand public.

Deux ateliers : ChatGPT et Claude

Les deux grands assistants ont intégré ce principe, avec deux moteurs différents.

ChatGPT, via sa fonction Data analysis (l'ancien « Code Interpreter »), écrit et exécute du Python — la bibliothèque pandas pour les calculs, Matplotlib pour les graphiques — dans un bac à sable sécurisé. Vous uploadez votre tableur, une vue interactive s'affiche, et des commandes en langage naturel (« analyse », « compare par région ») suffisent. La fonction est ouverte aux comptes Plus, Pro et Enterprise, avec un accès restreint en gratuit.

Claude, lui, dispose d'un outil d'analyse qui écrit et exécute du JavaScript pour produire, selon ses propres termes, des résultats « mathématiquement précis et reproductibles ». Il génère aussi des graphiques interactifs via ses Artifacts (sur navigateur et bureau). Pour téléverser un fichier Excel, il faut activer l'exécution de code dans les réglages.

📖 Pourquoi c'est fiable (et pourquoi ça ne suffit pas)

Quand l'IA exécute du code, l'addition est faite par un interpréteur, pas par un modèle de langage : le total de la colonne est déterministe, reproductible, et il ne change pas d'une fois sur l'autre. C'est un saut de fiabilité énorme par rapport à une réponse « de tête ». Mais — et c'est tout l'enjeu de la suite — un calcul exact sur la mauvaise question reste une réponse fausse.

Le piège : un code qui tourne mais qui ment

Voilà l'erreur que les démonstrations ne montrent jamais (Fig. 2). Le code généré peut s'exécuter sans la moindre erreur… et produire un résultat faux. Une étude sur les erreurs de génération de code estime qu'environ 65 % des réponses incorrectes des modèles sont des programmes qui tournent — mais qui ne font pas ce qu'on croit.

Quatre causes d'un total faux malgré un code qui s'exécute : mauvaise colonne choisie, valeurs manquantes comptées comme zéro, doublons non supprimés, format de date mal interprété — Fig. 2 — Un code propre, un résultat faux : les pièges silencieux de l'analyse automatique.

Les causes sont presque toujours les mêmes, et toutes invisibles dans la réponse finale : le modèle choisit la mauvaise colonne (« montant » au lieu de « montant net »), traite les valeurs manquantes comme des zéros, oublie de dédupliquer des lignes en double, ou mésinterprète un format de date (mois et jours inversés). Le total s'affiche, propre, crédible — et faux. Pire : si votre question est ambiguë, le modèle tranche tout seul une hypothèse que vous n'auriez pas choisie.

⚠️ « Ça tourne » ne veut pas dire « c'est juste »

L'exécution de code élimine les erreurs d'arithmétique, pas les erreurs de raisonnement. Le modèle peut parfaitement additionner… la mauvaise colonne. La fiabilité du résultat dépend entièrement de la justesse du programme — et donc de votre vérification.

Vérifier en trois gestes

Bonne nouvelle : parce que l'IA écrit un programme, l'analyse est auditable. Trois réflexes suffisent à transformer une réponse douteuse en résultat fiable (Fig. 3).

Trois gestes de vérification : lire le code généré, tester sur un petit échantillon dont on connaît la réponse, et recouper un total connu en comparant le nombre de lignes traitées au fichier — Fig. 3 — Trois gestes qui séparent une réponse crédible d'une réponse vérifiée.

1. Lisez le code. Demandez à voir le programme généré (ou dépliez-le) : quelle colonne ? quel filtre ? les valeurs manquantes, traitées comment ? Pas besoin d'être développeur pour repérer une colonne aberrante. 2. Testez sur un échantillon. Faites refaire le calcul sur dix lignes dont vous connaissez la réponse à la main. 3. Recoupez un total connu et vérifiez le nombre de lignes traitées : si votre fichier compte 50 000 lignes et que l'analyse en traite 48 200, un filtre silencieux a mangé 1 800 lignes — à élucider avant de conclure.

Confidentialité et limites

Deux mises en garde avant de tout uploader. D'abord, la confidentialité : un fichier de ventes ou de RH contient des données personnelles. Le déposer dans un outil grand public engage le RGPD, et la CNIL est claire — minimisation, information des personnes, pas de données sensibles. Pour un usage professionnel, privilégiez les offres entreprise (qui, par défaut, n'entraînent pas leurs modèles sur vos fichiers) et désactivez la réutilisation de vos conversations.

Ensuite, les limites. Ces outils sont excellents pour explorer, agréger, nettoyer et visualiser un fichier. Mais ils ne remplacent pas un analyste pour les choix qui comptent vraiment : quel modèle statistique, quelles hypothèses, quelle causalité, quelle significativité. Une étude récente sur des tâches réelles de data science le confirme : les modèles résolvent du premier coup la majorité des tâches faciles, mais une petite minorité seulement des tâches difficiles. Outil d'augmentation, pas de remplacement.

⚠️ Un Excel d'entreprise n'est pas un fichier anodin

Noms de clients, salaires, marges : avant l'upload, pseudonymisez ce qui peut l'être, vérifiez l'offre que vous utilisez, et ne confiez jamais à un compte grand public des données que vous ne maîtrisez pas. La rapidité ne justifie pas la fuite.

Testez vous-même : le protocole

Prenez un fichier non sensible (ou pseudonymisé) de quelques milliers de lignes.
Posez une question précise : « Total des ventes nettes par région, en excluant les lignes annulées. »
Affichez le code généré : vérifiez la colonne, le filtre, le traitement des valeurs manquantes.
Recoupez sur un échantillon connu et comparez le nombre de lignes traitées au fichier d'origine.
Itérez en précisant votre question si le résultat surprend — et ne reportez jamais un chiffre que vous n'avez pas pu recouper.

En une demi-heure, vous aurez compris la vraie valeur de ces outils : ils suppriment la corvée du tableau croisé, mais pas votre responsabilité sur le chiffre que vous présentez.

🎯 À retenir

La taille n'est pas l'obstacle : 50 000 lignes tiennent largement dans ChatGPT comme dans Claude.
Calculé, pas deviné : ces outils exécutent du code (Python ou JavaScript), donc le calcul est déterministe.
Mais un code qui tourne peut mentir : mauvaise colonne, valeurs manquantes, doublons, dates mal lues.
Vérifiez en trois gestes : lire le code, tester sur un échantillon, recouper un total et le nombre de lignes.
Confidentialité et limites : RGPD, offres pro, et jamais de substitut à un analyste pour les choix méthodologiques.

📖 Pour prolonger côté dev & data

Dans la même logique « l'IA exécute, vous validez » : refactoriser du code legacy sans tout casser, construire une appli web sans coder, et pour comprendre pourquoi un modèle « devine » un nombre, revoyez comment fonctionne un grand modèle de langage.

Cette analyse fait partie de notre veille Outils & IA. Pour recevoir les prochains décryptages et le panorama complet, téléchargez l'Atlas IA 2026 et abonnez-vous à la newsletter AISKILLSPRO.

💼 Vous travaillez avec Odoo ?

Au-delà de l'IA, retrouvez nos guides, tutoriels et modules Odoo sur OdooSkills, le blog Odoo ↗ (nouvel onglet).

in Outils & Veille

# Analyse de données Data

RGPD et IA : ce qu'on a le droit (ou pas) de mettre dans ChatGPT