Concepts

Comprendre l'écosystème IA. Du token au coût total — concepts et exemples concrets (Claude, GPT, Gemini, Mistral...).

LoRA & QLoRA : spécialiser un modèle sans le ré-entraîner en entier

LoRA & QLoRA : spécialiser un modèle sans le ré-entraîner en entier

CONCEPTS — SOUS LE CAPOT · LORA & QLORA : FINE-TUNING MODERNE U n grand modèle de langage sait déjà énormément de choses. Ce qu'il ne sait pas, c'est parler votre langue métier : le ton d'un service j...

Concepts

5 juil. 2026

$Mixture of Experts : pourquoi un « gros » modèle n'active qu'une fraction de ses poids$

Mixture of Experts : pourquoi un « gros » modèle n'active qu'une fraction de ses poids

CONCEPTS — SOUS LE CAPOT AVANCÉ · MIXTURE OF EXPERTS U n modèle de langage annoncé à 671 milliards de paramètres devrait, en toute logique, coûter une fortune à chaque mot produit. Or ce n'est pas le ...

Concepts

5 juil. 2026

Distillation : comment un petit modèle apprend d'un gros (SLM)

Distillation : comment un petit modèle apprend d'un gros (SLM)

CONCEPTS — SOUS LE CAPOT AVANCÉ · DISTILLATION & PETITS MODÈLES (SLM) U ne intuition tenace veut qu'un modèle utile soit forcément un modèle géant, servi depuis un centre de données lointain. Pourtant...

Concepts

5 juil. 2026

Aligner un modèle : RLHF, DPO et les préférences humaines

Aligner un modèle : RLHF, DPO et les préférences humaines

SÉRIE — SOUS LE CAPOT AVANCÉ · ARCHITECTURES & ENTRAÎNEMENT — ALIGNEMENT U n modèle de langage fraîchement pré-entraîné ne sait pas répondre. Il sait compléter . Exposé à des trillions de mots, il a a...

Concepts

5 juil. 2026

Tokenization : pourquoi l'IA compte mal les lettres

Tokenization : pourquoi l'IA compte mal les lettres

CONCEPTS — SOUS LE CAPOT · TOKENIZATION P osez la question à n'importe quel assistant : « combien de fois la lettre R apparaît-elle dans strawberry ? ». Il y a de bonnes chances qu'il réponde « deux »...

Concepts

5 juil. 2026

Quantization : faire tourner un LLM sur sa machine

Quantization : faire tourner un LLM sur sa machine

CONCEPTS — SOUS LE CAPOT AVANCÉ · QUANTIZATION U n modèle de langage à sept milliards de paramètres, stocké dans sa précision d'origine, occupe environ quatorze gigaoctets de mémoire. C'est plus que c...

Concepts

5 juil. 2026

Temperature, top-p : les curseurs qui rendent une IA créative ou déterministe

Temperature, top-p : les curseurs qui rendent une IA créative ou déterministe

CONCEPTS — SOUS LE CAPOT · TEMPERATURE, TOP-P & LE HASARD MAÎTRISÉ P osez deux fois la même question à un assistant IA, et vous obtiendrez souvent deux réponses différentes. Ce n'est ni un bug, ni une...

Concepts

5 juil. 2026

Fenêtre de contexte longue & « lost in the middle » : pourquoi tout mettre dans le prompt n'est pas une stratégie

Fenêtre de contexte longue & « lost in the middle » : pourquoi tout mettre dans le prompt n'est pas une stratégie

CONCEPTS — SOUS LE CAPOT AVANCÉ · FENÊTRE DE CONTEXTE & « LOST IN THE MIDDLE » U n million de tokens. L'argument commercial est irrésistible : versez un roman entier, un dossier juridique complet, des...

Concepts

5 juil. 2026

Prompt caching & KV cache : le levier coût/latence que peu comprennent

Prompt caching & KV cache : le levier coût/latence que peu comprennent

CONCEPTS — SOUS LE CAPOT AVANCÉ · PROMPT CACHING & KV CACHE U ne application qui interroge un modèle de langage renvoie souvent, à chaque appel, le même bloc de texte en tête de requête : une consigne...

Concepts

5 juil. 2026

La mémoire des agents : pourquoi un agent « oublie »

La mémoire des agents : pourquoi un agent « oublie »

CONCEPTS — SOUS LE CAPOT · LA MÉMOIRE DES AGENTS V ous confiez une consigne à un agent, il l'exécute, vous revenez le lendemain — et il vous redemande votre nom, vos préférences, le contexte que vous ...

Concepts

5 juil. 2026

Benchmarks & contamination : pourquoi les classements de modèles mentent

Benchmarks & contamination : pourquoi les classements de modèles mentent

CONCEPTS — SOUS LE CAPOT AVANCÉ · BENCHMARKS & CONTAMINATION U n classement de modèles a quelque chose de rassurant. Une colonne de noms, une colonne de scores, un vainqueur en tête : la décision semb...

Concepts

5 juil. 2026

Multi-agents & orchestration : quand un seul agent ne suffit pas

Multi-agents & orchestration : quand un seul agent ne suffit pas

SÉRIE — SOUS LE CAPOT AVANCÉ · CONCEPTS · AGENTS AVANCÉS U n agent, c'est déjà une boucle : un modèle de langage qui raisonne, appelle des outils, observe le résultat, recommence jusqu'à atteindre son...

Concepts

5 juil. 2026

1
2
3
4
5