Zero-Shot Learning

Zero-Shot Learning est la capacité d'un modèle (typiquement un LLM) à effectuer une tâche sans avoir vu d'exemples préalables pour cette tâche spécifique, simplement en suivant des instructions naturelles. Démonstration impressionnante des capacités de généralisation des LLMs pré-entraînés sur web-scale text.

Exemple zero-shot : prompt "Classify the sentiment of this review as positive, negative, or neutral: 'This product changed my life'" → réponse "positive". Aucun exemple de classification sentiment dans prompt, le LLM exécute la tâche basé sur sa compréhension générale du langage et concepts ("sentiment", "positive", "negative", "neutral").

Vs Few-Shot : few-shot fournit 2-5 exemples démontrant la tâche avant la query réelle (in-context learning). Plus précis généralement mais consomme plus de context window.

Use cases zero-shot fréquents : (1) classification (sentiment, topic, intent) ; (2) extraction (NER, key information from text) ; (3) summarization ; (4) translation ; (5) Q&A ; (6) code generation simple ; (7) creative writing ; (8) explanation. Modern LLMs (GPT-4, Claude, Gemini) très forts zero-shot sur la plupart des tâches NLP communes.

When zero-shot fails : (1) domain-specific terminology unknown ; (2) format de réponse précis requis pas évident depuis instruction ; (3) reasoning multi-step complexe ; (4) tâches niche/peu représentées dans training data ; (5) tâches structurées avec règles complexes. Solutions : few-shot examples, fine-tuning, RAG pour context, chain-of-thought prompting.

Zero-shot in CV : models comme CLIP enable zero-shot image classification — fournir prompts texte ("a photo of a cat", "a photo of a dog") + image, classifier choisit closest text embedding. Pas de training spécifique sur catégories cibles requis.

Évaluation : benchmarks comme MMLU, BIG-Bench, HellaSwag mesurent zero-shot capabilities en standardisant les tâches.

Limite philosophique : modèles n'apprennent jamais vraiment "zero-shot" — ils ont vu des concepts similaires durant pretraining. Plus juste : zero-shot = zero task-specific fine-tuning exemples, mais probably much exposure to similar tasks in pretraining corpus. Compétences AI-102, AIF-C01.

Préparez vos certifications IT gratuitement