FR
Tester les agents IA
Unit tests, golden tasks, record/replay et evals pour attraper les régressions avant la prod.
- Stratégie de test pour agents IA en production★★☆Comment concevoir une stratégie de test pour les agents IA avec unit tests, évaluations et tests de régression.
- Eval Harness pour agents IA : évaluations reproductibles★★☆Un eval harness permet d’exécuter des tests reproductibles et de comparer les versions d’agents.
- Golden datasets : données de test pour agents IA★★☆Les golden datasets contiennent des cas de test sélectionnés pour évaluer les agents.
- Unit testing pour agents IA : tester la logique des agents★★☆Comment écrire des unit tests pour la logique et les outils d’un agent.
- Tool mocking et fault injection pour agents IA★★☆Simuler outils et pannes pour tester comment les agents réagissent aux erreurs.
- Tests de régression pour agents IA★★☆Vérifier que les nouvelles versions d’agents ne cassent pas le comportement existant.
- Replay et debugging pour agents IA★★☆Rejouer les exécutions d’agents pour comprendre les erreurs et décisions.