Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://wb-21fd5541-docs-2632.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

Les W&B Skills sont des ensembles d’instructions réutilisables qui apprennent aux agents de code à utiliser efficacement W&B. Au lieu de guider manuellement votre agent dans les API W&B et les bonnes pratiques, installez des Skills afin qu’il puisse gérer de manière autonome le suivi des expériences, Tracing, les évaluations et le monitoring. Les Skills fonctionnent avec plusieurs agents de code majeurs, notamment :
  • Claude Code
  • Codex
  • Cursor
  • GitHub Copilot
  • Gemini CLI
Pour obtenir la liste complète des agents pris en charge, consultez la documentation CLI de W&B Skills.

Capacités de W&B Skills

Skills couvre à la fois le SDK W&B Models (runs d’entraînement, métriques, Artifacts, Sweeps) et le SDK Weave (traces, évaluations, évaluateurs). Il inclut des bibliothèques utilitaires, de la documentation de référence et des approches d’analyse de données afin que votre agent puisse prendre en charge les flux de travail suivants.
Flux de travailCapacités
Entraînement du modèle
  • Journalisez des métriques et des médias enrichis pendant l’entraînement et le fine-tuning.
  • Suivez et comparez les expériences.
  • Analysez les Runs et les résultats, comme les courbes de perte et les scores de précision.
  • Ajustez les hyperparamètres.
Création d’agents
  • Tracez les applications d’IA agentique.
  • Analysez les traces et classez les modes de défaillance.
  • Évaluez les modèles et les agents à l’aide de jeux de données étiquetés.
  • Exécutez des évaluations en ligne pour le monitoring en production.

Prérequis

Skills requiert les éléments suivants :
  • Node.js (pour la commande npx).
  • Une clé API W&B. Créez-en une sur wandb.ai/authorize, puis définissez-la comme variable d’environnement. Remplacez [YOUR-API-KEY] par votre clé API :
    export WANDB_API_KEY=[YOUR-API-KEY]
    
  • Facultatif : définissez le nom de votre projet W&B comme variable d’environnement WANDB_PROJECT. Cela permet à votre agent de cibler le bon projet W&B sans avoir à le préciser à chaque fois.

Installer W&B Skills

Choisissez une installation globale pour rendre Skills disponibles dans tous vos projets, ou une installation spécifique à un projet pour limiter Skills à un seul projet. Pour installer W&B Skills globalement pour tous vos projets, utilisez l’indicateur --global :
npx skills add wandb/skills --skill '*' --yes --global
Pour installer Skills uniquement pour le projet actuel, exécutez la commande d’installation dans le répertoire de votre projet sans l’indicateur --global :
npx skills add wandb/skills --skill '*' --yes
Vous pouvez également installer des Skills pour des agents spécifiques à l’aide de l’option --agent :
npx skills add wandb/skills --agent claude-code --skill '*' --yes --global
Pour consulter la liste des options --agent et --skill, voir la documentation CLI de skills. Une fois l’installation terminée, votre agent a accès à W&B Skills et est prêt à prendre en charge les tâches liées à W&B.

Utiliser W&B Skills

Une fois installé, vous pouvez demander à l’agent d’effectuer des tâches liées à W&B pour votre projet. Les prompts d’exemple suivants illustrent certaines des tâches que votre agent peut accomplir avec W&B Skills :
  • “Journalise les métriques d’entraînement de mon modèle PyTorch dans W&B.”
  • “Analyse les courbes de perte de mes 10 derniers runs et identifie la configuration la plus performante.”
  • “Trace mon agent LangChain et journalise les résultats dans Weave.”
  • “Exécute une évaluation sur mon agent à l’aide du jeu de données de test et résume les résultats.”
  • “Trouve les modes de défaillance dans ma dernière évaluation et classe-les.”
  • “Compare les configurations du run A et du run B et montre-moi les différences.”

Conseils d’utilisation

Skills fonctionne mieux avec des requêtes plus précises qu’avec des questions larges et ouvertes. Le tableau suivant compare des prompts recommandés à des prompts trop vagues.
RecommandéNon recommandé
”Quelle est la perte de validation finale de mes 5 derniers runs ?""Comment se comporte mon modèle ?"
"Résume l’utilisation des tokens sur mes 10 dernières traces.""Montre-moi toutes mes traces."
"Compare les configurations du run A et du run B.""Quels sont mes meilleurs runs ?"
"Quelle évaluation avait le score F1 le plus élevé ?""Comment se passent mes évaluations ?”