Exécutez, surveillez, déboguez et étendez les scénarios, voies en direct et évaluations de personnages d'Openclaw Qa Testing qa-lab et qa-channel.
npx clawhub@latest install openclaw-qa-testingPrérequis
Openclaw Qa Testing est un skill local au dépôt conçu pour piloter l'intégralité du cycle de vie QA d'OpenClaw — de l'exécution des suites de tests mock et live-frontier au débogage des échecs, en passant par l'observation des sorties en direct et la création de nouveaux scénarios. Il orchestre les workflows qa-lab et qa-channel, prend en charge le sharding de lanes en matrice, la validation OTEL smoke, les modes d'identification Telegram et Convex, ainsi que les évaluations de personnages multi-modèles. Installez ce skill lorsque vous avez besoin d'un agent IA qui comprend de bout en bout la chaîne d'outils QA d'OpenClaw et peut l'opérer avec la bonne politique de modèles, la sélection de lanes et la gestion des artefacts appropriées.
qa-lab complète en mode mock ou live-frontier et récupérer le nombre de réussites/échecs, les URL de surveillance et les chemins d'artefacts.fast, transport, media, e2ee-smoke, etc.) ou déclencher des profils d'exécution planifiée ou manuelle.qa character-eval) avec des rapports de juge classés et des transcriptions complètes.qa/scenarios/ et les intégrer dans extensions/qa-lab/src/suite.ts.OpenClaw, Private), la compétence ne peut pas les deviner ou les récupérer — escaladez auprès de votre mainteneur en premier lieu.Sélectionne automatiquement la bonne voie (mock-openai pour le développement, live-frontier pour la validation réelle) et exécute pnpm openclaw qa suite avec les références de modèles et les répertoires de sortie appropriés. Génère un fichier qa-suite-summary.json et un fichier qa-suite-report.md pour chaque exécution.
Prend en charge l'ensemble complet des profils de matrice — fast, transport, media, e2ee-smoke, e2ee-deep, e2ee-cli — via pnpm openclaw qa matrix. Gère les indicateurs fail-fast et les substitutions d'environnement comme OPENCLAW_QA_MATRIX_NO_REPLY_WINDOW_MS pour les exécutions CI/release.
Exécute qa character-eval sur un ensemble configurable de modèles candidats (OpenAI, Anthropic, Google, Moonshot, ZAI) avec une syntaxe intégrée pour le niveau de réflexion et le mode rapide. Produit un rapport de juge classé comprenant les statistiques d'exécution, les durées et les transcriptions complètes — sans les réponses brutes du juge.
Exécute pnpm qa:otel:smoke pour démarrer un récepteur de traces OTLP/HTTP local, exécuter le scénario otel-trace-smoke via le canal qa, et vérifier les noms de traces exportés ainsi que les contrats de confidentialité — aucune accréditation de collecteur externe requise.
Sait où se trouvent les secrets Telegram et Convex QA dans 1Password (coffres OpenClaw et Private) et quelles variables d'environnement chaque voie nécessite. Prend en charge à la fois le mode env Telegram direct et la location de credentials en round-robin via Convex pour la voie npm Telegram Docker.
Prend en charge les références de modèle codex-cli/<codex-model> pour les suites d'assurance qualité et les sondes manuelles, en préservant CODEX_HOME lors des exécutions en direct tout en isolant HOME et OPENCLAW_HOME. Supprime automatiquement CODEX_HOME lors des exécutions simulées.
Déclenchez le profil de matrice fast avec --fail-fast pour valider les contrats de transport critiques pour la version avant un déploiement. La compétence Openclaw Qa Testing sélectionne le bon profil, exécute la suite de tests et rapporte le nombre de succès/échecs ainsi que les chemins des artefacts.
Lorsqu'un scénario dans la voie live-frontier échoue, la compétence Openclaw Qa Testing lit la sortie de la suite, détermine si la cause racine se trouve dans le produit ou dans le harnais, applique le correctif, puis relance l'intégralité de la voie — en exposant l'URL de surveillance et les artefacts mis à jour.
Exécutez qa character-eval sur huit modèles candidats avec des niveaux de réflexion élevés/très élevés pour vérifier que le style, le persona et l'ambiance tiennent lors de tours de tâches réels (chat, modifications dans l'espace de travail). Le rapport du juge classe les candidats sans divulguer les réponses brutes du juge.
La compétence guide la création d'un nouveau fichier markdown de scénario dans qa/scenarios/, aligne les attentes de démarrage de qa/scenarios/index.md, et intègre une couverture exécutable dans extensions/qa-lab/src/suite.ts avec des assertions de bout en bout.
OPENCLAW_LIVE_OPENAI_KEY (mappée depuis OPENAI_API_KEY). Requise pour toute exécution de modèle OpenAI en direct. Prend en charge : OpenAI (openai/gpt-5.4).OPENCLAW_QA_TELEGRAM_DRIVER_BOT_TOKEN et OPENCLAW_QA_TELEGRAM_SUT_BOT_TOKEN proviennent de l'élément 1Password OpenClaw / Telegram E2E.OPENCLAW_QA_CONVEX_SITE_URL, OPENCLAW_QA_CONVEX_SECRET_MAINTAINER, OPENCLAW_QA_CONVEX_SECRET_CI — proviennent du coffre-fort 1Password OpenClaw. Permet la location de credentials en tourniquet pour la voie Docker Telegram.op) — Doit être exécuté dans tmux pour la récupération des secrets QA. Exécutez op account list pour vérifier l'authentification.npx clawhub@latest install openclaw-qa-testingnpx clawhub@latest install openclaw-qa-testingPrérequis
Se connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !