Convertissez des textes juridiques chinois bruts — lois ou décisions de justice — en Markdown propre et structuré, en supprimant le bruit promotionnel tout en préservant chaque mot de substance.
npx clawhub@latest install legal-text-formatLegal Text Format est une compétence de mise en forme et de nettoyage spécialement conçue pour les documents juridiques chinois. Elle accepte du texte législatif brut (par ex. Code civil, Droit pénal) ou des documents de jurisprudence (par ex. affaires types de la Cour suprême, décisions judiciaires) et produit un Markdown bien structuré avec une hiérarchie de titres correcte, une ponctuation unifiée et tout contenu promotionnel ou non pertinent supprimé.
La compétence gère automatiquement deux types de documents distincts : les textes législatifs (structure 章/条 avec numéros d'articles en gras) et les affaires judiciaires (intitulé de l'affaire, numéro de dossier, faits, décision et portée). Chaque résultat de mise en forme est archivé localement avec l'entrée d'origine, vous fournissant un enregistrement vérifiable avant/après.
Important : Cette compétence est uniquement un outil de mise en forme — elle ne récupère pas de contenu depuis des URL. La récupération d'articles web ou WeChat doit être prise en charge par une compétence de récupération dédiée (par ex. wechat-article-fetch), qui peut s'enchaîner directement avec cette compétence.
wechat-article-fetch) a récupéré un article juridique WeChat et doit le transmettre pour mise en forme — Legal Text Format accepte directement ce chemin de fichier.La compétence utilise une invite LLM pour classer le texte entrant en tant que texte législatif ou décision judiciaire avant d'appliquer le jeu de règles de mise en forme approprié. Cela signifie que vous n'avez pas besoin de préciser le type — la compétence s'adapte automatiquement en fonction des signaux structurels tels que les titres de chapitres, les numéros d'articles ou les modèles de référence de dossier judiciaire.
Pour les textes législatifs, les chapitres reçoivent des titres ##, chaque article (第X条) est mis en gras, des lignes vides sont ajoutées entre les articles, et les sauts de ligne en fin de texte non suivis d'une ponctuation finale sont supprimés. L'intégralité du contenu est préservée à l'identique — aucune clause n'est jamais tronquée.
Pour les documents de cas, chaque titre de cas ou numéro de séquence reçoit un en-tête ##, les sous-sections (faits, décision, importance) reçoivent des en-têtes ###, la ponctuation anglaise est remplacée par ses équivalents chinois, et les nombres sont normalisés en demi-chasse. Les textes d'introduction, les biographies d'auteurs, les pieds de page, les promotions de codes QR et les blocs d'articles recommandés sont automatiquement supprimés.
Chaque exécution sauvegarde à la fois l'entrée brute et la sortie formatée dans un sous-répertoire horodaté sous archive/. Les fichiers suivent une convention de nommage prévisible (YYYYMMDD_主題_raw.md / _formatted.md), ce qui facilite l'audit des modifications ou la récupération du texte original. Un fichier meta.json optionnel capture les métadonnées d'exécution.
Lorsque wechat-article-fetch (ou une autre compétence de récupération) détecte du contenu juridique et que cette compétence est installée, elle peut transmettre un chemin de fichier directement en entrée. La compétence lit le Markdown enregistré, exécute l'intégralité du pipeline de formatage via Legal Text Format, et écrit les résultats dans son propre répertoire archive/ — aucun transfert manuel n'est nécessaire.
Les modifications de mise en forme sont strictement cosmétiques : normalisation de la ponctuation, niveaux de titres et espacement. Les numéros de dossier, les noms de juridictions, les noms des parties, le texte des articles et l'ensemble du contenu juridique substantiel sont préservés exactement tels que reçus. Le fichier original est toujours conservé comme référence.
Un utilisateur copie plusieurs chapitres de la 民法典 dans le chat. La compétence Legal Text Format détecte la structure des textes législatifs, encadre chaque chapitre dans ##, met en gras chaque 第X条, normalise les espaces, et enregistre raw.md ainsi que formatted.md dans un dossier d'archive horodaté — prêt à être importé dans une base de connaissances.
Un chercheur juridique récupère un article WeChat contenant 10 cas modèles de la Cour suprême. La compétence Legal Text Format supprime l'introduction de l'article, la biographie de l'auteur et le contenu promotionnel final, puis applique une hiérarchie de titres ##/### cohérente ainsi qu'une ponctuation chinoise uniforme sur l'ensemble des 10 cas, produisant un document de référence propre et structuré.
Un étudiant en droit traite régulièrement des décisions judiciaires à des fins d'étude. Chaque fichier mis en forme est classé dans son propre répertoire d'archive daté, accompagné d'un en-tête de métadonnées qui inclut l'URL source (lorsqu'elle est fournie par un skill de récupération), l'horodatage du traitement et le type de document — ce qui facilite la recherche et la citation au sein de la bibliothèque.
Avec wechat-article-fetch installé, un utilisateur fournit un lien vers un compte public WeChat. La compétence de récupération extrait l'article et déclenche automatiquement Legal Text Format, qui formate et archive le résultat sans aucune intervention supplémentaire de l'utilisateur — l'ensemble du pipeline s'exécute en une seule requête.
npx clawhub@latest install legal-text-formatnpx clawhub@latest install legal-text-formatSe connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !