Converti testi giuridici cinesi grezzi — statuti o sentenze — in Markdown pulito e strutturato, eliminando il rumore promozionale e preservando ogni parola di sostanza.
npx clawhub@latest install legal-text-formatLegal Text Format è una skill di formattazione e pulizia progettata appositamente per documenti legali cinesi. Accetta testo normativo grezzo (ad es. Codice Civile, Diritto Penale) o documenti di casi (ad es. casi modello della Corte Suprema, decisioni giudiziarie) e produce Markdown ben strutturato con corretta gerarchia di intestazioni, punteggiatura unificata e tutti i contenuti promozionali o irrilevanti rimossi.
La skill gestisce automaticamente due tipologie distinte di documenti: testi normativi (struttura 章/条 con numeri di articolo in grassetto) e casi legali (titolo del caso, numero di ruolo, fatti, sentenza e rilevanza). Ogni risultato di formattazione viene archiviato localmente insieme all'input originale, fornendoti un registro verificabile prima/dopo.
Importante: Questa skill è esclusivamente uno strumento di formattazione — non recupera contenuti da URL. Il recupero di articoli web o WeChat deve essere gestito da una skill di fetch dedicata (ad es. wechat-article-fetch), che può concatenarsi direttamente a questa skill.
wechat-article-fetch) ha recuperato un articolo legale di WeChat e deve passarlo per la formattazione — questa skill accetta direttamente quel percorso file.La skill utilizza un prompt LLM per classificare il testo in ingresso come statuto legale o caso legale prima di applicare il set di regole di formattazione appropriato. Ciò significa che non è necessario specificare il tipo — la skill si adatta automaticamente in base a segnali strutturali come intestazioni di capitoli, numeri di articolo o schemi di ruolo processuale.
Per il testo normativo, i capitoli ricevono intestazioni ##, ogni articolo (第X条) è in grassetto, vengono aggiunte righe vuote tra gli articoli e le interruzioni di riga finali prive di punteggiatura conclusiva vengono eliminate. Tutto il contenuto sostanziale è preservato alla lettera — nessuna clausola viene mai troncata.
Per i documenti di causa, ogni titolo di caso o numero di sequenza riceve un'intestazione ##, le sottosezioni (fatti, sentenza, rilevanza) ricevono intestazioni ###, la punteggiatura inglese viene sostituita con equivalenti cinesi e i numeri vengono normalizzati a metà larghezza. Il testo introduttivo, le biografie degli autori, i piè di pagina, le promozioni con codice QR e i blocchi di articoli consigliati vengono rimossi automaticamente.
Ogni esecuzione salva sia l'input grezzo che l'output formattato in una sottodirectory con timestamp nella cartella archive/. I file seguono una convenzione di denominazione prevedibile (YYYYMMDD_主题_raw.md / _formatted.md), rendendo semplice verificare le modifiche o recuperare il testo originale. Un file opzionale meta.json acquisisce i metadati dell'esecuzione.
Quando wechat-article-fetch (o un'altra skill di recupero) rileva contenuto legale e questa skill è installata, può passare direttamente un percorso file come input. La skill legge il Markdown salvato, esegue l'intera pipeline di formattazione con Legal Text Format e scrive i risultati nella propria directory archive/ — senza alcun passaggio manuale.
Le modifiche di formattazione sono strettamente estetiche: normalizzazione della punteggiatura, livelli di intestazione e spazi bianchi. I numeri di causa, i nomi dei tribunali, i nomi delle parti, il testo degli articoli e tutti i contenuti legali sostanziali vengono preservati esattamente come ricevuti. Il file originale viene sempre conservato come riferimento.
Un utente copia diversi capitoli della 民法典 nella chat. La skill rileva la struttura della norma, racchiude ogni capitolo in ##, mette in grassetto ogni 第X条, normalizza la spaziatura e salva raw.md insieme a formatted.md in una cartella di archivio con marca temporale — pronti per essere importati in una base di conoscenza.
Un ricercatore legale recupera un articolo WeChat contenente 10 casi modello della Corte Suprema. La skill elimina l'introduzione dell'articolo, la biografia dell'autore e i contenuti promozionali finali, quindi applica una gerarchia di intestazioni ##/### coerente e la punteggiatura cinese su tutti i 10 casi, producendo un documento di riferimento pulito tramite Legal Text Format.
Uno studente di legge elabora regolarmente decisioni giudiziarie per lo studio. Ogni file formattato con Legal Text Format viene archiviato nella propria directory con data, corredata di un'intestazione di metadati che include l'URL di origine (quando fornito da uno skill di recupero), il timestamp di elaborazione e il tipo di documento — rendendo la biblioteca facile da consultare e citare.
Con wechat-article-fetch installato, l'utente fornisce un link a un account pubblico WeChat. La skill di recupero scarica l'articolo e attiva automaticamente Legal Text Format, che formatta e archivia il risultato senza alcun input aggiuntivo da parte dell'utente — l'intera pipeline viene eseguita come una singola richiesta.
npx clawhub@latest install legal-text-formatnpx clawhub@latest install legal-text-formatAccedi per scrivere una recensione
Nessuna recensione ancora. Sii il primo a condividere la tua esperienza!