Konvertera råa kinesiska juridiska texter — lagar eller domstolsfall — till ren, strukturerad Markdown, ta bort reklamstörningar samtidigt som varje ord av substans bevaras.
npx clawhub@latest install legal-text-formatLegal Text Format är en formatterings- och rensningsfärdighet byggd specifikt för kinesiska juridiska dokument. Den tar emot rå lagtext (t.ex. civillagen, strafflagen) eller falldokument (t.ex. Högsta domstolens modellfall, rättsliga avgöranden) och levererar välstrukturerad Markdown med korrekt rubrikhierarki, enhetlig interpunktion och allt reklam- eller irrelevant innehåll borttaget.
Färdigheten hanterar automatiskt två olika dokumenttyper: juridiska stadgar (章/条-struktur med fetstilta artikelnummer) och juridiska fall (falltitel, målnummer, sakförhållanden, domslut och betydelse). Varje formatteringsresultat arkiveras lokalt tillsammans med den ursprungliga inmatningen, vilket ger dig ett verifierbart före/efter-underlag.
Viktigt: Denna färdighet är enbart ett formatteringsverktyg — den hämtar inte innehåll från URL:er. Hämtning av webb- eller WeChat-artiklar bör hanteras av en dedikerad hämtningsfärdighet (t.ex. wechat-article-fetch), som kan kopplas direkt till denna färdighet.
wechat-article-fetch) har hämtat en juridisk WeChat-artikel och behöver skicka den vidare för formatering — denna skill accepterar den filsökvägen direkt.Färdigheten använder en LLM-prompt för att klassificera inkommande text som antingen en lagstadga eller ett rättsfall innan lämplig formateringsregeluppsättning tillämpas. Det innebär att du inte behöver ange typen — färdigheten anpassar sig automatiskt baserat på strukturella signaler som kapitelrubriker, artikelnummer eller målnummermönster.
För lagstadgad text får kapitel rubriker med ##, varje artikel (第X条) fetmarkeras, tomma rader läggs till mellan artiklarna och eventuella avslutande radbrytningar utan avslutande skiljetecken rensas bort. Allt innehållsligt material bevaras ordagrant — ingen klausul trunkeras någonsin.
För falldokument får varje falltitel eller sekvensnummer en ##-rubrik, underavsnitt (fakta, avgörande, betydelse) får ###-rubriker, engelsk interpunktion ersätts med kinesiska motsvarigheter och siffror normaliseras till halvbredd. Inledande text, författarpresentationer, sidfötter, QR-kodsreklam och block med rekommenderade artiklar tas automatiskt bort.
Varje körning sparar både råinmatningen och det formaterade resultatet i en tidsstämplad underkatalog under archive/. Filerna följer en förutsägbar namnkonvention (YYYYMMDD_主题_raw.md / _formatted.md), vilket gör det enkelt att granska ändringar eller återställa originaltexten. En valfri meta.json fångar körningsmetadata.
När wechat-article-fetch (eller en annan hämtningsskill) upptäcker juridiskt innehåll och denna skill är installerad kan den skicka en filsökväg direkt som indata. Skillen läser den sparade Markdown-filen, kör hela Legal Text Format-pipelinen och skriver resultaten till sin egen archive/-katalog — ingen manuell överlämning krävs.
Formateringsändringar är strikt kosmetiska: normalisering av skiljetecken, rubriknivåer och blanksteg. Målnummer, domstolsnamn, parternas namn, artikeltext och allt väsentligt juridiskt innehåll bevaras exakt så som det mottagits. Originalfilen sparas alltid som referens.
En användare klistrar in flera kapitel ur 民法典 i chatten. Färdigheten Legal Text Format identifierar lagens struktur, omsluter varje kapitel med ##, fetstilsmarkerar varje 第X条, normaliserar mellanslag och sparar raw.md samt formatted.md i en tidsstämplad arkivmapp — redo att importera till en kunskapsbas.
En juridisk forskare hämtar en WeChat-artikel som innehåller 10 modellfall från Högsta domstolen. Färdigheten Legal Text Format tar bort artikelns inledning, författarpresentation och avslutande reklaminnehåll, tillämpar sedan en konsekvent ##/###-rubrikhierarki och kinesisk interpunktion i alla 10 fall, vilket resulterar i ett rent referensdokument.
En juriststudent bearbetar regelbundet domstolsbeslut för studier. Varje formaterad fil hamnar i sin egen datumbaserad arkivkatalog med ett metadatahuvud som inkluderar käll-URL:en (när den tillhandahålls av en hämtningsfunktion), tidsstämpel för bearbetning och dokumenttyp — vilket gör biblioteket enkelt att söka i och citera.
Med wechat-article-fetch installerat anger en användare en länk till ett WeChat-offentligt konto. Hämtningsfärdigheten hämtar artikeln och utlöser automatiskt Legal Text Format, som formaterar och arkiverar resultatet utan någon ytterligare användarinmatning — hela pipelinen körs som en enda förfrågan.
npx clawhub@latest install legal-text-formatnpx clawhub@latest install legal-text-formatLogga in för att skriva en recension
Inga recensioner ännu. Var den första att dela din upplevelse!