Converta textos jurídicos brutos em chinês — estatutos ou casos judiciais — em Markdown limpo e estruturado, eliminando ruídos promocionais enquanto preserva cada palavra de conteúdo relevante.
npx clawhub@latest install legal-text-formatLegal Text Format é uma skill de formatação e limpeza desenvolvida especificamente para documentos jurídicos em chinês. Ela aceita texto normativo bruto (ex.: Código Civil, Lei Penal) ou documentos de casos (ex.: casos modelo do Supremo Tribunal, decisões judiciais) e gera Markdown bem estruturado com hierarquia de títulos correta, pontuação unificada e todo o conteúdo promocional ou irrelevante removido.
A skill lida automaticamente com dois tipos distintos de documentos: estatutos legais (estrutura 章/条 com números de artigo em negrito) e casos jurídicos (título do caso, número do processo, fatos, decisão e relevância). Cada resultado de formatação é arquivado localmente junto com o input original, fornecendo um registro verificável de antes/depois.
Importante: Esta skill é apenas um formatador — ela não busca conteúdo a partir de URLs. A recuperação de artigos da web ou do WeChat deve ser tratada por uma skill de busca dedicada (ex.: wechat-article-fetch), que pode se encadear diretamente nesta skill.
wechat-article-fetch) recuperou um artigo jurídico do WeChat e precisa passá-lo para formatação — esta skill aceita esse caminho de arquivo diretamente.A skill utiliza um prompt de LLM para classificar o texto recebido como lei ou caso jurídico antes de aplicar o conjunto de regras de formatação adequado. Isso significa que você não precisa especificar o tipo — a skill se adapta automaticamente com base em sinais estruturais como títulos de capítulos, números de artigos ou padrões de numeração de processos.
Para textos estatutários, capítulos recebem títulos com ##, cada artigo (第X条) é destacado em negrito, linhas em branco são adicionadas entre os artigos, e quaisquer quebras de linha finais sem pontuação de encerramento são removidas. Todo o conteúdo substantivo é preservado literalmente — nenhuma cláusula é jamais truncada.
Para documentos de casos, cada título de caso ou número de sequência recebe um cabeçalho ##, as subseções (fatos, decisão, relevância) recebem cabeçalhos ###, a pontuação em inglês é substituída pelos equivalentes em chinês e os números são normalizados para meia largura. Textos introdutórios, biografias de autores, rodapés, promoções de QR code e blocos de artigos recomendados são removidos automaticamente.
Cada execução salva tanto a entrada bruta quanto a saída formatada em um subdiretório com registro de data e hora dentro de archive/. Os arquivos seguem uma convenção de nomenclatura previsível (YYYYMMDD_主题_raw.md / _formatted.md), facilitando a auditoria de alterações ou a recuperação do texto original. Um meta.json opcional registra os metadados da execução.
Quando wechat-article-fetch (ou outra skill de busca) detecta conteúdo jurídico e esta skill está instalada, ela pode passar um caminho de arquivo diretamente como entrada. A skill lê o Markdown salvo, executa o pipeline completo de formatação e grava os resultados em seu próprio diretório archive/ — sem necessidade de transferência manual.
As alterações de formatação são estritamente cosméticas: normalização de pontuação, níveis de títulos e espaçamento. Números de processo, nomes de tribunais, nomes das partes, texto de artigos e todo o conteúdo jurídico substantivo são preservados exatamente como recebidos. O arquivo original é sempre mantido como referência.
Um usuário copia vários capítulos do 民法典 no chat. A skill detecta a estrutura do estatuto, envolve cada capítulo em ##, coloca em negrito cada 第X条, normaliza os espaçamentos e salva raw.md e formatted.md em uma pasta de arquivo com registro de data e hora — prontos para importação em uma base de conhecimento.
Um pesquisador jurídico obtém um artigo do WeChat contendo 10 casos modelo do Supremo Tribunal. A skill remove a introdução do artigo, a biografia do autor e o conteúdo promocional no final, depois aplica uma hierarquia consistente de cabeçalhos ##/### e pontuação chinesa em todos os 10 casos, produzindo um documento de referência limpo.
Um estudante de direito processa regularmente decisões judiciais para estudo. Cada arquivo formatado é salvo em seu próprio diretório de arquivo com data, contendo um cabeçalho de metadados que inclui a URL de origem (quando fornecida por uma skill de fetch), o timestamp de processamento e o tipo de documento — tornando a biblioteca fácil de pesquisar e citar.
Com o wechat-article-fetch instalado, o usuário fornece um link de conta pública do WeChat. A skill de busca recupera o artigo e aciona automaticamente o Legal Text Format, que formata e arquiva o resultado sem nenhuma entrada adicional do usuário — todo o pipeline é executado como uma única requisição.
npx clawhub@latest install legal-text-formatnpx clawhub@latest install legal-text-formatFaça login para escrever uma avaliação
Nenhuma avaliação ainda. Seja o primeiro a compartilhar sua experiência!