PDF, 스캔 문서, DOCX 파일, 이미지에서 텍스트와 구조를 추출하여 요약, 검색 또는 후속 분석에 바로 활용할 수 있습니다.
npx clawhub@latest install ocr-docuOCR and Documents는 AI 어시스턴트가 born-digital PDF, 스캔된 종이 문서, DOCX 파일 등 다양한 문서 형식에서 사용 가능한 텍스트를 읽고 추출할 수 있는 기능을 제공합니다. 원시 텍스트, 구조화된 마크다운, 또는 인보이스나 보고서에서 특정 필드를 추출해야 하는 경우에도 이 스킬은 문서를 깔끔한 출력물로 전처리하여 다른 스킬과 워크플로우에서 활용할 수 있도록 합니다.
이 스킬은 문서 유형에 따라 적절한 추출 전략을 선택합니다. 텍스트 기반 PDF는 PyMuPDF 또는 pdfminer와 같은 라이브러리를 사용하여 빠르게 처리됩니다. 스캔 문서 및 이미지가 많은 파일은 OCR 파이프라인(예: Tesseract 또는 호환 OCR 서비스)을 통해 처리됩니다. DOCX 파일은 python-docx를 사용하여 파싱됩니다. 추출된 콘텐츠는 일반 텍스트 또는 구조화된 마크다운으로 정규화되어 요약, 인덱싱, 아카이빙 또는 후속 스킬에 의한 추가 분석에 바로 사용할 수 있습니다.
지원해야 하는 문서 유형에 따라 Python과 관련 라이브러리(PyMuPDF, Tesseract 및/또는 python-docx)가 환경에 설치되어 있는지 확인하십시오. 환경이 준비되면 스킬을 MyClaw 어시스턴트 인스턴스에 연결하십시오. 터미널에서 npx clawhub@latest install ocr-and-documents를 실행하거나, 이 페이지 상단의 설치 버튼을 클릭하여 원클릭으로 설치하십시오.
npx clawhub@latest install ocr-docunpx clawhub@latest install ocr-docu리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!