한글과컴퓨터의 한/글 문서 파일(.hwp)을 읽고 파싱하는 라이브러리입니다.
본 제품은 한글과컴퓨터의 한/글 문서 파일(.hwp) 공개 문서를 참고하여 개발하였습니다.
공개 문서 다운로드
이 프로젝트는 Bun 워크스페이스를 사용한 모노레포 구조입니다.
hwpjs/
├── crates/
│ └── hwp-core/ # 공유 Rust 라이브러리 (핵심 HWP 파싱 로직)
├── packages/
│ └── hwpjs/ # 멀티 플랫폼 패키지 (Node.js, Web, React Native)
├── examples/ # 사용 예제
│ ├── node/ # Node.js 예제
│ ├── web/ # Web 예제
│ ├── react-native/ # React Native 예제
│ └── cli/ # CLI 사용 예제
├── docs/ # 문서 사이트 (Rspress)
└── legacy/ # 기존 JavaScript 구현
- Rust: 핵심 로직 구현
- Craby: React Native 바인딩
- NAPI-RS: Node.js 네이티브 모듈
- Bun: 워크스페이스 관리
- Rspress: 문서 사이트
- sheetjs - CFB - Compound Binary File을 읽기 위한 플러그인
- pako - Compound Binary File에서 일부 압축 된 코드를 읽기 위한 플러그인(zlib)
mise를 사용하여 필요한 도구를 설치합니다:
mise installbun run test:rust- Rust 테스트 실행bun run test:node- Node.js 테스트 실행bun run test:e2e- E2E 테스트 실행bun run lint- 린트 검사bun run format- 코드 포맷팅bun run build- 전체 빌드
명령줄에서 직접 HWP 파일을 변환할 수 있습니다:
# 전역 설치
npm install -g @ohah/hwpjs
# JSON 변환
hwpjs to-json document.hwp -o output.json --pretty
# Markdown 변환
hwpjs to-markdown document.hwp -o output.md --include-images
# 파일 정보 확인
hwpjs info document.hwp
# 이미지 추출
hwpjs extract-images document.hwp -o ./images
# 배치 변환
hwpjs batch ./documents -o ./output --format json --recursive더 자세한 내용은 CLI 가이드를 참고하세요.
해당 깃허브에 남겨주세요.
이 프로젝트는 MIT 라이센스를 따릅니다.