PDF 압축 스캔 문서 기술
스캔 PDF vs 텍스트 PDF: 압축 차이점 이해하기
스캔 PDF와 텍스트 기반 PDF의 압축 방식 차이를 알아보고, 각 유형에 맞는 최적의 압축 전략을 배워보세요.
SecureCompress 팀
• PDF 압축 결과는 파일 유형에 따라 크게 달라집니다. 스캔 PDF와 텍스트 기반 PDF는 완전히 다른 방식으로 압축됩니다.
두 가지 PDF 유형
스캔 PDF
- 종이 문서를 스캔하여 생성
- 각 페이지가 이미지로 저장
- 파일 크기가 큼 (페이지당 1-5MB)
- OCR 없이는 텍스트 검색 불가
텍스트 기반 PDF
- 디지털로 생성 (Word, 웹 등)
- 실제 텍스트 데이터 포함
- 파일 크기가 작음
- 텍스트 검색 및 복사 가능
압축 원리의 차이
스캔 PDF 압축
스캔 PDF는 본질적으로 이미지 모음입니다.
압축 방법:
- 이미지 해상도 감소 (DPI 낮추기)
- JPEG 품질 조절
- 색상 깊이 감소 (컬러 → 흑백)
- 이미지 포맷 최적화
압축률: 50-90% 감소 가능
텍스트 기반 PDF 압축
텍스트 PDF는 이미 효율적으로 저장되어 있습니다.
압축 방법:
- 폰트 서브셋팅
- 메타데이터 제거
- 스트림 압축 최적화
- 중복 객체 제거
압축률: 10-30% 감소 (제한적)
실제 압축 결과 비교
| 원본 유형 | 원본 크기 | 압축 후 | 감소율 |
|---|---|---|---|
| 스캔 PDF (컬러) | 50MB | 10MB | 80% |
| 스캔 PDF (흑백) | 30MB | 5MB | 83% |
| 텍스트 PDF | 5MB | 4MB | 20% |
| 혼합 PDF | 20MB | 8MB | 60% |
스캔 PDF 최적화 전략
1. 해상도 조절
- 원본: 300-600 DPI
- 권장: 150-200 DPI (대부분의 용도에 충분)
- 최소: 100 DPI (읽기 어려울 수 있음)
2. 색상 모드 선택
- 컬러: 사진, 차트가 있는 문서
- 그레이스케일: 일반 문서
- 흑백: 텍스트만 있는 문서
3. JPEG 품질 설정
- 고품질: 80-90% (큰 파일)
- 중간: 60-70% (균형)
- 저품질: 40-50% (작은 파일, 품질 저하)
텍스트 PDF 최적화 전략
1. 폰트 최적화
- 사용하지 않는 폰트 제거
- 폰트 서브셋팅 적용
- 시스템 폰트로 대체 고려
2. 이미지 최적화
- 포함된 이미지 압축
- 불필요한 이미지 제거
- 적절한 해상도 사용
3. 메타데이터 정리
- 편집 기록 제거
- 불필요한 주석 삭제
- 숨겨진 레이어 제거
SecureCompress의 자동 최적화
SecureCompress는 PDF 유형을 자동으로 감지하고 최적의 압축 전략을 적용합니다.
스캔 PDF 감지 시
- 이미지 기반 압축 적용
- 해상도 자동 조절
- 품질과 크기 균형 최적화
텍스트 PDF 감지 시
- 구조 기반 최적화
- 폰트 및 메타데이터 정리
- 이미지만 선택적 압축
혼합 문서 처리
많은 PDF는 텍스트와 이미지가 혼합되어 있습니다.
최적화 접근법
- 이미지 페이지 식별
- 각 요소에 적절한 압축 적용
- 텍스트 품질 유지
- 이미지 크기 최적화
결론
PDF 압축 성공의 핵심은 파일 유형을 이해하는 것입니다. 스캔 PDF는 큰 압축률을 기대할 수 있지만, 텍스트 PDF는 제한적입니다. SecureCompress는 이러한 차이를 자동으로 처리하여 최적의 결과를 제공합니다.
SecureCompress 다운로드 — 스마트한 PDF 압축.