https://adobe.ly/3UhBonG

어도비 공식 PDF 용량 압축 웹 사이트

PDF 파일이 최적화 되어 있지 않은 경우 용량이 많게는 2~3배는 차이가 날 수 있다.
온라인에서 무료로 4~5초 이내에 PDF 파일을 최적화 할 수 있다.
해당 웹 사이트에서는 짧은 시간 내에 PDF 파일을 압축하여 용량을 간편하게 줄일 수 있다.

실제로 6MB 짜리 PDF 파일을 1.8MB에서 4.3MB 사이의 용량으로 줄일 수 있다. 
이는 PDF의 파일이 클 수록 더욱 더 큰 효율성을 준다.
본 사이트는 Adobe 서버에서 안전하게 처리되며 파일은 압축 이후 자동 삭제된다고 안내된다.



아래는 PDF 압축 원리에 대해 간단하게 찾아 본 결과이다.


텍스트 압축
PDF 파일 내의 텍스트 데이터는 Flate 압축을 사용하여 압축한다. 이 방식은 LZ77과 허프만 코딩을 결합한 DEFLATE 알고리즘을 기반으로 한다. 먼저 텍스트 스트림에서 반복되는 문자열을 찾고, 이러한 반복되는 문자열을 참조로 대체하여 데이터 크기를 줄인다. 이후 허프만 코딩을 사용하여 데이터의 빈도수를 기반으로 최적화된 이진 트리를 만들어 데이터를 압축한다.

이미지 압축
PDF 파일에 포함된 이미지 데이터는 다양한 압축 방식을 사용하여 압축한다. 비손실 압축 방식으로는 CCITT, Flate, JBIG2 등을 사용한다. 이 방식들은 이미지의 품질을 유지하면서 파일 크기를 줄인다. 손실 압축 방식으로는 JPEG, JPEG 2000 등을 사용하여 이미지 데이터를 압축한다. 이 방식들은 이미지의 일부 정보를 손실시키면서도 시각적으로 큰 차이가 없도록 하여 파일 크기를 크게 줄인다.

폰트 압축
PDF 파일 내에 포함된 폰트 데이터는 서브셋(subset) 폰트 기술을 사용하여 압축한다. 이는 실제로 문서에서 사용된 글리프만 포함하여 폰트 데이터를 줄이는 방식이다. 또한, CIDFonts와 Type1 폰트의 압축을 통해 파일 크기를 줄인다. 이는 사용되지 않는 글리프를 제거하고, 필요한 데이터만 포함시켜 효율적으로 폰트를 관리한다.

 

구조 압축
PDF 문서의 구조 데이터를 압축하기 위한 방법이다. XRef 테이블을 최적화하여 문서 내의 불필요한 객체를 제거하고, 중복된 데이터를 합친다. 이를 통해 문서의 구조가 효율적으로 관리되며, 전체 파일 크기가 줄어든다.

스트림 객체 압축
PDF의 콘텐츠 스트림 객체는 Flate 압축 또는 LZW 압축을 사용하여 압축한다. 이를 통해 텍스트와 이미지 데이터를 포함하는 페이지 스트림이 압축된다. Flate 압축은 앞서 설명한 DEFLATE 알고리즘을 사용하며, LZW 압축은 Lempel-Ziv-Welch 알고리즘을 사용하여 데이터를 압축한다.

 

마지막으로, 메타데이터 압축
PDF 파일 내의 메타데이터는 XML 기반의 메타데이터를 최적화하여 압축한다. 불필요한 공백이나 중복된 데이터를 제거하고, 필요한 정보만 남겨둔다. 이를 통해 메타데이터의 크기를 줄이고, 전체 파일 크기를 줄인다.

이와 같이 PDF 압축 알고리즘은 텍스트, 이미지, 폰트, 구조, 스트림 객체, 메타데이터 등을 다양한 방식으로 압축하여 파일 크기를 줄인다.


여튼 위의 공식 사이트를 이용하면 쉽게 압축 알고리즘을 적용할 수 있으니, 유용하게 사용하길 바란다.

+ Recent posts

hihihello