들어가기 전에비정형(unstructured)이라는 것은 구조화되어 있지 않다는 뜻입니다. 한 페이지에 표가 있고, 다른 페이지에는 두 개의 표가 있거나 아예 없을 수도 있습니다. 혹은 이 페이지는 단일 열 레이아웃인데, 저 페이지는 2열, 또 저 페이지는 3열 레이아웃인 PDF를 떠올려 보세요. 이런 구조화되지 않은 PDF 파일에서 콘텐츠를 추출하는 방법을 소개합니다.권현욱(엑셀러) | 아이엑셀러 닷컴 대표 · Microsoft Excel MVP · Excel 솔루션 프로바이더 · 작가 ※ 이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.원문: Unstructured PDF Text ExtractionURL: https://medium.com..