들어가기 전에
생성형 AI 모델을 사용하는 독특한 방법 중 하나는 긴 문서를 스캔하고 그에 따라 프롬프트를 제공하는 것입니다. 구글 드라이브(Google Drive)에서 제미니(Gemini)를 사용하여 PDF와 대화하는 방법을 소개합니다.
권현욱(엑셀러) | 아이엑셀러 닷컴 대표 · Microsoft MVP · 엑셀 솔루션 프로바이더 · 작가
![](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.
- 원문: You Can Now Chat With Your PDFs in Google Drive — Here’s How
- URL: https://www.howtogeek.com/chat-with-your-pdfs-in-google-drive/
왜 PDF로 채팅해야 하나요?
챗봇에게 무엇이든 물어볼 수 있으며, 제공한 PDF에서 가져온 구체적이고 정확한 정보를 제공합니다. 예를 들어 교과서를 주고 챗봇에게 챕터 요약, 도표 설명, 문제 풀이, 표 그리기, 치트 시트 만들기, 학습 계획 설계, 플래시카드 만들기 등을 요청할 수 있습니다. 심지어 연습 문제를 만들어 달라고 요청할 수도 있습니다. 챗봇은 튜터처럼 교과서에서 배운 내용을 가르쳐 줄 수 있습니다. 가능성은 무궁무진합니다.
공상 과학 소설에서나 나올 법한 이야기처럼 느껴지는 이유는 이 봇의 실력이 놀라울 정도로 뛰어나기 때문입니다. PDF로 채팅할 때 봇은 정보를 조작할 가능성이 적으며, 언제든지 페이지 번호를 알려달라고 요청하여 세부 정보를 확인할 수 있습니다.
일반적으로 이러한 봇은 대용량 PDF 파일은 잘 처리하지 못합니다. 파일 크기에 제한이 있거나 페이월로 잠겨 있기 때문입니다. 대용량 파일 업로드를 허용하더라도 몇 번의 텍스트 입력 후에는 문맥을 잃을 수 있습니다. 이는 대규모 언어 모델로 구동되는 봇이 대화의 '맥락'을 유지하기 위해 토큰이라는 것에 의존하기 때문입니다. 토큰은 대략 4자 정도의 텍스트로 구성된 단위입니다. AI 봇이 사용할 수 있는 토큰의 수는 제한되어 있습니다.
일반적으로 봇이 지원하는 토큰이 많을수록 맥락을 잃지 않고 진행 중인 대화를 더 오래 '기억'할 수 있습니다. 봇이 컨텍스트를 잃으면 이전 대화를 '잊어버리므로' 동일한 정보를 처음부터 다시 입력해야 합니다. 그리고 문서가 길수록 그 시점에 더 빨리 도달할 수 있습니다.
Google의 Gemini는 문서 분석 컨텍스트 창에 약 1백만 개의 토큰을 지원하기 때문에 컨텍스트를 쉽게 잃지 않습니다. Google에 따르면 다른 어떤 상용 봇보다 우수하다고 합니다. 긴 문서로 작업하는 경우 Gemini가 ChatGPT보다 더 나은 작업을 수행할 수 있습니다.
Google 드라이브와 통합된 Gemini는 제가 찾은 PDF 작업에 가장 적합한 방법입니다. Gemini에게 PDF에 대해 질문하고, PDF를 기반으로 콘텐츠를 생성하도록 요청하거나, 더 나은 컨텍스트를 구축하기 위해 PDF를 Google 드라이브의 다른 파일과 결합할 수 있습니다. 여기서는 PDF라고 말했지만 채팅은 Google 문서를 포함한 모든 문서 유형에서 작동합니다.
AI 챗봇은 놀랍도록 영리한 기술이지만, 지어내거나 잘못된 정보를 뱉어내기도 합니다. 따라서 챗봇에게 재정, 법률, 의료 관련 조언을 구해서는 안 됩니다. Google은 Gemini로부터 전문적인 조언을 받지 말 것을 경고합니다. 민감한 PDF(예: 의료 기록 또는 은행 정보)를 이러한 서비스에 업로드하는 것도 권장하지 않습니다.
강력한 Google 드라이브의 Gemini
어떤 종류의 PDF로 작업하든 상관없습니다. Gemini는 스캔한 PDF와 길고 복잡한 PDF를 정말 잘 처리합니다. 심지어 악보 PDF를 보냈는데도 그 내용을 이해하고 설명해 주기도 합니다. 복잡한 서식과 이미지도 문제가 없었습니다.
물론 악보에 대한 모든 질문에 답을 해준다는 것은 아니며, 가끔 “아직 배우는 중이라 도와드릴 수 없습니다”라는 답변을 받을 수도 있지만 놀라울 정도로 잘 해줍니다.
Google 드라이브용 Gemini는 프리미엄 Google 계정에 번들로 제공됩니다. 개인 계정에서 무료로 사용하려면 Google Workspace Labs를 활성화해야 합니다. Google은 Workspace Labs를 초대 전용 시스템으로 잠궜기 때문에 Google에서 베타 테스트 프로그램에 참여하도록 초대를 받아야만 활성화할 수 있습니다. Google 문서나 다른 Workspace 앱에서 AI를 사용 설정하라는 초대를 보셨을 수도 있습니다. 어디서나 Labs를 활성화하면 Google 드라이브에서도 즉시 Gemini를 볼 수 있습니다.
모바일 앱에는 이 기능이 없습니다. Google 드라이브 앱 대신 Google Workspaces 확장 프로그램을 사용하도록 설정한 Gemini Android 앱을 사용할 수 있습니다. 하지만 이는 임시방편일 뿐이며 제대로 작동하지 않습니다. 최상의 환경을 위해서는 데스크톱 웹 브라우저에서 Google 드라이브에 로그인하세요.
Google 드라이브의 Gemini는 7가지 언어(스페인어, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어)를 지원합니다.
Gemini에서 PDF로 채팅하는 방법
Gemini에서 PDF에 액세스하는 방법은 두 가지가 있습니다. Google 드라이브에서 Gemini 버튼(상단 모서리에 있는 반짝이는 아이콘)을 클릭합니다. 메시지를 묻는 채팅 상자가 열립니다. 여기에 “@”를 입력한 다음 PDF 파일 이름을 입력합니다. 입력할 때 Gemini가 자동 완성 제안을 제공합니다. 올바른 파일을 선택했으면 질문이나 프롬프트를 입력하고 전송합니다.
![](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
또는 파일을 우클릭하고 단축 메뉴에서 [Ask Gemini]를 선택할 수도 있습니다. Gemini가 “이 파일에 대해 알려주세요”라는 메시지와 함께 파일 이름을 자동 입력합니다. 그러면 PDF에 대한 자세한 개요가 생성됩니다. PDF가 길면 길고 자세한 요약이 표시됩니다. 파일이 아직 Google 드라이브에 없는 경우 컴퓨터 저장소에서 파일을 끌어다 놓아야 합니다.
추가 컨텍스트를 위해 다른 파일(PDF일 필요는 없음)을 가져와야 하는 경우 “@”를 다시 입력한 다음 파일 이름을 Gemini에 입력합니다. 각 파일에는 고유한 칩이 있어야 합니다.
![](http://t1.daumcdn.net/tistory_admin/static/images/no-image-v1.png)
여기에서 모든 쿼리 또는 프롬프트에 대한 후속 조치를 취할 수 있습니다. Gemini가 컨텍스트를 잃은 경우 파일 이름 뒤에 “@”를 다시 입력하면 봇을 다시 정상으로 되돌릴 수 있습니다. 또한 Gemini의 응답 하단에는 소스 탭이 있습니다. 작업하는 파일 수에 따라 하나의 소스 또는 여러 개의 소스를 가질 수 있습니다.
Google 드라이브에서 Gemini 사용해 보기
실제 사례를 통해 이 모든 것이 어떤 모습인지 살펴보겠습니다. 약 50MB에 달하는 400페이지 분량의 생물학 교과서에 대한 질문으로 Gemini와 대화를 시작했습니다. Gemini에게 한 부분을 가르쳐 달라고 요청하자 제미니는 전체 내용을 분석해 주었습니다.
![](https://blog.kakaocdn.net/dn/bShhN3/btsLj3XshDV/CRbeSu7TYEsLtvei1YrnpK/img.png)
이어서 더 많은 질문을 했더니 훌륭하게 답변해 주었습니다. 저는 더 명확하게 정보를 표로 정리해 달라고 요청했습니다. 그것도 훌륭하게 해냈어요. 심지어 페이지 번호와 그림 번호를 지정하기만 하면 그래프와 도표를 설명해 달라고 요청하기도 했습니다. 제가 필요한 것을 정확히 찾아내어 상세하게 설명해 주었습니다. 플래시카드와 모의 퀴즈를 요청하면서 대화를 마무리했습니다. 둘 다 도움이 되고 오류도 없는 것 같았습니다.
![](https://blog.kakaocdn.net/dn/b6ep2K/btsLjVkX0gI/TIjJTGnJl8n4Oo4W2syfY0/img.png)
마치며
Google 드라이브의 Gemini는 PDF를 훌륭하게 지원합니다. 가장 좋은 점은 여러 개의 파일을 업로드하거나 컨텍스트를 잃을 염려가 없다는 점입니다. PDF뿐만 아니라 다른 문서 유형에서도 잘 작동합니다. Google 문서 도구로 작업한 적이 있다면 이제 Gemini를 사용해 전체 라이브러리를 검색하고 상호 작용할 수 있습니다.
'IT Info' 카테고리의 다른 글
Windows 11 PC에서 시간을 절약하는 10가지 방법 (2) | 2025.01.31 |
---|---|
구글 시트 입문자 가이드 (0) | 2025.01.30 |
YouTube를 더욱 효과적으로 활용하는 15가지 팁과 트릭 (2) | 2025.01.28 |
큰 파일을 여러 개의 작은 파일로 분할하고 합치는 방법 (2) | 2025.01.27 |
Windows에서 God Mode를 설정하는 방법 (2) | 2025.01.26 |