Excel & IT Info

아이엑셀러 닷컴, 엑셀러TV

IT Info

책임감 있고 효과적으로 연구에 AI를 사용하는 5가지 방법

권현욱(엑셀러) 2024. 12. 30. 15:22
반응형

들어가기 전에

생성형 인공지능(AI)은 훌륭하지만 때로는 거짓말을 하고, 무언가를 만들어 내고, 꾸며낼 수 있습니다. 챗봇은 마치 모든 것을 알고 있다는 가정 하에 자신만만하게 대답하지만 그 대답은 완전히 틀릴 수 있습니다. AI의 거짓말을 잡아내고 AI의 결과에 의존하기 전에 사실 확인을 할 수 있는 5가지 방법을 소개합니다.

권현욱(엑셀러) | 아이엑셀러 닷컴 대표 · Microsoft MVP · 엑셀 솔루션 프로바이더 · 작가

이미지: 아이엑셀러 닷컴


이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.

  • 원문: How to use AI for research the right way - responsibly and effectively
  • URL: https://www.zdnet.com/article/how-to-use-ai-for-research-the-right-way-responsibly-and-effectively/


1. 참고 문헌 및 출처 요청하기

이전에 ChatGPT가 출처와 인용문을 제공하도록 하는 방법에 대한 가이드를 작성한 적이 있습니다. 다행히도 ChatGPT는 특히 월 20달러 버전에 포함된 GPT-4o LLM과 웹 검색 기능을 통해 출처 인용 기능이 점점 개선되고 있습니다.

하지만 ChatGPT가 항상 이러한 소스를 자발적으로 제공하는 것은 아닙니다. 조사를 할 때는 항상, 항상, 출처를 요청하세요. 그런 다음 소스를 테스트하고 실제로 존재하는지 확인하세요. 필자의 경험상 ChatGPT는 찾고 있던 내용에 완벽해 보이는 소스를 여러 번 인용했습니다. 유일한 문제는 제목으로 명명된 소스를 클릭하거나 검색한 후 전체 소스가 조작된 것을 발견했다는 것이었습니다.

심지어 ChatGPT는 실제 학술 저널을 선택하고, 저자 이름을 지어낸 다음, 그럴듯하게 들리는 제목을 기사에 붙였습니다. 그런 출처를 재확인하지 않고 작업에 포함시켰다면 얼마나 큰 피해를 입었을지 생각하는 것만으로도 아찔합니다. 따라서 출처를 요청하고, 그 출처를 확인한 다음, AI가 엉뚱한 답변을 제공하면 이를 바로잡아야 합니다.

2. AI에게 '작업한 내용을 보여달라'고 말하기

ChatGPT를 탐색하던 초기에 필자는 이 도구에 지역 정비사를 찾는 데 도움을 요청했습니다. 댓글에 대한 감정 분석을 위해 Yelp와 Google 리뷰로 보냈습니다. 당시 이 도구는 해당 사이트에 접속하여 유용한 정보를 제공했습니다.

최근에 다시 테스트를 시도했고 또 다른 정비사 순위를 받았습니다. 실제로 “독립 자동차 수리점에 대한 Yelp 및 Google 리뷰를 종합적으로 분석한 결과...”라고 알려주었습니다.


필자가 작업을 보여달라고 요청하자 이 도구는 다시 Yelp와 Google 리뷰를 살펴봤다고 말했습니다. 하지만 “작업 결과 표시” 응답에서 이 도구는 분석한 리뷰의 출처도 표시했습니다. 그 소스는 Birdeye Reviews라는 사이트였습니다.

필자는 Birdeye Reviews에 대해 나쁜 감정은 없습니다. 사용해 본 적도 없습니다. 하지만 그게 중요한 게 아닙니다. 요점은 ChatGPT가 Yelp와 Google 리뷰를 기반으로 정보를 생성했다고 말한 것입니다.

“당신의 작품을 보여주세요"는 강력한 프롬프트입니다. AI가 결과를 제공하기 위해 사용한 추론 과정에 대한 모든 종류의 흥미로운 정보를 발견할 수 있습니다.

3. 관련 질문에 대한 AI의 응답을 교차 검증하기

이 프로세스를 통해 사용자와 AI가 한 주제를 심층적으로 탐색하여 챗봇의 답변이 논리적으로 일관되고 맥락과 연관성이 있는지 확인할 수 있습니다. 기존 연구 및 엔지니어링 분야에서는 올바른 방향으로 나아가고 있는지 확인하기 위해 이 접근 방식을 많이 사용합니다. AI에도 적용할 수 있습니다.

 

자동차 타이어에 대해 글을 쓴다고 가정해 보겠습니다. “자동차 타이어에는 어떤 재료가 사용되나요?"라고 질문할 수 있습니다. 예상할 수 있는 대답은 “고무”입니다. 하지만 고무는 한 가지 물질만이 아닙니다. 나무에서 추출한 고무, 합성 고무, 고무의 유연성과 강도를 가지고 있지만 고무가 전혀 들어 있지 않은 소재가 있습니다.

예를 들어 고무와 TPU(열가소성 폴리우레탄)는 모두 유연하고 고무와 같은 느낌을 줍니다. 하지만 합성 고무는 석유 기반 모노머로 만들어지고 TPU는 열가소성 엘라스토머로 만들어집니다.

AI에게 “자동차 타이어에 어떤 종류의 고무가 사용되나요?” 또는 “자동차 타이어에 진짜 고무가 여전히 사용되나요?”라고 질문할 수 있습니다. 그러면 자동차 타이어에는 여러 종류의 고무가 혼합되어 사용된다는 답변이 나올 것입니다. “자동차에는 또 어디에 고무가 사용되나요?” 또는 ‘레고 자동차 타이어에는 어떤 종류의 고무가 사용되나요?’라고 질문하여 토끼굴을 더 깊이 파고들 수 있습니다.

이 연습의 요점은 논문에 있는 모든 답변을 사용하는 것이 아니라 AI가 이러한 종류의 질문을 어떻게 처리하는지, 그리고 완전히 실마리를 잃지 않는지 탐구하는 것입니다.

 

또한 ChatGPT는 세션이 진행되는 동안 지식을 유지하므로, 더 많이 질문하고 특정 주제에 대해 더 깊이 파고들수록 찾고자 하는 지식 영역의 맥락에 머물도록 AI를 더 많이 훈련시킬 수 있습니다. 이러한 접근 방식은 AI가 스스로 판단하는 것을 방지하고 정확한 답변을 얻을 확률을 높이는 데 도움이 됩니다.

4. 최근 사건이나 시간에 민감한 정보에 대해 질문하기

많은 챗봇에는 지식창고 마감일이 있습니다. 무료 버전의 ChatGPT의 지식 기반 마감일은 2023년 10월로, 이 날짜 이후에 일어난 일은 AI가 알 수 없습니다.

역시 2023년 10월이 지식 마감일인 ChatGPT 플러스는 웹에서도 정보에 액세스할 수 있습니다. 이 기능을 통해 훨씬 더 정확한 정보를 얻을 수 있습니다. 무료 버전의 ChatGPT도 웹에 액세스할 수 있지만 보다 “제한된” 방식으로 액세스할 수 있습니다. 일반적으로 OpenAI는 무료 버전에 대해 설명할 때 “제한적”이라는 의미를 명시하지 않습니다. 하지만 일반적으로 세션당 쿼리 수가 적고, 제공되는 리소스 수가 적으며, 일부 기능이 간헐적으로 작동하는 것을 의미한다고 생각할 수 있습니다.

 

예를 들어, 무료 버전의 ChatGPT에 NATO 회원국 목록을 요청했을 때 31개 국가 목록이 반환되었습니다. 하지만 ChatGPT 플러스 버전에 NATO 회원국 목록을 요청하자 32개 국가 목록이 반환되었습니다. 그 이유는 스웨덴이 2024년 3월에 공식적으로 NATO에 가입했기 때문입니다.

챗봇은 일반적으로 요청하면 마감일을 알려줍니다. 하지만 플러스에서 웹 검색과 같은 추가 기능이 있기 때문에 인공지능이 최신 정보를 가지고 있을 때만 알 수 있는 이벤트에 대해 물어보는 것이 가장 좋습니다.

여기에도 적용하는 요령이 있습니다. 몇 분 후, 저는 무료 버전의 ChatGPT에 “웹을 사용하여 현재 NATO 국가의 회원국이 누구인지 조회할 수 있나요?”라고 질문했습니다. 분명히 “웹을 사용하라”고 말했죠. 그리고 최신 답변을 받았습니다. 따라서 무료 버전을 사용하는 경우 더 나은 답변을 얻기 위해 어디에서 정보를 찾아야 하는지 코칭하는 것이 좋습니다.

이러한 접근 방식은 AI의 지식 범위를 확인하고 최신 정보를 얻고 있는지, 아니면 상당히 오래된 마감일로 인해 누락된 지식을 설명해야 하는지 판단하는 데 도움이 됩니다.

5. 후속 질문을 하고 반복적으로 쿼리 구체화하기

필자는 프로그래밍을 위해 ChatGPT를 사용할 때 이 접근 방식을 사용합니다. 간단한 쿼리로 시작하여 기본 코드가 나올 때까지 쿼리를 구체화하고 명확히 합니다. 이 접근 방식이 효과가 있으면 코드에 원하는 내용을 다른 문장이나 세부 사항을 추가합니다. 코딩 세션이라기보다는 대화처럼 느껴지는 여러 번의 상호작용 끝에 유용한 코드가 나오는 경우가 많습니다.

 

코딩을 하지 않더라도 이 접근 방식을 사용할 수 있습니다. 클라우드 서비스와 관련된 프로젝트를 진행하고 있다고 가정해 보겠습니다. AI에게 “다양한 유형의 클라우드 서비스에 대해 설명해 줄 수 있나요?”라고 질문할 수 있습니다.

이 예에서는 이메일, 웹 호스팅, CRM 및 기타 서비스형 소프트웨어 범주와 같은 서비스에 대한 답변이 나올 것으로 예상할 수 있습니다. 하지만 AI는 SaaS(서비스형 소프트웨어), PaaS(서비스형 플랫폼), IaaS(서비스형 인프라)에 대한 설명으로 응답했습니다.

이제 이 질문을 해석할 수 있는 몇 가지 방법이 있다는 것을 알았으므로 “SaaS 범주에 속하는 클라우드 서비스만을 중심으로 다양한 유형의 클라우드 서비스에 대해 설명하세요.”와 같은 후속 질문을 할 수 있습니다.

“이러한 SaaS 카테고리를 기준으로 각 카테고리에서 가장 인기 있는 상용 서비스 세 가지를 나열하고 각각의 장단점을 설명하세요."와 같은 질문으로 후속 질문을 할 수도 있습니다.

이렇게 하면 각 서비스의 특징과 함께 훨씬 더 자세한 설명을 얻을 수 있습니다. 하지만 한 단계 더 나아가 접근 방식을 구체화해 보겠습니다. 이 시나리오의 AI는 각 서비스에 대한 설명을 제공했지만, 각 서비스가 어떻게 다른지 알고 싶다고 가정해 보겠습니다.

 

이 프롬프트에서와 같이 “비교”라는 단어를 추가하여 쿼리를 구체화할 수 있습니다: “이러한 SaaS 카테고리를 기준으로 각 카테고리에서 가장 인기 있는 상용 서비스 세 가지와 각각의 비교 강점 및 약점을 나열하세요."

 

마치며

이 테스트에서는 마지막으로 세분화하여 각각의 기능을 비교한 표를 만들었습니다. AI가 정보를 표로 반환하지 않는다면 제 보너스 팁은 AI에게 결과를 표로 표시해 달라고 요청하기만 하면 됩니다. 이 도구는 이 지시어로 작동할 때 종종 흥미로운 방식으로 답변을 리팩터링합니다.