들어가기 전에
챗GPT에는 훌륭한 차트 작성 도구가 있습니다. 히스토그램과 히트맵부터 네트워크 다이어그램에 이르기까지 이 강력한 기능을 최대한 활용하는 방법을 소개합니다. 일부 기능은 ChatGPT 무료 버전의 GPT-4o에서도 사용할 수 있지만 고급 데이터 분석을 제대로 사용하려면 ChatGPT Plus 가입이 필요합니다.
※ 이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.
- 원문: How to use ChatGPT to make charts and tables with Advanced Data Analysis
- URL: https://www.zdnet.com/article/how-to-use-chatgpt-to-make-charts-and-tables-with-advanced-data-analysis/
챗GPT의 다양한 버전 이해
AI 챗봇의 기능이 끊임없이 진화하고 있습니다. 최근(2024년 5월 말) 오픈AI는 Mac 애플리케이션을 출시했으며 무료 및 유료 고객 모두에게 제공되는 GPT-4o LLM을 출시했습니다. 추가 가격 Plus 버전에 제공되는 GPT-4o 버전은 대화형 차트 기능과 세션당 엔진과 더 오랫동안 상호 작용할 수 있는 기능을 갖추고 있습니다.
하지만 그다지 많지는 않습니다. 필자의 무료 계정은 아직 GPT-4o를 제공하지 않습니다. 아직 모든 무료 계정에 출시되지 않았습니다. 유료 ChatGPT Plus 요금제는 Chrome 및 Safari에서 대화형 차트 기능을 제공하지만 Mac 앱에서는 제공하지 않습니다. GPT-4o가 표시되는 않는 경우라면 기다려야 합니다(오픈AI에서 사용 범위 순차적 확대).
앞에서 ChatGPT 버전에 따라 어떤 차트 도구를 사용할 수 있는지에 대해 이야기했습니다. ChatGPT는 단순히 차트를 작성하는 도구 이상의 기능이 있습니다. ChatGPT를 생산적으로 사용하려면 다양한 버전의 기능을 이해할 필요가 있습니다.
- ChatGPT 무료 버전: 이 버전은 GPT-3.5 LLM(대형 언어 모델)을 사용했는데 이는 GPT-4 버전 만큼 성능이 좋지는 않습니다. 2024년 5월 현재 GPT-4o LLM은 일부 무료 사용자에게도 제공되며 시간이 지남에 따라 확대됩니다.
- ChatGPT Plus: ChatGPT Plus는 OpenAI의 완전한 기능을 갖춘 ChatGPT 상용 버전입니다. 현재 ChatGPT Plus는 세션당 GPT-3.5, GPT-4 및 GPT-4o의 세 가지 주요 선택 옵션을 제공합니다. 예전에는 플러그인을 제공했지만 맞춤 GPT로 대체되었습니다.
- ChatGPT Enterprise: 고급 데이터 분석 및 플러그인은 기업 버전 에서도 사용할 수 있습니다 . Enterprise에 파일을 업로드할 수 있으며 해당 파일은 기밀로 유지됩니다. Enterprise는 더 큰 파일과 더 큰 응답을 허용하며 가격은 지정되지 않았습니다.
이제 GPT-4 및 GPT-4o 버전에는 DALL-E 3, Bing 웹 액세스 및 고급 데이터 분석이 포함됩니다. 일부 사용자는 웹 액세스에 Bing을 사용하는 데 어려움을 겪고 있다고 보고했습니다. 우리가 할 대부분의 작업은 고급 데이터 분석 구성 요소를 사용하는 것입니다. Bing 웹 액세스 없이도 GPT-4 및 4o는 이제 교육 데이터에 2023년 12월까지의 정보가 포함되어 있다고 알려져 있습니다.
여기서는 GPT-4 옵션의 고급 데이터 분석 구성 요소를 사용합니다. 이 도구는 다양한 파일 형식의 데이터 테이블을 가져옵니다. 가져온 데이터에 대한 크기 제한을 지정하지 않지만 상당히 큰 파일을 처리할 수 있지만 파일이 정의되지 않은 복잡성 수준을 초과하면 중단됩니다.
1. 기본 테이블 작성
예제를 만드는 것부터 시작해 보겠습니다. 인구 측면에서 상위 5개 도시를 대상으로 작업하겠습니다.
인구 기준으로 세계 상위 5개 도시를 나열해 보세요. 국가를 포함합니다.
필자는 ChatGPT의 무료 버전에 이 질문을 했고, 받은 답변은 다음과 같습니다.
해당 데이터를 테이블로 변환하는 것은 간단합니다. ChatGPT에 테이블을 원한다고 말하면 됩니다.
인구 기준으로 세계 상위 5개 도시를 표로 만들어 보세요. 국가를 포함합니다.
2. 테이블 작업
ChatGPT에 더 자세한 지침을 제공하여 테이블을 조작(manipulation)하고 사용자 정의할 수 있습니다. 이번에도 무료 버전을 사용하여 인구 수 필드를 추가하겠습니다. 물론 해당 데이터는 오래되었지만 어쨌든 표시됩니다.
인구 기준으로 세계 상위 5개 도시를 표로 만들어 보세요. 국가 및 인구 필드 포함
필드 순서, 단위 등 테이블에 대한 특정 세부정보를 지정할 수도 있습니다. 여기서는 먼저 나라를 옮기고 인구수를 압축합니다. 숫자를 표시하는 방법에 대한 예를 AI에 제공했습니다.
인구 기준으로 세계 상위 5개 도시를 표로 만들어 보세요. 국가 및 인구 필드를 포함합니다. 순위, 국가, 도시, 인구 순으로 필드를 표시합니다. 인구를 백만 단위(소수점 한 자리 포함)로 표시하므로 37,833,000은 37.8M으로 표시됩니다.
여기까지가 무료 버전으로 처리할 수 있는 영역입니다. 이제부터는 챗GPT Plus 버전을 사용합니다(월 20달러).
3. 막대 차트 만들기
고급 데이터 분석 기능이 활성화된 ChatGPT 플러스는 꺾은선형 차트, 막대 차트, 히스토그램, 파이 차트, 분산형 차트, 히트맵, 박스 플롯, 영역 차트, 버블 차트, 간트 차트, 파레토 차트, 네트워크 다이어그램, 산키 다이어그램, 초로플렉스 맵, 레이더 차트, 워드 클라우드, 트리맵, 3D 차트 등을 만들 수 있습니다. 이 예에서는 간단한 막대형 차트를 만들어 보겠습니다.
인구 기준 세계 상위 5개 도시 막대 차트 만들기
눈썰미가 좋은 분이라면 이전 표와 여기 결과 사이에 인구 수 차이가 있음을 눈치챘을 것입니다. 표에는 녹색 아이콘이 있고 이 그래프에는 보라색 아이콘이 있는 것을 볼 수 있습니다. GPT-3.5(무료 버전)에서 GPT-4(ChatGPT Plus)로 전환했습니다. 서로 다른 LLM이 조금씩 다른 데이터를 가지고 있다는 점이 흥미롭습니다. 이러한 차이 때문에 AI를 사용할 때 주의를 기울여야 하므로 작업을 다시 한 번 확인해야 합니다.
4. 데이터 업로드
고급 데이터 분석의 강력한 기능 중 하나는 데이터 집합을 업로드하는 기능입니다. 이 예에서는 Data.gov에서 인기 있는 아기 이름 데이터 집합을 다운로드했습니다. 2011년부터 2014년까지의 뉴욕시 아기 이름이 쉼표로 구분된 파일입니다. 10년이 지난 오래된 데이터이지만 재미있게 사용할 수 있습니다.
이 글에서 선택한 데이터 세트는 정부 사이트에서 쉽게 구할 수 있으므로 이 실험을 직접 복제할 수 있습니다. Data.gov에는 수많은 훌륭한 데이터 세트가 있지만, ChatGPT에서 사용하기에는 너무 큰 데이터 세트가 많다는 것을 알게 되었습니다. 이 데이터셋을 다운로드한 후 인종에 대한 정보도 포함되어 있어 동일한 데이터셋에서 여러 가지 차트를 실행할 수 있다는 사실을 깨달았습니다.
업로드 버튼을 클릭한 다음 가져오려는 데이터 파일을 알려줍니다. 파일 형식에 대해 더 많이 알 수 있도록 파일의 처음 다섯 줄을 보여달라고 요청했습니다.
5. 원형 차트 만들기
데이터 세트가 성별 이름을 어떻게 배포했는지 궁금했습니다. 첫 번째 프롬프트는 다음과 같습니다.
전체 데이터 세트의 백분율로 성별을 표시하는 원형 차트 만들기
결과는 다음과 같습니다.
녹색의 어두운 색조로 인해 숫자를 읽기가 어렵습니다. 다행히도 고급 데이터 분석에 다양한 색상을 사용하도록 지시할 수 있습니다. 성별에 대한 고정관념을 강화하지 않는 색상을 선택하는데 신중을 기했습니다.
전체 데이터 세트의 백분율로 성별을 표시하는 원형 차트를 만듭니다. 남성의 경우 연한 녹색을 사용하고 여성의 경우 중간 노란색을 사용합니다.
6. 정확성을 위해 데이터 정규화
앞서 살펴본 것처럼 수집된 데이터에는 인종이 포함됩니다. 2010년대 초 뉴욕에서 기록된 다양한 인종의 분포를 확인하는 방법은 다음과 같습니다.
원형 차트를 사용하여 데이터 세트의 민족 분포를 표시합니다. 밝은 색상만 사용하세요.
결과는 다음과 같습니다. 눈치채셨나요?
분명히 뉴욕은 데이터를 제대로 정규화하지 않았습니다. '백인 비 히스패닉'과 '백인 비 히스패닉'을 함께 사용하고, '흑인 비 히스패닉'과 '흑인 비 히스패닉'을 함께 사용하고, '아시아 태평양 섬 주민'과 '아시아 태평양 섬 주민'을 함께 사용했습니다. 이로 인해 데이터가 부정확하게 표현되었습니다.
ChatGPT의 한 가지 장점은 세션 내내 지침을 기억한다는 것입니다. 그래서 이 지시를 내릴 수 있었습니다.
다음 모든 요청에 대해 “WHITE NON HISPANIC”과 “WHITE NON HISP”를 함께 그룹화합니다. “흑인 비 히스패닉”과 “흑인 비 히스패닉”을 함께 그룹화합니다. “아시아 및 태평양 섬 주민”과 “아시아 및 태평양”을 그룹화합니다. 민족을 표시할 때는 두 민족 이름 중 더 긴 이름을 사용합니다.
챗GPT는 이렇게 응답했습니다.
동일한 프롬프트를 사용하여 차트를 다시 시도합니다.
원형 차트를 사용하여 데이터 세트의 민족 분포를 표시합니다. 밝은 색상만 사용하세요.
결과를 살펴볼 때는 부지런히 살펴봐야 합니다. 예를 들어, 인기 있는 아기 이름에 대한 요청에서 AI는 '매디슨'과 '매디슨'을 서로 다른 두 가지 이름으로 구분했습니다.
7. 차트 내보내기
하나의 프롬프트에서 복잡한 차트로 마무리해 보겠습니다. 다음은 프롬프트입니다.
각 민족에 대해 성별별로 하나씩 두 개의 원형 차트를 제시합니다. 각 원형 차트에는 해당 성별과 해당 민족의 상위 5개 아기 이름이 나열되어야 합니다. 밝은 색상만 사용하세요.
결과적으로 차트가 너무 작아서 읽을 수 없는 텍스트를 생성했습니다. 따라서 더 유용한 차트를 얻으려면 차트를 다시 내보내면 됩니다. 파일 형식과 파일 너비를 모두 지정하겠습니다.
이 차트를 3000픽셀 너비의 JPG 파일로 내보냅니다.
결과는 다음과 같습니다.
Sofia와 Sophia는 매우 인기가 있지만 두 개의 다른 이름으로 표시됩니다. 하지만 바로 이것이 차트를 그토록 매력적으로 만드는 이유입니다.
자주하는 질문
Q1. 고급 데이터 분석을 사용하는 데 비용이 얼마나 드나요?
고급 데이터 분석은 ChatGPT Plus와 함께 제공됩니다. 일부 기능은 ChatGPT 무료 버전의 GPT-4o에서 사용할 수 있습니다. ChatGPT Plus는 월 $20입니다. 고급 데이터 분석(Advanced Data Analytics)도 Enterprise 버전에 포함되어 있지만 해당 가격은 아직 공개되지 않았습니다.
Q2. 챗GPT에 업로드된 데이터는 비공개로 유지되나요 아니면 데이터 노출 위험이 있나요?
항상 개인 정보 보호 위험이 있다고 가정합니다. ChatGPT에 이 질문을 했더니 다음과 같은 답변이 나왔습니다.
ChatGPT는 데이터 개인정보 보호를 최우선으로 생각합니다. 업로드된 데이터는 사용자의 현재 세션을 위해서만 사용되며 장기간 저장되거나 다른 목적으로 사용되지 않습니다. 그러나 매우 민감한 데이터의 경우 사용자는 항상 주의를 기울여야 하며 향상된 데이터 기밀성을 제공하는 ChatGPT의 Enterprise 버전 사용을 고려해야 합니다.
생성형 AI는 모든 사람에게 새로운 위험을 가져옵니다. ChatGPT나 생성 AI 도구를 지나치게 신뢰하지 마세요. Enterprise 버전에는 더 많은 개인 정보 보호 제어 기능이 포함되어 있지만 대중에게 공개되는 데 신경 쓰지 않을 데이터만 업로드하는 것이 좋습니다.
Q3. 챗GPT의 고급 데이터 분석은 실시간 데이터를 처리할 수 있나요?
가능하지만 몇 가지 제한이 있습니다. 첫째, Plus 계정은 일정 기간 동안 요청할 수 있는 요청 수를 제한합니다. 둘째, 각 파일을 개별적으로 업로드해야 합니다. 라이선스가 부여된 ChatGPT API를 사용하여 실시간 분석을 수행할 가능성이 있습니다. 그러나 챗봇 자체의 경우에는 저장 데이터를 구문 분석하고 있습니다.
'IT Info' 카테고리의 다른 글
손으로 쓴 메모를 무료로 디지털화하는 2가지 방법 (0) | 2024.07.16 |
---|---|
1,000개의 AI 노래를 만들어 보고 알게 된 5가지 팁 (0) | 2024.07.15 |
글쓰기, 독서, 창의력 향상을 위해 챗GPT를 사용하는 방법 (2) | 2024.07.14 |
챗GPT GPT-4o 응답을 개선하기 위한 9가지 팁 (0) | 2024.07.13 |
초보자부터 마스터까지 10가지 챗GPT 프롬프트 작성 스타일 (0) | 2024.07.13 |