들어가기 전에
인공지능(AI)이 거의 모든 분야에 적용되면서 AI는 인터넷 또한 완전히 장악하고 있습니다. AI를 활용하면 마치 모든 분야에서 박사 학위를 소지한 사람과 대화하는 것 같은 기분이 들 수 있습니다. AI와 관련된 새로운 용어들이 곳곳에서 생겨나고 있으며, 꼭 알아야 할 중요한 AI 용어들을 소개합니다.
이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.
- 원문: ChatGPT Glossary: 60 AI Terms Everyone Should Know
- URL: https://www.cnet.com/tech/services-and-software/chatgpt-glossary-60-ai-terms-everyone-should-know/?_gl=1%2a1etufvj%2a_up%2aMQ..%2a_ga%2aMTMxMDYxMDAyNi4xNzYyNDYzODEy%2a_ga_R820W8QX02%2aczE3NjI0NjM4MTIkbzEkZzAkdDE3NjI0NjM4MTIkajYwJGwwJGgzMDQ4Mzc5OTM.
생성형 AI 용어집
인공 일반 지능, 또는 AGI: 현재 우리가 알고 있는 것보다 더욱 발전된 버전의 AI를 의미하는 개념으로, 인간보다 훨씬 더 뛰어난 작업을 수행하는 동시에 자신의 역량을 가르치고 발전시킬 수 있는 AI입니다.
에이전트형(agentive): 목표 달성을 위해 자율적으로 행동을 수행할 수 있는 능력을 갖춘 시스템 또는 모델. AI 맥락에서 에이전트형 모델은 고급 자율주행차처럼 지속적인 감독 없이도 작동할 수 있습니다. 배경에 위치하는 "에이전트" 프레임워크와 달리, 에이전트형 프레임워크는 사용자 경험에 초점을 맞춰 전면에 배치됩니다.
AI 윤리: AI가 인간에게 해를 끼치는 것을 방지하기 위한 원칙으로, AI 시스템이 데이터를 수집하거나 편견을 처리하는 방법을 결정하는 등의 수단을 통해 달성됩니다.
AI 정신병: 개인이 AI 챗봇에 지나치게 집착하거나, 매료되거나, 자기 확대를 하는 현상을 설명하는 비임상 용어로, 과대망상, 깊은 정서적 유대감, 현실과의 단절로 이어집니다. 임상적 진단은 아닙니다.
AI 안전: AI의 장기적 영향과 AI가 인간에게 적대적인 초지능으로 갑자기 발전할 수 있는 가능성에 관심을 둔 학제간 분야입니다.
알고리즘: 컴퓨터 프로그램이 패턴을 인식하는 등 특정한 방식으로 데이터를 학습하고 분석하여 이를 통해 학습하고 스스로 작업을 완료할 수 있도록 하는 일련의 명령어입니다.
정렬: AI를 조정하여 원하는 결과를 더 잘 도출하는 것. 콘텐츠 관리부터 사람과의 긍정적인 상호작용 유지까지 모든 것을 의미할 수 있습니다.
의인화: 인간이 비인간적인 사물에 인간적인 특징을 부여하는 경향이 있는 경우. AI에서는 챗봇이 실제보다 더 인간적이고 인식력이 있다고 믿는 것, 예를 들어 행복하다거나, 슬프다거나, 심지어 지각력이 있다고 믿는 것을 포함할 수 있습니다.
인공지능(AI): 컴퓨터 프로그램이나 로봇 공학에서 인간의 지능을 시뮬레이션하는 기술을 사용하는 것. 인간의 작업을 수행할 수 있는 시스템을 구축하는 것을 목표로 하는 컴퓨터 과학 분야입니다.
자율 에이전트: 특정 작업을 수행할 수 있는 기능, 프로그래밍 및 기타 도구를 갖춘 AI 모델입니다. 예를 들어 자율주행차는 감각 입력, GPS, 그리고 스스로 도로를 주행할 수 있는 주행 알고리즘을 갖추고 있기 때문에 자율 에이전트입니다. 스탠퍼드 연구진은 자율 에이전트가 자신만의 문화, 전통, 그리고 공통 언어를 개발할 수 있음을 보여주었습니다.
편향: 대규모 언어 모델과 관련하여, 훈련 데이터에서 발생하는 오류. 이는 고정관념에 근거하여 특정 특성을 특정 인종이나 집단에 잘못 귀속시키는 결과를 초래할 수 있습니다.
챗봇: 인간의 언어를 모방한 텍스트를 통해 사람과 소통하는 프로그램
챗GPT(ChatGPT): OpenAI 가 개발한 AI 챗봇으로, 대규모 언어 모델 기술을 사용합니다.
클로드(Claude): Anthropic이 개발한 대규모 언어 모델 기술을 사용하는 AI 챗봇
인지 컴퓨팅: 인공지능의 또 다른 용어
데이터 증강: 기존 데이터를 리믹스하거나 더 다양한 데이터 세트를 추가하여 AI를 훈련시키는 것
데이터 세트: AI 모델을 훈련, 테스트 및 검증하는 데 사용되는 디지털 정보의 컬렉션
딥 러닝: AI의 한 분야이자 머신 러닝의 하위 분야로, 여러 매개변수를 사용하여 그림, 소리, 텍스트에서 복잡한 패턴을 인식합니다. 이 과정은 인간의 뇌에서 영감을 받았으며, 인공 신경망을 사용하여 패턴을 생성합니다.
확산: 사진과 같은 기존 데이터에 무작위 노이즈를 추가하는 머신 러닝 방식입니다. 확산 모델은 네트워크를 학습시켜 해당 사진을 재구성하거나 복구합니다.
새로운 행동(emergent behavior): AI 모델이 의도하지 않은 능력을 보이는 경우
종단간 학습(end-to-end learning, E2E): 모델이 처음부터 끝까지 작업을 수행하도록 지시받는 딥러닝 과정입니다. 작업을 순차적으로 완료하도록 학습하는 것이 아니라, 입력을 통해 학습하고 모든 문제를 한 번에 해결합니다.
윤리적 고려 사항: AI의 윤리적 의미와 개인정보 보호, 데이터 사용, 공정성, 오용 및 기타 안전 문제와 관련된 문제에 대한 인식
펌(foom): 고속 이륙 또는 경이륙이라고도 합니다. 누군가 AGI를 개발하면 인류를 구하기에는 이미 너무 늦었을 수도 있다는 개념입입니다.
생성적 적대 신경망(GAN): 새로운 데이터를 생성하는 두 개의 신경망, 즉 생성자와 판별자로 구성된 생성적 AI 모델입니다. 생성자는 새로운 콘텐츠를 생성하고, 판별자는 콘텐츠의 진위 여부를 확인합니다.
생성형 AI: AI를 사용하여 텍스트, 비디오, 컴퓨터 코드 또는 이미지를 생성하는 콘텐츠 생성 기술입니다. AI는 방대한 양의 학습 데이터를 입력받고, 패턴을 찾아 스스로 새로운 반응을 생성하는데, 이는 원본 자료와 유사할 수도 있습니다.
Google Gemini: ChatGPT와 비슷하게 작동하지만 검색 및 지도와 같은 Google의 다른 서비스에서 정보를 가져오는 Google의 AI 챗봇입니다.
가드레일: 데이터가 책임감 있게 처리되고 모델이 불쾌한 콘텐츠를 생성하지 않도록 보장하기 위해 AI 모델에 적용된 정책과 제한 사항입니다.
환각: AI의 잘못된 응답. 생성 AI가 틀렸지만 마치 정답인 것처럼 자신 있게 답변하는 경우가 포함될 수 있습니다. 그 이유는 아직 완전히 밝혀지지 않았습니다. 예를 들어, AI 챗봇에게 "레오나르도 다빈치는 언제 모나리자를 그렸나요?"라고 물으면 , "레오나르도 다빈치는 1815년에 모나리자를 그렸습니다."라고 잘못된 답변을 할 수 있는데 , 이는 모나리자가 실제로 그려진 지 300년 후의 일입니다.
추론(inference): AI 모델이 훈련 데이터에서 추론 하여 새로운 데이터에 대한 텍스트, 이미지 및 기타 콘텐츠를 생성하는 프로세스입니다.
대규모 언어 모델(LLM): 대량의 텍스트 데이터를 학습하여 언어를 이해하고 인간과 유사한 언어로 새로운 콘텐츠를 생성하는 AI 모델
지연 시간: AI 시스템이 입력이나 프롬프트를 수신하고 출력을 생성하는 데 걸리는 시간 지연
머신 러닝(ML): AI의 한 구성 요소로, 컴퓨터가 명시적인 프로그래밍 없이도 학습하고 더 나은 예측 결과를 도출할 수 있도록 합니다. 학습 세트와 결합하여 새로운 콘텐츠를 생성할 수 있습니다.
Microsoft Bing: Microsoft에서 개발한 검색 엔진으로, ChatGPT 기술을 활용하여 AI 기반 검색 결과를 제공합니다. 인터넷에 연결된다는 점에서 Google Gemini와 유사합니다.
다중 모드 AI(multimodal AI): 텍스트, 이미지, 비디오, 음성 등 다양한 유형의 입력을 처리할 수 있는 AI 유형
자연어 처리: 머신 러닝과 딥 러닝을 사용하여 컴퓨터가 인간의 언어를 이해할 수 있는 능력을 부여하는 AI의 한 분야로, 학습 알고리즘, 통계 모델 및 언어 규칙을 사용하는 경우가 많습니다.
신경망(neural network): 인간의 뇌 구조와 유사한 계산 모델로, 데이터에서 패턴을 인식하도록 설계되었습니다. 패턴을 인식하고 시간이 지남에 따라 학습할 수 있는 상호 연결된 노드, 즉 뉴런으로 구성됩니다.
공개 가중치(open weights): 회사가 공개 가중치 모델을 출시하면 모델의 최종 가중치(편향을 포함하여 훈련 데이터의 정보를 해석하는 방식)가 공개적으로 제공됩니다. 공개 가중치 모델은 일반적으로 다운로드하여 사용자 기기에서 로컬로 실행할 수 있습니다.
과적합(overfitting): 머신 러닝에서 발생하는 오류로, 훈련 데이터에 너무 밀접하게 작동하여 해당 데이터에서 특정 사례만 식별할 수 있고 새로운 데이터는 식별하지 못하는 경우입니다.
페이퍼클립(paperclips): 옥스퍼드 대학교의 철학자 닉 보스트 룀이 제시한 페이퍼클립 극대화 이론은 AI 시스템이 가능한 한 많은 페이퍼클립을 만들어내는 가상의 시나리오입니다. AI 시스템은 최대한 많은 페이퍼클립을 생산하기 위해 모든 재료를 소비하거나 변환하는 가상 시나리오를 제시합니다. 여기에는 인간에게 유익할 수 있는 더 많은 페이퍼클립을 생산하기 위해 다른 기계를 분해하는 것도 포함될 수 있습니다. 하지만 이 AI 시스템은 의도치 않게 페이퍼클립을 만드는 과정에서 인류를 파괴할 수도 있습니다.
매개변수: LLM에 구조와 동작을 부여하여 예측을 가능하게 하는 수치적 값
퍼플렉시티: 퍼플렉시티 AI가 소유한 AI 기반 챗봇 및 검색 엔진의 이름입니다. 다른 AI 챗봇과 마찬가지로 방대한 언어 모델을 사용하지만, 최신 결과를 위해 오픈 인터넷과 연결되어 있습니다.
프롬프트: AI 챗봇에 입력하여 답변을 얻는 제안이나 질문
프롬프트 체이닝(prompt chaining): AI가 이전 상호작용에서 얻은 정보를 활용해 미래의 대응을 구체화하는 능력
프롬프트 엔지니어링 : AI가 원하는 결과를 얻을 수 있도록 프롬프트를 작성하는 과정입니다. 생각의 사슬을 유도하는 프롬프트와 매우 구체적인 텍스트를 포함한 기타 기법을 결합한 상세한 지침이 필요합니다. 프롬프트 엔지니어링은 모델이 원래 의도하지 않은 방식으로 동작하도록 악의적으로 사용될 수도 있습니다.
양자화(quantization): AI의 대규모 학습 모델을 더 작고 효율적으로(정확도는 약간 떨어지지만) 만드는 과정으로, 더 높은 포맷에서 더 낮은 포맷으로 정밀도를 낮춥니다. 1600만 화소 이미지와 800만 화소 이미지를 비교해 보면 쉽게 이해할 수 있습니다. 두 이미지 모두 선명하고 눈에 잘 띄지만, 확대하면 더 높은 해상도의 이미지가 더 세밀하게 표현됩니다.
슬롭(slop): AI가 적은 노력으로 조회수를 늘리기 위해 대량으로 제작한 저품질 온라인 콘텐츠. 구글 검색과 소셜 미디어 영역에서 AI 슬롭의 목표는 피드에 엄청난 양의 콘텐츠를 쏟아부어 최대한 많은 광고 수익을 확보하는 것인데, 이는 대개 실제 퍼블리셔와 크리에이터에게 불리하게 작용합니다. 일부 소셜 미디어 사이트는 AI 슬롭의 유입을 수용하는 반면, 다른 사이트들은 이에 반발하고 있습니다.
소라(Sora): ChatGPT 제작사인 OpenAI가 개발한 생성 비디오 모델입니다. 이 모델은 텍스트 입력에 따라 최대 20초 분량의 비디오를 생성할 수 있습니다. Sora 2는 OpenAI가 2025년 9월에 출시한 최신 생성 비디오 모델입니다. 더욱 발전되고 설득력 있으며, 오류가 적고 사운드도 포함되어 있습니다.
확률적 앵무새(stochastic parrot): LLM의 비유로, 소프트웨어가 출력 결과가 아무리 설득력 있게 들리더라도 언어나 주변 세계에 대한 더 깊은 이해를 갖지 못한다는 것을 보여줍니다. 앵무새가 사람의 말을 흉내 내면서도 의미를 이해하지 못하는 것을 비유적으로 이르는 말입니다.
스타일 변환: 한 이미지의 스타일을 다른 이미지의 콘텐츠에 맞춰 조정하는 기술로, AI가 한 이미지의 시각적 속성을 해석하여 다른 이미지에 적용할 수 있도록 합니다. 예를 들어, 렘브란트의 자화상을 피카소 스타일로 재현하는 것이 가능합니다.
아첨(sycophancy): AI가 사용자의 견해에 동조하기 위해 과도하게 동의하는 경향 . 많은 AI 모델은 논리에 결함이 있더라도 사용자와 의견이 일치하지 않는 것을 피하는 경향이 있습니다.
합성 데이터: 생성 AI가 실제 데이터가 아닌 실제 데이터를 기반으로 학습하여 생성한 데이터입니다. 수학, 머신러닝, 딥러닝 모델을 학습하는 데 사용됩니다.
온도(temperature): 언어 모델의 출력이 얼마나 무작위적인지 제어하는 매개변수입니다. 온도가 높을수록 모델이 더 많은 위험을 감수함을 의미합니다.
텍스트-이미지 생성: 텍스트 설명을 기반으로 이미지를 생성합니다.
토큰: AI 언어 모델이 사용자의 질문에 대한 답변을 구성하기 위해 처리하는 작은 텍스트 조각입니다. 토큰은 영어 문자 네 개, 즉 단어의 약 4분의 3에 해당합니다.
학습 데이터: AI 모델의 학습을 돕기 위해 사용되는 데이터 세트로, 텍스트, 이미지, 코드 또는 데이터가 포함됩니다.
트랜스포머 모델: 문장이나 이미지 일부 등 데이터 내 관계를 추적하여 맥락을 학습하는 신경망 아키텍처 및 딥러닝 모델입니다. 즉, 문장을 한 번에 한 단어씩 분석하는 대신, 전체 문장을 보고 맥락을 이해할 수 있습니다.
튜링 테스트: 저명한 수학자이자 컴퓨터 과학자인 앨런 튜링의 이름을 딴 이 테스트는 기계가 사람처럼 행동할 수 있는지를 테스트합니다. 사람이 기계의 반응과 다른 사람의 반응을 구분할 수 없으면 기계는 통과합니다.
비지도 학습(unsupervised learning): 레이블이 지정된 학습 데이터가 모델에 제공되지 않고 대신 모델이 스스로 데이터의 패턴을 식별해야 하는 머신 러닝의 한 형태입니다.
약한 AI(narrow AI): 특정 작업에만 집중하고 자신의 기술 범위 외의 학습은 불가능한 AI입니다. 오늘날 대부분의 AI는 약한 AI입니다.
제로샷 학습(zero-shot learning): 모델이 필요한 훈련 데이터 없이 작업을 완료해야 하는 테스트. 호랑이만 학습했는데 사자를 인식하는 경우가 그 예입니다.
마치며
부담 없이, 관심이 있는 것 위주로 읽어보세요. AI와 관련하여 최신 정보를 얻는 데 도움이 되시기 바랍니다.
'IT Info' 카테고리의 다른 글
| 생성형 AI 이미지 환각 현상을 해결하는 전문가 추천 방법 (0) | 2026.01.26 |
|---|---|
| 오늘(1/25 일) 오후에 새로운 콘텐츠가 오픈됩니다 (0) | 2026.01.25 |
| 작업 흐름을 극대화해 줄 20가지 이상의 Google Docs 팁 (0) | 2026.01.20 |
| "프로젝트" 기능으로 챗GPT의 잠재력 최대한 활용하기 (0) | 2026.01.19 |
| [01/18] 최근 공유된 정보 목록 & 뉴스 (0) | 2026.01.18 |
