들어가기 전에
인공지능(AI)에 대해 많이 들어보기는 했지만 정확한 개념을 알고 있는 경우는 많지 않습니다. 생성형 AI, 자율주행, 로봇, 챗봇 등 사람마다 서로 다른 이미지를 떠올리곤 합니다. AI의 유형과 활용 사례와 함께, 머신러닝, 딥러닝, 신경망 등 관련 개념도 함께 소개합니다. 내용은 다소 길지만 시간을 들여 읽어볼 만한 가치가 있습니다.
※ 이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.
- 원문: What is AI? Everything to know about artificial intelligence
- URL: https://www.zdnet.com/article/what-is-ai-heres-everything-you-need-to-know-about-artificial-intelligence/
AI의 세 종류
인공지능은 흔히 세 가지 하위 범주, 즉 좁은 AI, 일반 AI, 슈퍼 AI로 구분하곤 합니다. 각각의 개념과 특징에 대해 살펴봅니다.
좁은 AI (ANI: Artificial Narrow Intelligence)
ANI는 삼성 빅스비, 애플 시리(Siri), 아마존 알렉사(Alexa), 구글 어시스턴트(Assistant) 등과 같은 음성 비서에 매우 중요합니다. 이 범주에는 명시적으로 설계되지 않은 채 특정 작업을 수행하거나 특정 문제를 해결하도록 설계되거나 훈련된 지능형 시스템이 포함됩니다.
ANI는 일반 지능을 보유하지 않기 때문에 종종 '약한 AI'라고 불릴 수 있습니다. 그러나 좁은 AI의 힘을 보여주는 몇 가지 예로는 음성 비서, 이미지 인식 시스템, 간단한 고객 서비스 요청에 응답하는 기술, 온라인에서 부적절한 콘텐츠에 플래그를 지정하는 도구 등이 있습니다. ChatGPT도 주어진 메시지에 대한 텍스트 응답을 생성하므로, 즉 특정 작업을 수행하도록 프로그래밍되어 있으므로 ANI의 한 예입니다.
일반 AI (AGI: Artificial general intelligence)
AGI는 기계가 축적된 경험을 바탕으로 다양한 작업을 이해하고 수행한다는 점에서 여전히 가상의 개념입니다. 이러한 유형의 지능은 AGI 시스템이 인간처럼 추론하고 생각할 수 있기 때문에 인간 지능 수준에 더 가깝습니다.
인간과 마찬가지로 AGI는 잠재적으로 모든 지적 작업을 이해하고, 추상적으로 생각하고, 경험을 통해 배우고, 해당 지식을 사용하여 새로운 문제를 해결할 수 있습니다. 본질적으로 우리는 현재 어떤 AI로도 달성할 수 없는 상식이 가능한 시스템이나 기계에 대해 이야기하고 있습니다. 의식을 갖춘 시스템을 개발하는 것은 아직까지는 공정한 방법일 수 있지만 AI 연구의 궁극적인 목표입니다.
슈퍼 AI (ASI: Artificial superintelligence)
ASI는 인류의 핵심을 뒤흔들 뿐만 아니라 인류를 파괴할 수도 있는 시스템입니다. SF 소설에서 튀어나온 것처럼 들린다면, 그것은 일종의 사실이기 때문입니다. ASI는 기계의 지능이 모든 측면에서 모든 형태의 인간 지능을 능가하고 모든 기능에서 인간을 능가하는 시스템입니다.
스스로 학습하고 지속적으로 개선할 수 있는 지능형 시스템은 여전히 가상의 개념입니다. 그러나 효과적이고 윤리적으로 적용된다면 이 시스템은 의학, 기술 등의 분야에서 놀라운 발전과 성과를 가져올 수 있습니다.
AI 용도와 최근 활용 사례
AI는 일상생활에서 다양한 형태로 활용되고 있습니다. Alexa 또는 Google 음성 지원 기능이 내장된 스마트 스피커는 AI의 훌륭한 예입니다. 다른 좋은 예로는 ChatGPT, Microsoft Copilot, Google Gemini 등과 같은 인기 있는 AI 챗봇이 있습니다.
이러한 시스템은 인간의 지능이나 사회적 상호 작용을 대체할 수는 없지만 훈련을 통해 명시적으로 프로그래밍되지 않은 작업에 대한 새로운 기술을 적응하고 배울 수 있습니다.
AI와 관련하여 최근에 가장 눈에 띄는 발전은 오픈AI의 ChatGPT입니다. ChatGPT를 포함하여 가장 주목할만한 몇 가지 사항은 다음과 같습니다.
GPT (ChatGPT)
ChatGPT는 자연어를 생성 및 번역하고 질문에 답변할 수 있는 AI 챗봇입니다. GPT는 Generative Pre-trained Transformer의 약자이며, GPT-3는 2020년 출시 당시 1,750억 개의 매개변수를 갖춘 가장 큰 언어 모델이었습니다. 그 이후 GPT-3.5가 나왔습니다. ChatGPT Plus 또는 Microsoft Copilot을 통해 액세스할 수 있는 가장 큰 버전인 GPT-4에는 1조 개의 매개변수가 있습니다.
자율주행자동차
자율주행차의 안전은 잠재 사용자의 가장 큰 관심사 이지만 AI의 혁신을 통해 기술은 계속해서 발전하고 개선되고 있습니다. 이러한 차량은 기계 학습 알고리즘을 사용하여 센서와 카메라의 데이터를 결합하여 주변 환경을 인식하고 최선의 조치를 결정합니다.
Tesla의 전기 자동차에 탑재된 자동 조종 기능은 아마도 자율 주행 자동차를 고려할 때 대부분의 사람들이 생각하는 것일 것입니다. 구글도 전기 자동차에 도전하고 있습니다. 구글의 모회사인 알파벳의 웨이모(Waymo)는 캘리포니아주 샌프란시스코와 애리조나주 피닉스에서 택시 운전사가 없는 택시처럼 자율주행차를 만들고 있습니다. 크루즈(Cruise)는 또 다른 로보택시 서비스로, 아우디, GM, 포드 등 자동차 회사들도 자율주행차 기술을 개발하고 있는 것으로 추정됩니다.
로봇공학
보스톤 다이내믹스(Boston Dynamics)의 성과는 AI와 로봇공학 분야에서 두드러집니다. 영화 터미네이터에서 볼 수 있는 수준의 AI를 만들기까지는 아직 갈 길이 멀지만 Boston Dyanmics의 로봇이 AI를 사용하여 다양한 지형을 탐색하고 응답하는 것을 보는 것은 인상적입니다.
딥마인드
Google의 자회사인 딥마인드(DeepMind)는 일반 인공지능(AGI)이라는 궁극적인 목표를 향해 전진하는 AI 선구자입니다. 이 회사는 2016년 프로 바둑기사 이세돌을 이긴 알파고 (AlphaGo)로 신문의 헤드라인을 장식했습니다. 이후 딥마인드는 단백질의 복잡한 3차원 형태를 예측할 수 있는 단백질 접힘 예측 시스템을 개발했다. 또한 전 세계 최고의 의사들만큼 효과적으로 안과 질환을 진단하는 프로그램을 개발했습니다.
머신러닝
다른 컴퓨터 과학 주제와 달리 AI를 차별화하는 가장 큰 품질은 기계 학습(ML: Machine Learning)을 사용하여 작업을 쉽게 자동화할 수 있는 능력입니다. 이를 통해 컴퓨터는 각 작업을 수행하도록 명시적으로 프로그래밍하는 대신 다양한 경험을 통해 학습할 수 있습니다. 이 기능은 많은 사람들이 AI라고 부르는 것이지만 머신러닝은 인공지능의 하위 집합입니다.
기계 학습에는 특정 데이터에 노출되었는지 여부에 관계없이 실수로부터 학습하고 패턴을 인식하여 정확하게 예측 및 결정을 내리기 위해 대량의 데이터에 대해 훈련되는 시스템이 포함됩니다.
머신러닝의 예로는 이미지 및 음성 인식, 사기 방지 등이 있습니다. 소셜 미디어 네트워크는 이미지를 분석하고 얼굴을 인식할 수 있으며, 이를 통해 다양한 친구를 태그하도록 권장됩니다. 시간과 연습을 통해 시스템은 이 기술을 연마하고 보다 정확한 권장 사항을 제공하는 방법을 학습합니다.
앞에서 언급했듯이 머신러닝은 AI의 하위 집합이며 일반적으로 지도 학습과 비지도 학습이라는 두 가지 주요 범주로 나뉩니다.
지도 학습
AI 시스템을 가르치기 위한 기술 중 지도 학습 (Supervised learning)은 사람들이 분류한 많은 라벨이 붙은 예를 사용합니다. 이러한 기계 학습 시스템에는 관심 있는 기능을 강조하기 위해 엄청난 양의 데이터가 제공됩니다. 본질적으로 예를 통해 가르치는 것입니다.
원과 사각형의 이미지를 인식하고 구별하기 위해 기계 학습 모델을 훈련한다고 가정해 보겠습니다. 이 경우 원에 대한 행성 그림이나 사각형에 대한 테이블과 같이 다양한 상황에서 원과 사각형 이미지의 대규모 데이터 세트를 수집하는 것부터 시작합니다. 그런 다음 알고리즘은 모서리가 없는 원과 4개의 동일한 변이 있는 정사각형과 같은 모양과 특성을 구별하기 위해 레이블이 지정된 이미지 모음을 학습합니다. 이미지 데이터 세트를 학습한 후 시스템은 새로운 이미지를 확인하고 어떤 모양을 찾는지 결정할 수 있습니다.
비지도 학습
비지도 학습 (Unsupervised learning)은 알고리즘이 데이터의 패턴을 식별하고 해당 데이터를 분류하는 데 사용할 수 있는 유사성을 찾는 다른 접근 방식을 사용합니다. 예를 들어 무게가 비슷한 과일이나 엔진 크기가 비슷한 자동차를 함께 묶을 수 있습니다.
특정 유형의 데이터를 선택하기 위해 알고리즘이 미리 설정되어 있지 않습니다. 예를 들어 쇼핑 행동을 기반으로 고객을 그룹화하여 개인화된 마케팅 캠페인을 통해 고객을 타겟팅하는 등 그룹화할 수 있는 유사성이 있는 데이터를 찾습니다.
강화 학습
강화 학습 (Reinforcement learning)에서 시스템은 가능한 최상의 결과에 도달할 때까지 시행착오 과정을 거쳐 입력 데이터를 기반으로 보상을 극대화하려고 시도합니다. 더 높은 점수를 얻으면 긍정적인 보상을 받고, 낮은 점수를 얻으면 부정적인 보상을 받을 수 있는 비디오 게임을 플레이하도록 시스템을 훈련하는 것을 생각해 보세요.
시스템은 게임을 분석하고 동작을 수행하는 방법을 학습한 다음, 받은 보상만으로 학습하여 스스로 플레이할 수 있는 지점에 도달하고 사람의 개입 없이 높은 점수를 획득합니다. 강화 학습은 자율 로봇이 실제 환경에서 행동하는 최적의 방법을 가르치는 데 도움이 되는 연구에도 사용됩니다.
대규모 언어 모델
현재 가장 유명한 AI 유형 중 하나는 대형언어모델 (LLM: Large Language Model)입니다. LLM은 비지도 기계 학습을 사용하며 인간 언어의 작동 방식을 학습하기 위해 엄청난 양의 텍스트를 학습합니다. 이러한 텍스트에는 기사, 서적, 웹사이트 등이 포함됩니다.
학습 과정에서 LLM은 수십억 개의 단어와 구문을 처리하여 패턴과 이들 사이의 관계를 학습함으로써 모델이 프롬프트에 대해 인간과 유사한 답변을 생성할 수 있도록 합니다.
가장 인기 있는 LLM은 무료 ChatGPT의 기반이 되는 GPT 3.5이며, 가장 큰 LLM은 약 1조 7800억 개의 매개변수를 갖춘 GPT-4입니다. Gemini는 Google에서 개발한 동일한 이름의 LLM으로 구동됩니다. 이는 매개변수가 150만 개로 두 번째로 큰 LLM입니다.
딥러닝
딥러닝 (Deep learning)은 다양한 작업을 수행하기 위해 3개 이상의 레이어로 구성된 인공 신경망을 훈련시키는 머신러닝 제품군의 일부입니다. 이러한 신경망은 방대한 양의 데이터를 사용하여 훈련되는 다수의 심층 계층을 갖춘 거대한 네트워크로 확장됩니다.
딥 러닝 모델은 3개 이상의 레이어를 갖는 경향이 있으며 수백 개의 레이어를 가질 수도 있습니다. 딥 러닝은 훈련 프로세스에서 지도 학습이나 비지도 학습 또는 둘 다를 사용할 수 있습니다. 딥러닝 기술은 AI를 활용해 데이터 속 복잡한 패턴을 학습할 수 있기 때문에 자연어 처리(NLP: Natural Language Processing), 음성 인식, 이미지 인식 등에 활용되는 경우가 많습니다.
신경망
머신러닝의 성공은 신경망(Neural Networks)에 달려 있습니다. 이는 구조와 기능이 인간 두뇌의 뉴런 사이의 연결을 대략적으로 기반으로 하여 서로 신호를 보내는 방식을 모방한 수학적 모델입니다. 퍼즐을 풀기 위해 함께 일하는 로봇 그룹을 상상해 보세요. 각각은 퍼즐 조각의 다양한 모양이나 색상을 인식하도록 프로그래밍되어 있습니다. 로봇은 서로의 능력을 결합하여 퍼즐을 함께 해결합니다. 신경망은 로봇 그룹과 같습니다.
신경망은 내부 매개변수를 조정하여 출력 내용을 변경할 수 있습니다. 각각에는 학습 중에 특정 데이터가 제시될 때 무엇을 출력해야 하는지 학습하기 위해 데이터베이스가 제공됩니다. 이는 서로 데이터를 공급하는 상호 연결된 알고리즘 레이어로 구성됩니다. 신경망은 데이터가 계층 간에 전달될 때 데이터에 부여된 중요도를 수정하여 특정 작업을 수행하도록 훈련할 수 있습니다.
이러한 신경망을 훈련하는 동안 데이터가 계층 간에 전달될 때 데이터에 부여되는 가중치는 신경망의 출력이 원하는 결과에 매우 가까워질 때까지 계속해서 변경됩니다. 그 시점에서 네트워크는 특정 작업을 수행하는 방법을 '학습'하게 됩니다. 원하는 출력은 이미지의 과일에 올바르게 라벨을 붙이는 것부터 센서 데이터를 기반으로 엘리베이터가 언제 고장날지 예측하는 것까지 무엇이든 될 수 있습니다.
현재 사용할 수 있는 AI 서비스
소비자와 기업 모두 작업을 신속하게 처리하고 일상 생활에 편리함을 더하기 위한 용도로 다양한 AI 서비스를 사용할 수 있습니다. 다음은 대중이 무료 및 유료로 사용할 수 있는 인공 지능의 몇 가지 예입니다.
- 음성 비서: 아마존 알렉사, 애플 시리, 구글 어시스턴트 등은 모두 자연어 처리를 사용하여 질문이나 명령을 이해하고 응답합니다.
- 챗봇: AI 챗봇은 사람과 상호 작용할 수 있는 또 다른 형태의 가상 비서이며 경우에 따라 인간과 같은 대화를 나누고 심지어 공감과 관심을 흉내내기도 합니다.
- 언어 번역: 기계 학습은 광범위하게 적용되며 Google 번역, Microsoft 번역기, Amazon 번역 및 ChatGPT와 같은 서비스는 모두 이 기술을 사용하여 텍스트를 번역합니다.
- 생산성: Microsoft 365용 Microsoft Copilot은 작업을 자동화하기 위해 Word, PowerPoint, Outlook, Excel, Teams 등에 포함된 AI 생산성 도구로 사용되는 LLM의 예입니다.
- 이미지 및 비디오 인식: 다양한 프로그램은 AI를 사용하여 얼굴, 텍스트, 그 안의 개체 등 이미지와 비디오의 콘텐츠에 대한 정보를 찾습니다(예: Clarifai, Amazon Rekognition).
- 소프트웨어 개발: 프로그래머의 작업을 더 쉽게 만드는 데 사용할 수 있는 다른 AI 도구도 많이 있습니다(예: GitHub Copilot).
- 비즈니스 구축: 주변의 인공 지능을 활용하는 일상적인 사용자 외에도 서비스에서는 OpenAI의 GPT-4 API를 포함하여 LLM 또는 클라우드 기반 AI 제품군인 Amazon Bedrock을 사용하여 애플리케이션과 서비스를 구축하는 등 비즈니스용 AI 도구를 제공하고 있습니다.
AI 경쟁을 주도하고 있는 기업
생성형 AI가 인공지능 혁신을 주도하고 있지만, 다른 여러 최고 기업들도 선구적인 기술을 개발하기 위해 노력하고 있습니다.
오픈AI
오픈AI(OpenAI)가 AI 챗봇 ChatGPT, 이미지 생성기인 Dall-E 3 등 생성 AI 도구를 무료로 제공한 후 AI 경쟁에서 선두를 차지한 것은 놀라운 일이 아닙니다.
알파벳
Google의 모회사인 알파벳(Alphabet)은 DeepMind, Waymo 및 앞서 언급한 Google을 포함한 회사를 통해 다양한 AI 시스템을 보유하고 있습니다.
Google은 원래 LaMDA에서 제공한 Google Bard라는 성능이 낮은 도구를 사용하여 AI 챗봇 경쟁에서 힘든 출발을 했습니다. 그런 다음 회사는 Bard 뒤에서 LLM을 두 번 전환했습니다. 처음에는 PaLM 2에 대해, 그 다음에는 현재 LLM이 이를 지원하는 Gemini에 대해 전환했습니다. 마지막 변경으로 Google은 봇의 이름도 Gemini의 Bard로 변경했습니다.
DeepMind는 AI 시스템을 통해 달성하고자 하는 과학적 솔루션에서 알 수 있듯이 인공 일반 지능을 계속해서 추구하고 있습니다. Document AI용 기계 학습 모델을 개발하고, Youtube의 시청자 경험을 최적화하고, AlphaFold를 전 세계 연구자에게 제공하는 등의 작업을 수행했습니다.
마이크로소프트
마이크로소프트(Microsoft)는 365 애플리케이션용 Microsoft Copilot을 만드는 것 외에도 기계 학습, 데이터 분석, 대화형 AI 개발 플랫폼, 컴퓨터 비전, 음성 및 언어에서 인간과 동등한 수준의 성능을 구현하는 사용자 지정 가능한 API 등 Azure에서 개발자를 위한 AI 도구 제품군을 제공합니다.
Microsoft는 또한 OpenAI 개발에 많은 투자를 했습니다. 이 거대 기술 기업은 이전에 Bing 채팅으로 알려진 AI 챗봇인 Copilot 과 Dall-E 3의 고급 버전에서 GPT-4를 사용하여 Microsoft Designer를 통해 이미지를 생성합니다.
다른 회사
이는 AI 경쟁을 선도하는 기업의 몇 가지 예일 뿐이지만 Baidu , Alibaba , Cruise , Lenovo , Tesla 등 전 세계의 다른 기업도 인공 지능 분야에서 진전을 이루고 있습니다.
AI는 세상을 어떻게 변화시킬까
인공 지능은 우리가 일하는 방식, 건강, 미디어를 소비하고 출근하는 방식, 개인정보 보호 등을 변화시킬 수 있습니다. 사람들은 휴대폰의 음성 비서에게 자율주행차를 타고 출근하도록 요청할 수 있으며, AI 도구를 사용하여 그 어느 때보다 효율적으로 일할 수 있습니다. 의사와 방사선 전문의는 더 적은 자원을 사용하여 암 진단을 내리고, 질병과 관련된 유전적 서열을 찾아내고, 보다 효과적인 약물로 이어질 수 있는 분자를 식별하여 잠재적으로 수많은 생명을 구할 수 있습니다.
Dall-E 3, Midjourney 및 Copilot과 같이 누군가의 목소리를 복제하거나 사람의 유사성을 사용하여 딥페이크 비디오를 만들 수 있는 사실적인 이미지를 생성할 수 있는 신경망을 보유함으로써 발생할 수 있는 혼란을 생각해 볼 수도 있습니다. 이러한 딥페이크는 사람들이 진짜라고 생각하는 사진, 비디오 또는 오디오를 훼손할 수 있습니다.
또 다른 윤리적 문제는 얼굴 인식과 감시, 그리고 이 기술이 어떻게 사람들의 사생활을 침해할 수 있는지에 관한 것이며 많은 전문가들은 이를 완전히 금지하려고 합니다.
AI가 인간의 직업을 대체할까
인공지능 시스템이 현대 노동력의 상당 부분을 대체할 가능성은 가까운 미래에 실현될 가능성이 높습니다. 일반적인 인공 지능이 모든 직업을 대체할 수는 없지만 AI가 업무의 성격을 변화시킬 것이라는 점은 확실해 보입니다. 유일한 관건은 자동화가 작업장을 얼마나 빠르고 근본적으로 변화시킬 것인가입니다.
그러나 인공지능은 독립적으로 동작할 수 없습니다. 일상적이고 반복적인 데이터 작업을 수행하는 많은 작업이 자동화될 수 있지만, 다른 작업 의 작업자는 생성 AI와 같은 도구를 사용하여 생산성과 효율성을 높일 수 있습니다. 인공 지능 시스템이 인간의 능력을 얼마나 빨리 능가할 것인지에 대해 AI 전문가들 사이에는 다양한 의견이 있습니다.
완전 자율주행 차량은 아직 현실이 아니지만 일부 예측에 따르면 자율주행 트럭 산업만으로도 택배기사와 택시 운전사에 대한 영향을 고려하지 않더라도 미국에서 필연적으로 50만 개 이상의 일자리를 빼앗을 태세입니다.
'IT Info' 카테고리의 다른 글
Excel 수식 만들 때 시간 낭비를 멈추고 대신 챗GPT를 사용하세요 (7) | 2024.05.01 |
---|---|
이력서에 작성해야 할 상위 10가지 기술 (7) | 2024.05.01 |
무료로 이미지 크기를 조정하는 5가지 방법 (6) | 2024.04.29 |
아마 전혀 생각하지 못했을 챗GPT의 독창적인 용도 6가지 (6) | 2024.04.29 |
챗GPT 대신 Claude 3를 사용해야 하는 4가지 이유 (7) | 2024.04.28 |