가뜩이나 빠르게 돌아가는 IT 동향, 그 중에서도 인공지능(AI) 분야에서는 터보 엔진이라도 단 듯 많은 일들이 있었습니다. 한 주 동안 있었던 AI 관련 내용을 5가지로 정리해 보았습니다. 어떤 것들이 선정되었는지 살펴보시죠.
1. 오픈AI, Text-to-Video AI 모델 '소라(Sora)' 출시
지난 목요일(현지시간) OpenAI는 텍스트 기반 프롬프트에서 비디오를 생성할 수 있는 AI 모델인 Sora를 출시했습니다. 최대 1분 길이의 비디오 클립들이 회사 웹사이트에 게시되었습니다. 따르면 일본어로 "하늘"을 의미하는 모델 이름은 광범위한 창의적 잠재력을 암시하기 때문에 선택되었다는 후문입니다(by The New York Times).
Sora가 제작한 비디오의 품질은 꽤 인상적이지만 단점도 있습니다. 오픈AI에 따르면, "복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있으며 원인과 결과의 구체적인 사례를 이해하지 못할 수도" 있습니다. "예를 들어, 어떤 사람이 쿠키를 한입 베어물었는데 나중에 쿠키에 물린 자국이 없을 수도 있다."라고 회사는 덧붙였습니다.
Sora는 아직 공개적으로 사용할 수 없습니다. AI 모델의 잠재적인 위험과 모델의 취약점을 찾기 위해 사이버 보안 전문가인 '레드 팀원(red teamers)'과 일부 영화 관련 전문가 그룹과 공유하고 있는 것으로 파악됩니다.
[참고] 💎 또 일(?)을 낸 오픈AI, 이번엔 동영상 생성 AI ‘소라(Sora)' 발표
2. 오픈AI, 챗GPT에 '기억(Memory)'을 부여하다
오픈AI는 화요일(현지시간), "ChatGPT가 이제 이전 대화의 정보를 '기억'하는 기능을 갖추고 있어 챗봇과 보다 지속적이고 개인화된 대화를 가능하게 한다" 회사 블로그를 통해 발표했습니다.
모든 채팅에서 논의한 내용을 기억하면 정보를 반복할 필요가 없고 향후 대화가 더 유용해질 수 있을 것으로 기대됩니다. 예를 들어, 블로그 게시물은 사용자가 이전에 ChatGPT에 해파리를 좋아하는 유아가 있다고 말했다고 가정합니다. 동일한 사용자가 나중에 자녀의 생일 카드에 대한 창의적인 영감을 요청하면 챗봇은 이전 대화를 기억하고 이에 따라 해파리 테마 카드에 대한 몇 가지 아이디어를 제공합니다.
블로그 게시물에 따르면, 사용자는 ChatGPT에게 이전 대화의 특정 세부 정보를 '잊으라고' 지시할 수 있으며, 이러한 내용은 설정에서 보고 지울 수도 있습니다. [설정]을 통해 언제든지 끌 수 있는 새로운 메모리 기능이 이번 주 ChatGPT Free 및 Plus 사용자의 소규모 집단에 배포되었으며, 더 광범위한 배포를 계획하고 있는 것으로 보입니다.
3. 구글, 제미나이(Gemini) 프로 1.5 공개
구글도 멀티모달 AI '제미나이Gemini)’를 앞세워 오픈AI, Microsoft와 본격 경쟁에 나섰습니다. 구글은 지난 16일(현지시간) ‘Gemini 1.0 Ultra’의 업그레이드 버전인 ‘Gemini 1.5 Pro’를 공개했습니다. 구글은 내부 테스트 결과 ‘Gemini 1.5 Pro’가 이전 모델 대비 87% 향상된 성능을 보였다고 밝혔습니다.
구글은 오픈AI가 개발한 GPT-4 터보의 토큰 처리 규모 12만8000개를 훌쩍 뛰어넘는 최대 100만개 규모라며 ‘제미나이 1.5 프로’ 성능에 자신감을 드러냈습니다. 이것은 영상 1시간, 음성 11시간, 코드 3만 줄, 단어 70만 개 등의 방대한 정보를 한 번에 처리할 수 있는 규모입니다.
Gemini는 무료 버전임에도 최신 정보의 답변을 제공합니다. 구글에 따르면, Gemini 1.5 Pro는 정교한 이해 능력과 추론 능력을 갖추고 있습니다. 예를 들어, 44분 분량인 미국 무성 영화의 정확한 주요 줄거리와 사건들을 분석하고 영화 속 사소한 부분까지도 추론해 낼 수 있고, 400페이지 분량의 아폴로 11호 달 탐사 임무 관련 문서에서 전체 내용과 이미지, 세부 정보를 추론할 수 있습니다.
참고로, 구글은 오픈AI 이전에 이미 ‘Sora’와 같은 텍스트 입력 기반의 동영상 생성 AI 모델도 개발한 기술력을 보유하고 있습니다. 빅테크 기업들 간의 경쟁으로 AI 기술력이 빠르게 고도화되고 있습니다.
4. 해커들, 해킹에 ChatGPT 사용
마이크로소프트와 오픈AI는 "국가 지원을 받는 5개 해커 그룹이 OpenAI의 기술을 활용하여 사이버 공격 능력을 연마"했다고 보고서를 통해 밝혔습니다. 회사는 해커들이 어떤 특정 AI 도구를 사용했는지 공개하지 않았습니다. 해당 보고서는 해커들이 러시아 GRU(국가 정보국), 이란 이슬람 혁명 수비대, 중국 및 북한 정부와 연관되어 있다고 주장했습니다.
조사 결과에 따라 Microsoft는 OpenAI 제품을 사용하는 국가 후원 해커에 대한 일반적인 금지 조치를 발표한 것으로 알려졌습니다. 금지 조치에는 Bing을 포함한 Microsoft의 AI 기반 제품 제품군이 포함되지 않습니다.
다만, 이들 해커 그룹이 OpenAI의 기술을 사용하는 방식은 미군 관계자들이 우려했던 것보다 더 평범했습니다. 예를 들어 이란 정부와 관련이 있는 한 그룹은 AI를 사용하여 바이러스 백신 기술을 피하고 피싱 이메일을 작성하는 방법을 배우고 있었던 것으로 알려졌습니다.
5. 애플, 코드 생성 AI 출시 임박
애플이 iOS용 생성형 인공지능(AI) 출시를 앞둔 것으로 보입니다. 블룸버그 등 외신에 따르면, 6월에 있을 애플의 연례 개발자 컨퍼런스에 맞춰 공개할 것으로 보입니다.
'크리스털(Crystal)'이라는 코드명까지 붙었습니다. 마이크로소프트(MS)의 코드 생성 AI인 깃허브 코파일럿(Github Copilot)과 비슷하게 작동하며, AI를 사용해 코드의 블록을 예측하고 완성합니다. 지난해 말부터 애플은 일부 대형언어모델(LLM)과 이미지 생성 AI, 동영상 생성 AI 등을 차례로 선보였습니다. 이제 코딩까지 더해지면 오픈AI나 MS, 구글 등의 생성형 AI 라인업을 대부분 따라잡게 되는 모양새를 갖추게 됩니다.
그동안 애플은 AI와 관련하여 신중한 움직임을 보여왔습니다. 블룸버그에 따르면 “애플은 AI 개발에 점진적인 접근 방식을 취하는 것을 목표로 하며, 일부 계획은 완벽하다고 느껴질 때까지 수년 동안 공개하지 않을 수도" 있습니다. 속도보다는 완성도에 초점을 맞춰온 애플이므로 6월 개발자 연례 컨퍼런스에서 어떤 기술들을 공개할 지 주목됩니다.
'IT Info' 카테고리의 다른 글
Microsoft Word에서 여러 페이지에 걸쳐 표를 구성하는 방법 (4) | 2024.02.17 |
---|---|
멋진 Google Bard(Gemini) 프롬프트 작성의 비밀 (4) | 2024.02.17 |
구글 Gemini Advanced, 구입해야 할까? (97) | 2024.02.16 |
또 일(?)을 낸 오픈AI, 이번엔 동영상 생성 AI ‘소라(Sora)' 발표 (130) | 2024.02.16 |
Gmail에서 정크 메일을 삭제하는 최고의 방법 6가지 (6) | 2024.02.16 |