Excel & IT Info

아이엑셀러 닷컴, 엑셀러TV

IT Info

또 일(?)을 낸 오픈AI, 이번엔 동영상 생성 AI ‘소라(Sora)' 발표

권현욱(엑셀러) 2024. 2. 16. 14:30
반응형

오픈AI가 또 일(?)을 저질렀습니다. 이번에는 텍스트 프롬프트로 비디오를 만드는 생성형 AI입니다. 소라(Sora)라는 이름의 이 생성형 AI 모델은 요청받은 프롬프트를 이용하여 동영상을 만들어줍니다. 아직은 1분 길이의 비디오를 제작할 수 있지만 엄청난 잠재력과 파급력이 있을 것으로 보입니다.

권현욱(엑셀러) | 아이엑셀러 닷컴 대표 · Microsoft Excel MVP · Excel 솔루션 프로바이더 · 작가

동영상 생성형 AI, Sora 개요

챗GPT의 인기에 힘입어 인공지능(AI) 영역의 주류로 떠오른 오픈AI가 인공지능 기술을 영상에 접목했습니다. 오픈AI는 새로운 생성 AI 모델인 소라(Sora)를 출시했습니다. Sora는 사용자가 입력한 텍스트 프롬프트(prompt)를 고화질 비디오 클립으로 만들어줍니다. DALL-E와 비슷하지만 이미지가 아닌 동영상으로 만들어 준다는 차이가 있습니다. Sora는 스틸 이미지에서 영감을 받은 비디오 클립을 생성하고 기존 비디오를 확장하거나 누락된 프레임을 채울 수도 있습니다.
 
Sora는 현재 1분 이하의 동영상 생성으로 제한되어 있습니다. 아직 완전한 상태는 아니며, 개발 단계에 있지만 복잡한 장면을 처리하고 물리학을 이해하는 능력을 통해 동영상 제작 분야에서 상당한 잠재력을 보여줍니다.

아직은 모두가 Sora를 사용할 수 있는 것은 아닙니다. 현재는 소수의 안전 테스터, 즉 '레드 팀원(red teamers)'만 사용할 수 있었으며, 이들은 잘못된 정보나 편견과 같은 영역에서 모델의 취약성을 테스트했습니다. 오픈AI는 웹 사이트를 통해 여러 개의 샘플 클립을 공개했습니다.
 

Sora로 생성한 비디오 클립 둘러보기

오픈AI는 Sora가 제작한 비디오 클립을 웹 사이트를 통해 소개했습니다. 전체 영상 중에서 5가지를 골라 보았습니다. 영상 제작에 사용된 프롬프트도 첨부해 두었습니다.
 

# 1. 도쿄 거리를 걷고 있는 여성

(이미지: OpenAI 영상에서 아이엑셀러 닷컴 capture)

 

[사용된 프롬프트] A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

한 세련된 여성이 따뜻하게 빛나는 네온과 생동감 넘치는 도시 간판으로 가득한 도쿄 거리를 걷고 있습니다. 그녀는 검은색 가죽 재킷, 긴 빨간색 드레스, 검은색 부츠를 입고 검은색 지갑을 들고 있습니다. 선글라스와 빨간 립스틱을 착용하고 있습니다. 그녀는 자신감 있고 자연스럽게 걷습니다. 길은 축축하고 반사되어 화려한 조명이 거울 효과를 만들어 냅니다. 많은 보행자가 걸어갑니다.

 

# 2. 눈 덮인 벌판을 누비는 매머드

(이미지: OpenAI 영상에서 아이엑셀러 닷컴 capture)

 

[사용된 프롬프트] Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.

여러 마리의 거대한 털매머드가 눈 덮인 초원을 밟으며 다가오고, 걸을 때 긴 털은 바람에 가볍게 날리고, 눈 덮인 나무와 멀리 보이는 드라마틱한 눈 덮인 산, 뭉게구름과 멀리 보이는 태양이 따뜻한 빛을 내는 한낮의 오후, 낮은 카메라 뷰는 아름다운 사진, 심도로 대형 털매머드를 포착하는 멋진 영상입니다.

 

# 3. 철새처럼 날아다니는 종이 비행기

(이미지: OpenAI 영상에서 아이엑셀러 닷컴 capture)

 

[사용된 프롬프트] A flock of paper airplanes flutters through a dense jungle, weaving around trees as if they were migrating birds.

종이비행기 무리가 울창한 밀림을 날아다니며 마치 철새처럼 나무 주위를 휘감아 날아다닙니다.

 

# 4. 예술 작품이 가득한 미술관 투어

(이미지: OpenAI 영상에서 아이엑셀러 닷컴 capture)

 

[사용된 프롬프트] Tour of an art gallery with many beautiful works of art in different styles.

다양한 스타일의 아름다운 예술 작품이 가득한 미술관을 둘러보세요.

 

# 5. 잠자는 주인을 깨우는 고양이

(이미지: OpenAI 영상에서 아이엑셀러 닷컴 capture)

 

[사용된 프롬프트] A cat waking up its sleeping owner demanding breakfast. The owner tries to ignore the cat, but the cat tries new tactics and finally the owner pulls out a secret stash of treats from under the pillow to hold the cat off a little longer.

고양이가 잠자는 주인을 깨워 아침 식사를 요구합니다. 주인은 고양이를 무시하려고 하지만 고양이는 새로운 전술을 시도하고 결국 주인은 베개 밑에 숨겨둔 간식을 꺼내어 고양이를 조금 더 버티게 합니다.

 
오픈AI가 이번에 공개한 전체 영상은 [이곳]에서 확인할 수 있습니다.
 

한계와 주의할 점

현재 Sora AI는 약점이 있습니다. 오픈AI에 따르면, 복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있으며 원인과 결과의 특정 사례를 이해하지 못할 수도 있습니다. 예를 들어, 어떤 사람이 쿠키를 한 입 베어물었지만 나중에 쿠키에 물린 자국이 없을 수도 있습니다.

또한 왼쪽과 오른쪽을 혼합하는 등 프롬프트의 공간적 세부 사항을 혼동할 수 있으며, 특정 카메라 궤적을 따르는 것과 같이 시간이 지남에 따라 발생하는 이벤트에 대한 정확한 설명에 어려움을 겪을 수 있습니다.
 
Sora는 현재 공개적으로 사용할 수 없습니다. 오픈AI는 "연구원들이 위험을 확인"하기 위해 노력하고 있기 때문이라고 합니다. 이 모델이 어떻게 훈련되었는지, 또 어떤 데이터를 사용했는지 등에 대해서도 밝히지 않고 있습니다만, ChatGPT의 진화과정에 비춰보았을 때, 앞으로 엄청난 반향이 있을 것으로 예상됩니다.

Excel과 VBA의 모든 것 아이엑셀러 닷컴 · 강사들이 숨겨 놓고 보는 엑셀러TV