들어가기 전에
인공지능(AI) 이미지 생성기는 텍스트 프롬프트를 사용하여 몇 초 만에 이미지를 만들어줍니다. 달리(DALL-E)뿐만 아니라 여러 가지 옵션이 있으며, 그 중 9가지 AI 이미지 생성기의 장단점과 특징을 비교합니다.
※ 이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.
- 원문: The best AI image generators to try right now
- URL: https://www.zdnet.com/article/best-ai-image-generator/
개요: 전반적으로 가장 좋은 AI 이미지 생성기
OpenAI의 DALL-E 2는 최초의 주류 AI 이미지 생성기로 큰 반향을 일으켰습니다. 그 후 다른 회사들은 DALL-E 2와 경쟁하는 모델을 출시했고, OpenAI는 이전 모델을 대체하는 더욱 진보된 모델인 DALL-E 3를 출시하기도 했습니다.
어떤 모델이 다른 작업에 더 나은지 알아내는 데 도움이 되도록, 각 도구에 동일한 프롬프트를 제공하여 이미지 생성기를 테스트했습니다. "눈으로 덮인 해변에 앉아 있는 두 마리의 요크셔 테리어." 또한 필요에 가장 잘 맞는 도구를 결정하는 데 도움이 되도록 스크린샷도 포함했습니다.
실제 이미지 출력은 이미지 생성기를 선택하는 데 있어서 하나의 요소에 불과하므로 테스트를 통해 얻은 비용, 속도, 접근성 및 기타 특징에 대한 세부 정보도 포함했습니다.
Microsoft Designer's Image Creator는 최고의 전반적인 AI 이미지 생성기입니다. DALL-E 3처럼 정확성, 속도, 비용 효율성을 결합하고 몇 초 만에 고품질 이미지를 생성할 수 있습니다. DALL-E 3와 달리 이 도구는 무료입니다. 동물, 사물 또는 심지어 추상적인 개념의 이미지를 생성하고 싶든, Image Creator는 기대에 부응하는 정확한 묘사를 만들어낼 수 있습니다. 매우 효율적이고 사용자 친화적이며 비용 효율적입니다.
1. 마이크로소프트 디자이너 이미지 크리에이터
Microsoft Designer's Image Creator는 OpenAI의 가장 진보된 이미지 생성 모델인 DALL-E 3로 구동됩니다. DALL-E와 동일한 품질의 결과를 생성하지만 무료이므로 DALL-E를 사용하기 위해 월 20달러의 ChatGPT Plus 구독료를 지불할 필요가 없습니다.
이미지 생성기를 사용하려면 Image Creator 웹사이트를 방문하여 Microsoft 계정으로 로그인하거나, 계정이 없으면 무료로 계정을 만드세요.
이 AI 생성기의 또 다른 주요 장점은 Microsoft의 AI 챗봇 인 Copilot(이전의 Bing Chat) 에 액세스하는 것과 같은 곳에서 액세스할 수 있다는 것입니다. 즉, 독립형 사이트에서 Image Creator를 방문하는 것 외에도 Copilot에서 이미지를 생성해 달라고 요청할 수 있습니다. 이미지를 렌더링하려면 대화식으로 Copilot에 원하는 이미지를 그려 달라고 요청하기만 하면 됩니다.
이 도구는 사용하기 편리합니다. 모든 이미지 생성 및 AI 채팅 요구 사항을 한 곳에서 무료로 충족할 수 있습니다. 이는 파티 계획과 같이 이미지 및 텍스트 생성에서 이점을 얻을 수 있는 작업을 용이하게 하는데, 챗봇에 파티 테마를 생성하도록 요청한 다음 테마에 맞는 이미지를 만들 수 있기 때문입니다.
이를 위해 Copilot 웹사이트를 방문하여 로그인하여 이미지 생성에 액세스하기만 하면 됩니다. 학교 또는 직장 계정을 사용하는 경우 이미지를 생성할 수 없는 몇 가지 제한이 있을 수 있으므로 개인 계정을 사용하세요.
2. 오픈AI DALL-E 3
OpenAI는 2022년 11월에 DALL-E 2를 출시했습니다. 이 도구는 빠르게 시장에서 가장 인기 있는 AI 이미지 생성기가 되었습니다. 가장 진보된 이미지 생성기인 DALL-E 3를 출시한 후 OpenAI는 DALL-E 2를 중단했습니다.
DALL-E 3는 원래 모델보다 더 강력하지만 비용이 듭니다. DALL-E 3에 액세스하려면 ChatGPT Plus 구독자여야 하며, 멤버십 비용은 월 20달러입니다. 구독하면 ChatGPT 또는 ChatGPT 앱을 통해 DALL-E 3에 액세스할 수 있습니다.
DALL-E 3를 사용하는 것은 매우 직관적입니다. 원하는 프롬프트를 입력하고 비전을 실현하는 데 필요한 만큼 세부 정보를 지정하면 DALL-E 3가 프롬프트와 일치하는 이미지 1~2개를 생성합니다. 기사 상단의 이미지에서 볼 수 있듯이 렌디션은 고품질이고 매우 사실적입니다.
OpenAI는 최근에 생성된 이미지를 편집할 수 있는 새로운 방법을 추가했는데, 여기에는 쉬운 대화형 텍스트 프롬프트와 편집하려는 이미지 부분을 클릭하는 기능 등이 포함됩니다.
Copilot과 마찬가지로, 동일한 플랫폼에서 채팅하고 이미지를 렌더링할 수 있어 이미지와 텍스트 생성에 의존하는 프로젝트에서 작업하기가 편리합니다. 돈을 쓰고 싶지 않다면 Image Creator는 무료이고 DALL-E 3를 사용하며 Copilot을 통해 액세스할 수 있기 때문에 좋은 대안입니다.
3. 구글 Gemini Imagen 2
Gemini(기존 Bard)를 출시한 이후 Google은 사진을 생성할 수 있도록 서비스를 업데이트했습니다. Imagen 2를 사용하면 이미지 생성기는 손과 같이 렌더링하기 어려운 물체의 경우에도 고품질의 사실적인 출력을 생성할 수 있습니다.
ChatGPT 및 Copilot과 마찬가지로 Gemini와 채팅하는 동안 액세스할 수 있어 텍스트 및 이미지 생성 요구 사항에 대해 다른 플랫폼 간의 컨텍스트 전환을 피하는 데 유용합니다. DALL-E와 달리 4개의 이미지를 동시에 생성하여 단일 프롬프트를 최대한 활용하는 데 도움이 됩니다.
Google 사용자라면 Gemini의 사용자 인터페이스가 마음에 들 것입니다. Google 검색과 동일한 모양과 느낌을 유지하기 때문입니다. 또한 Google 검색에 직접 연결되는 속성이 있는데, 예를 들어 검색에서 응답의 유효성을 두 번 확인하는 Google 아이콘과 검색 엔진으로 이동하는 클릭 가능한 링크가 있습니다.
4. Stability AI의 DreamStudio
Stability AI는 엄청나게 인기 있는 오픈 소스 텍스트-이미지 생성기인 Stable Diffusion을 만들었습니다. 사용자는 도구를 다운로드하여 무료로 사용할 수 있지만 약간의 기술적 기술이 필요할 수 있습니다.
기술 수준에 관계없이 모든 사람이 기술을 더 쉽게 이용할 수 있도록 Stability AI는 이해하고 사용하기 쉬운 UI에 Stable Diffusion을 통합한 DreamStudio를 만들었습니다.
이 플랫폼의 두드러진 특징 중 하나는 사용자 정의를 위한 다양한 항목이 포함되어 있다는 것입니다. 여기에는 최종 이미지에서 피하고 싶은 세부 사항을 설명할 수 있는 "부정적 프롬프트"가 포함됩니다. 이미지 비율을 쉽게 변경할 수도 있습니다. 이는 대부분의 AI 이미지 생성기가 자동으로 1:1을 제공하기 때문에 중요한 기능입니다. 접속하려면 Stability.ai 계정을 만들거나 기존 Google 또는 Discord 계정으로 로그인해야 합니다.
5. Wombo Dream
이 앱은 Google Play의 2022년 어워드 에서 전체 앱 부문에서 1위를 차지했으며 , Apple 앱 스토어에서 142.9K의 평점으로 4.8점을 받았습니다. Dream을 사용하면 간단한 프롬프트 입력으로 아트와 이미지를 만들 수 있습니다.
이 AI 이미지 생성기를 사용하면 사실적, 표현주의적, 만화적, 추상적, 광신적, 잉크 등과 같은 다양한 디자인 스타일을 선택할 수 있습니다. 이를 통해 원하는 출력을 얻기 위한 완벽한 프롬프트를 만드는 데 있어 추측 작업을 제거하는 데 도움이 됩니다.
앱 외에도 이 도구에는 사용하기 쉬운 무료 데스크톱 모바일 버전이 있습니다. 앱 사용을 한 단계 더 높이고 싶다면 연간 90달러 또는 월 10달러를 지불해야 합니다.
6. 크레용
원래 DALL-E mini라는 이름이 붙었지만, 이 AI 이미지 생성기는 OpenAI나 DALL-E와 제휴하지 않았습니다. 오히려 오픈소스 대안입니다. 그럼에도 불구하고, 이 도구는 DALL-E가 하는 모든 것을 하지만 덜 정확한 렌디션을 하기 때문에 이름이 어느 정도 맞습니다.
DALL-E와 달리 크레용(Craiyon)의 출력은 그렇게 고품질이 아니며 렌더링하는 데 더 오래 걸립니다. 약 1분 정도인데, 모든 것을 고려하면 여전히 꽤 빠릅니다. 가장 큰 장점은 무제한 프롬프트가 있기 때문에 정확히 상상한 것을 얻을 때까지 프롬프트를 계속 조정할 수 있다는 것입니다.
또한 "부정적인 단어"를 포함할 수 있는데, 이는 보고 싶지 않은 것을 설명하는 데 도움이 되어 최상의 결과를 얻을 수 있도록 합니다. 이 도구는 또한 나열된 다른 모든 챗봇보다 많은 9개의 이미지를 생성합니다.
7. 미드저니
다양한 AI 생성기를 사용해 본 경험에도 불구하고, Midjourney에 대비할 수 있는 것은 아무것도 없었습니다. 이미지 출력이 너무나 선명해서 누군가가 찍은 사진이 아니라고 믿기 힘들었습니다. 이 소프트웨어는 너무 좋아서 수상 경력에 빛나는 예술 작품을 만들어냈습니다.
그렇긴 하지만 Midjourney는 그다지 사용자 친화적이지 않습니다. Midjourney의 또 다른 문제는 무료로 액세스할 수 없다는 것입니다. 최근에 이미지를 렌더링하려고 했을 때 다음과 같은 오류 메시지가 나타났습니다. "수요가 너무 많아서 지금은 무료 체험판을 제공할 수 없습니다. Midjourney로 이미지를 만들려면 구독하세요." 그러나 사실적인 품질을 찾고 있다면 투자할 가치가 있다고 말하고 싶습니다.
8. 어도비 파이어플라이
Adobe는 수십 년 동안 창의적이고 일하는 전문가를 위한 창의적 도구 개발 분야에서 선두 주자였습니다. 그 결과, 이미지 생성기가 인상적이라는 것은 놀라운 일이 아닙니다. 생성기에 액세스하는 것은 쉽습니다. 웹사이트를 방문하여 생성하려는 이미지의 프롬프트를 입력하기만 하면 됩니다. 위에서 볼 수 있듯이, 렌더링된 이미지는 고품질이고 사실적이며 자세합니다.
이 챗봇의 가장 두드러진 특징은 구조 참조와 스타일 참조입니다. 구조 참조를 사용하면 AI 모델이 템플릿으로 사용할 이미지를 입력할 수 있습니다. 그런 다음 모델은 이 구조를 사용하여 동일한 레이아웃과 구성으로 새 이미지를 만듭니다. 스타일 참조는 이미지를 참조로 사용하여 동일한 스타일로 새 이미지를 생성합니다.
이러한 기능은 새로 생성된 이미지와 닮게 하고 싶은 이미지가 있는 경우 유용합니다. 예를 들어, 그린 간단한 스케치나 일관되게 유지하고 싶은 비즈니스 로고 또는 스타일이 있습니다. 새 이미지를 만들 때 구조 참조의 "강도"(모델이 참조의 이미지 구조를 얼마나 준수하는지)를 조정하여 필요에 따라 참조에 가볍게 또는 무겁게 의존할 수 있습니다.
또 다른 장점은 Adobe Firefly가 Adobe Stock 이미지, 공개 라이선스 콘텐츠 및 퍼블릭 도메인 콘텐츠를 기반으로 학습되었기 때문에 생성된 모든 이미지가 상업적 사용에 안전하다는 것입니다.
9. 게티 이미지의 Generative AI
AI 이미지 생성기의 가장 큰 문제 중 하나는 일반적으로 인터넷에서 스크래핑한 콘텐츠로 생성기를 훈련시킨다는 것입니다. 즉, 생성기는 보상 없이 창작자의 예술의 측면을 사용한다는 의미입니다. 이러한 접근 방식은 또한 생성기를 사용하는 기업을 저작권 침해 위험에 빠뜨립니다.
Getty Images의 Generative AI는 Getty Images의 방대한 크리에이티브 라이브러리에서 온 콘텐츠로만 이미지를 생성하여 이 문제를 해결하고 상업적 사용에 대한 완전한 면책을 제공합니다. 생성된 이미지에는 Getty Images의 표준 로열티 프리 라이선스가 적용되어 콘텐츠가 법적 책임을 두려워하지 않고도 공정하게 사용할 수 있음을 보장합니다.
또 다른 장점은 모델을 훈련하는 데 사용된 콘텐츠의 기여자는 훈련 세트에 포함된 것에 대해 보상을 받는다는 것입니다. 이는 창의적인 비전과 일치하는 스톡 사진을 원하지만 저작권 관련 문제를 다루고 싶지 않은 기업에 좋은 솔루션입니다.
AI 이미지 생성기는 어떻게 사용하나요?
다른 생성 AI 모델과 마찬가지로 AI 이미지 생성기는 실행하기 위해 많은 데이터가 필요합니다. 일반적으로 이러한 모델은 수십억 개의 이미지로 훈련된 후 새로운 이미지를 만드는 데 사용됩니다. 이러한 생성기는 광범위한 데이터로 훈련되기 때문에 인상적인 사진을 생성할 수 있습니다. 다음의 간단한 단계에 따라 직접 사용을 시작해 보세요.
- 사용하고 싶은 발전기의 웹사이트를 방문합니다.
- 생성기에 접속하려면 사이트가 계정이 있어야 하는 경우 로그인하거나 계정을 만듭니다.
- 생성기에서 출력하려는 내용에 대한 자세한 프롬프트를 입력합니다.
AI 이미지 생성기 요약
이상에서 소개한 AI 이미지 생성기를 표로 정리했습니다.
구분 | 가격 | 출력 속도 | 접근성 |
Designer's Image Creator | 무료 | Fast | 웹, 앱 |
DALL-E 3 | 월 20달러 | Fast | 웹, 앱 |
Imagen 2 | 무료 | Fast | 웹, 앱 |
DreamStudio | 무료 + 크레딧 | Fast | 웹 |
Wombo Dream | 무료 + 구독 | Fast | 모바일, 데스트톱 |
Craiyon | 무료 | Slower | 웹 |
Midjourney | 월 10달러부터 시작 | Fast | 웹 |
Firefly | 무료 | Fast | 웹 |
Getty Images Generative AI | 영업팀 문의 | Unknown |
가격과 기능은 변경될 수 있습니다. Getty Images의 Generative AI는 비즈니스 도구이기 때문에 테스트하지 않았고, 따라서 속도를 측정할 수 없었습니다.
'IT Info' 카테고리의 다른 글
Microsoft Authenticator를 비밀번호 관리자로 사용하는 방법 (6) | 2024.09.07 |
---|---|
챗GPT, 어디까지 사용해 보셨나요? (0) | 2024.09.06 |
최근 공유된 정보 목록 (24/09/05) (10) | 2024.09.05 |
Microsoft 목록: 스마트 정보 추적을 위한 최고의 가이드 (24) | 2024.09.03 |
배터리 수명을 최대화하기 위해 Windows 11 PC에서 변경한 9가지 (8) | 2024.09.02 |