AIPromptSmarteasy 사용해 보기 – 나 교수와 글 읽기 – Midjourney is Free Again… and here’s why.

미드저니 무료! 제목이 자극적이니 보게 되네요.  정확한 소식은 무료가 아니고 무료 평가판.  약 25개의 이미지를 생성할 수 있으며, 이후에는 요금제를 구독해야 한다고 합니다.

함께 읽을 스크립트는 “Midjourney is Free Again… and here’s why.” 입니다.  Anthropic을 공급자로 했습니다. 나 교수는 내용에 충실한 제목을 뽑아주네요. “유튜브 스크립트: AI 이미지 생성 모델 비교 분석”

관심 끄는 것은 Idiogram, 읽으면서 눈에 띄는 오타 하나만 고쳐주었습니다. Dally 3 => Dall-E 3

 

유튜브 스크립트: AI 이미지 생성 모델 비교 분석

최근 AI 이미지 생성 분야는 엄청난 혁신을 이루고 있습니다. 특히 Grok 2에서 쏟아져 나오는 놀랍도록 사실적이고, 제약 없는 이미지들은 많은 사람들에게 충격을 안겨주었습니다. Grok 2는 Black Forest Labs의 Flux One 모델을 기반으로 하고 있는데, 최근 제 채널에서 Flux를 활용한 다양한 콘텐츠를 제작하고 있습니다. 특히, 사실적인 이미지 제작 방법과 얼굴 데이터 학습 방법을 다룬 영상들은 큰 인기를 끌었습니다.

이번 주에도 새로운 AI 이미지 생성 모델들이 대거 공개되었는데요, 마치 Midjourney가 이러한 흐름에 자극을 받아 경쟁력을 높이려는 움직임으로 보입니다.

가장 최근에 출시된 Idiogram의 Idiogram 2.0 모델부터 살펴보겠습니다. Idiogram 2.0은 현재 모든 사용자에게 무료로 제공되는 최첨단 텍스트-이미지 변환 모델입니다. Idiogram은 자체 기반 모델을 사용하기 때문에 Stable Diffusion, Dally 3, Flux와는 차별점을 가지고 있으며, 특히 텍스트를 이미지에 자연스럽게 녹여내는 데 탁월한 성능을 보여줍니다. Idiogram 2.0은 다른 AI 이미지 생성기들과 비슷한 수준의 품질을 자랑하지만, 아직까지 ControlNet, Lora, IP 어댑터, 인페인팅, 아웃페인팅과 같은 기능은 지원하지 않습니다.

이번 영상에서는 Idiogram을 비롯한 최신 AI 이미지 생성 모델들을 다양한 기준으로 비교 분석해보겠습니다. 인물 사실성, 풍경 및 배경 묘사, 텍스트 통합, 독특하고 기발한 이미지 생성 능력 등 네 가지 주요 평가 항목을 정하고, 각 항목에 맞는 프롬프트를 Claude를 사용하여 생성했습니다.

예를 들어, 인물 사실성 테스트를 위해 “노란색 우비와 털모자를 쓴 주름진 얼굴의 나이든 어부가 폭풍우 치는 바다를 배경으로 서 있는 모습”이라는 프롬프트를 사용했습니다. Idiogram은 꽤 괜찮은 품질의 이미지들을 생성했지만, 일부 이미지에서는 노이즈가 눈에 띄는 부분도 있었습니다.

풍경 및 배경 묘사 테스트에서는 “황혼녘에 신중하게 갈퀴질한 모래 무늬, 이끼 낀 바위, 만개한 벚꽃 나무가 있는 고요한 일본식 정원”이라는 프롬프트를 사용했습니다. Idiogram은 이 프롬프트에서도 훌륭한 결과물을 보여주었으며, 모든 이미지가 만족스러운 수준이었습니다.

텍스트 통합 능력은 Idiogram이 여전히 강세를 보이는 부분입니다. “안개가 자욱한 신비로운 숲 속, 고대 나무 사이로 흐르는 듯한 글씨로 ‘마법이 기다린다’라는 글자가 쓰여 있는 모습”이라는 프롬프트를 사용했을 때, Idiogram은 네 개의 이미지 모두 완벽하게 텍스트를 삽입하는 데 성공했습니다.

마지막으로 독특하고 기발한 이미지 생성 능력을 평가하기 위해 “스팀펑크 스타일의 문어가 시계태엽으로 만들어진 외발자전거를 타고 네온 큐브를 저글링하며 버블티 바다를 떠다니는 모습”이라는 프롬프트를 사용했습니다. Idiogram은 모든 요소를 완벽하게 구현하지는 못했지만, 프롬프트에 명시된 대부분의 요소를 이미지에 훌륭하게 표현했습니다.

Idiogram 2.0은 하루에 10개의 크레딧을 무료로 제공하며, 크레딧당 4개의 이미지를 생성할 수 있습니다. 즉, 매일 40개의 이미지를 무료로 생성할 수 있으며, 그 이상 사용하려면 요금을 지불해야 합니다.

최근 Idiogram과 Flux가 주목을 받으면서 Midjourney도 변화의 필요성을 느끼고 있는 것으로 보입니다. Idiogram 2.0 무료 공개와 같은 날, Midjourney는 웹 이미지 생성 기능을 모든 사용자에게 공개하고 무료 평가판을 제공한다고 발표했습니다. Midjourney 무료 평가판은 약 25개의 이미지를 생성할 수 있으며, 이후에는 요금제를 구독해야 합니다.

Midjourney는 최근 몇 달 동안 인페인팅 기능 개선 등 몇 가지 새로운 기능을 추가했지만, Idiogram 2.0이나 Flux만큼 큰 변화는 없었습니다.

저는 Midjourney에서도 동일한 프롬프트를 사용하여 이미지를 생성해 보았습니다. Midjourney는 인물 사실성과 풍경 묘사에서 Idiogram과 비슷한 수준의 결과물을 보여주었지만, 텍스트 통합 능력에서는 여전히 아쉬운 모습을 보였습니다.

AI 이미지 생성 분야의 또 다른 주목할 만한 소식은 Canva와 유사한 서비스를 제공하는 Free pik이 AI 업스케일 플랫폼인 Magnific을 인수하고 새로운 AI 이미지 생성 모델인 Mystic을 공개했다는 것입니다. Mystic이 완전히 새로운 기반 모델인지, 아니면 Stable Diffusion이나 Flux를 기반으로 미세 조정된 모델인지는 아직 확실하지 않습니다. Mystic은 아직 알파 테스트 단계이며, 정식 출시 이후에는 일일 생성량 제한 등의 제약이 있을 것으로 예상됩니다.

Leonardo의 Phoenix 모델도 뛰어난 성능을 자랑하는 AI 이미지 생성 모델입니다. Phoenix는 이전에 소개한 다른 모델들과 비교했을 때 사실성과 텍스트 통합 능력 모두 훌륭한 모습을 보여주었습니다.

이 외에도 Stable Diffusion, Dally 3, Adobe Firefly, Google의 Imagen 3 등 다양한 AI 이미지 생성 모델들이 존재합니다.

저는 현재 사용 가능한 주요 AI 이미지 생성 모델들을 비교 분석한 Figma 보드를 제작했습니다. 이 보드에는 각 모델별로 동일한 프롬프트를 사용하여 생성한 이미지들이 나란히 배치되어 있어서 쉽게 비교할 수 있습니다.

Figma 보드 링크는 영상 설명란에 추가해 놓았으니, 관심 있는 분들은 직접 확인해 보세요!

결론적으로 현재 AI 이미지 생성 분야는 매우 빠르게 발전하고 있으며, 대부분의 모델들이 전반적으로 높은 수준의 성능을 보여주고 있습니다.

프롬프트 준수도가 가장 뛰어난 모델은 여전히 Dall-E 3이며, 사실성 측면에서는 Flux One이 가장 뛰어납니다. 텍스트 통합 능력은 Idiogram이 가장 뛰어나지만, Phoenix, Flux, Dally 3, Imagen 3, Playground V3 등 다른 모델들도 준수한 성능을 보여줍니다.

어떤 AI 이미지 생성 모델을 사용할지는 개인의 필요와 취향에 따라 달라질 것입니다. 다행히도 현재 무료로 사용할 수 있는 옵션도 많기 때문에, 다양한 모델들을 직접 사용해 보고 자신에게 가장 적합한 모델을 선택하는 것을 추천합니다.

AI 이미지 생성 기술의 발전은 우리에게 무한한 가능성을 열어줍니다. 이제 누구나 상상하는 이미지를 쉽게 만들어낼 수 있는 시대가 왔습니다.

오늘 영상이 도움이 되었기를 바라며, 영상이 마음에 드셨다면 좋아요와 구독 부탁드립니다. 다음 영상에서 더욱 흥미로운 AI 도구와 소식으로 찾아뵙겠습니다. 감사합니다!

About the Author
(주)뉴테크프라임 대표 김현남입니다. 저에 대해 좀 더 알기를 원하시는 분은 아래 링크를 참조하세요. http://www.umlcert.com/kimhn/

Leave a Reply

*