생성형 이미지 제너레이터 끝판왕, 플럭스

“본 영상은 매일경제신문사에서 출간한 “AI 비즈니스 트렌드 2025(기업과 개인이 가장 많이 쓰는 AI 서비스 40가지)” 내용중 일부를 발췌하여 저자와 출판사의 동의를 받고 영상으로 제작했음을 밝힙니다”

머릿속 이미지가 순식간에 현실이 되는 세상을 상상해 본 적이 있나요? 그 중심에는 AI 이미지 생성 기술이 있다. 디지털 콘텐츠 제작이 핵심 산업으로 부상하면서, AI 기술은 눈부신 발전을 이루고 있다. 특히 이미지 생성 분야에서 AI의 활약은 광고, 영화, 게임 등 다양한 영역을 재편하고 있다.

말하는 대로 이뤄지는 이미지 창조의 시대

최근 AI 기술의 발전으로 우리는 놀라운 동영상 생성 기술을 목격하고 있다. 오픈AI 소라(Sora)나 메타의 Make-A-Video와 같은 혁신적인 모델들이 등장하면서, 단순한 텍스트 입력만으로도 사실적이고 창의적인 동영상을 만들어내는 시대가 열렸다. 이러한 트렌드의 중심에는 ‘이미지넷(ImageNet)’이라는 기술이 자리 잡고 있으며, 이는 단일 이미지의 중요성을 더욱 부각시킨다. 이미지넷은 컴퓨터가 세상을 ‘보고’ 이해할 수 있게 만든 거대한 디지털 그림책이라고 할 수 있다. 1,400만 장이 넘는 사진으로 구성된 이 데이터베이스는 각 이미지에 대한 설명이 포함돼 있다. 마치 우리가 어릴 때 그림책을 보며 세상을 배우듯, 컴퓨터는 이 방대한 이미지 라이브러리를 통해 ‘강아지’, ‘자동차’, ‘꽃’ 등 수천 가지의 개념을 학습하였다.

이렇게 훈련된 AI는 새로운 이미지를 봤을 때 그 안의 내용을 정확히 인식하고 이해할 수 있게 된다. 이는 단순히 이미지 인식을 넘어서, AI가 우리의 시각적 세계를 이해하고 해석하는 기반이 되었다. 이미지넷은 최신 AI 이미지 생성 도구들의 발전에 결정적인 영향을 미쳤으며, 이를 통해 AI는 이제 단순히 이미지를 인식하는 것을 넘어 새로운 이미지와 영상을 창조할 수 있게 되었다.

AI 이미지 생성의 새로운 강자, 플럭스(Flux)

이러한 기술의 발전에 따라 다양한 AI 이미지 생성 도구들이 등장했다. 달리(DALL-E), 미드저니(Midjourney), 스테이블 디퓨전(Stable Diffusion) 등이 대표적이다. 그리고 이제 이들을 뛰어넘는 놀라운 성능으로 주목받고 있는 것이 바로 플럭스(https://flux-ai.io/)다. 디지털 피카소라고 불리는 플럭스는 독일의 AI 스타트업 블랙 포레스트 랩스가 개발했다.

플럭스의 가장 큰 특징은 이미지 생성의 기술적 한계를 극복했다는 점이다. 특히 인체 표현과 같은 정밀한 작업이나 텍스트, 로고와 같은 시각적 요소의 정확한 재현은 기존 도구들이 해결하지 못했던 문제였는데, 플럭스는 이를 해결하며 매우 정교한 이미지를 생성할 수 있는 능력을 갖췄다.

2024년 8월 출시된 플럭스 1.1 프로(Pro) 버전은 더 향상된 성능을 보여주고 있다. 이 버전은 이전보다 더 빠른 속도로 작동하면서도 이미지 품질이 상당히 개선됐다. 특히 다른 고가의 AI 이미지 생성 도구들에 비해 비용 효율성이 높고 속도도 빠르면서 이미지 품질이 매우 뛰어나다는 평가를 받고 있다. 이러한 특성 덕분에 영화 제작자뿐만 아니라 다양한 창작자들에게 유용한 도구로 자리 잡을 것이다.

플럭스의 놀라운 성능 덕분에 이제 인체 표현과 같은 복잡한 작업도 자연스럽게 구현할 수 있다. 특히 패션, 광고, 게임 산업에서 세밀하고 정확한 인체 표현은 필수적이다. 상상 속의 디자인이 순식간에 현실로 구현되는 이유는 바로 이러한 정교한 기술 덕분이다. 인체의 미세한 표현까지도 정확하게 처리한다.

예를 들어, “한국 20대 여성이 요가를 하고 있는 장면”이라는 프롬프트로 이미지를 생성했을 때, 손가락과 발가락의 개수는 물론, 요가 동작의 섬세한 표현까지 정확하게 재현했다. 기존 AI 도구들이 자주 범했던 오류들을 개선한 플럭스는 광고, 게임 캐릭터 디자인 등 다양한 분야에서 효율적으로 활용될 수 있다.

플럭스의 또 다른 강점은 텍스트와 로고의 표현이다. AI 이미지 생성 도구들이 텍스트를 이미지 안에 정확하게 삽입하는 것은 큰 도전이었다. 기존 도구들은 텍스트나 로고를 이미지 안에 삽입할 때 왜곡되거나 알아보기 힘든 형태로 표현되는 문제가 있었다. 하지만 플럭스는 이러한 문제를 완벽하게 해결하며 브랜드 로고와 텍스트를 이미지에 정확히 삽입할 수 있어, 맞춤형 광고 제작이 더욱 효율적으로 진행되고 있다. 이는 광고 제작 시간과 비용을 크게 줄이면서도 브랜드의 정체성을 정확하게 표현할 수 있게 해준다.

상상력의 한계를 넘는 창의적 이미지 조합 구현

플럭스는 상상력이 필요한 복잡한 이미지도 정교하게 처리할 수 있어, 창작자들에게 무한한 가능성을 제공한다. 예를 들어, “정원에 노란 나무와 그 옆에 초록 고양이가 앉아 있고, 뒤에는 핑크색 자동차가 있다”는 다소 비현실적인 프롬프트에도 완벽한 이미지를 생성한다. 이러한 성능은 게임 디자인, 영화 세트 디자인 및 광고 이미지 제작 등에서 상상력을 극대화할 수 있는 기회를 제공한다.

플럭스로 생성한 이미지를 기반으로 디포럼(Deforum)이나 애니메이트디퓨전(AnimateDiff)와 같은 도구를 사용해 애니메이션이나 동영상을 제작할 수 있다. 이러한 기능은 단순한 스토리보드 작업뿐만 아니라 다양한 연출에서도 활용된다.

전문가들은 2030년까지 영화 제작의 50% 이상이 AI 이미지 생성 기술을 활용할 것으로 전망한다. 이는 엔터테인먼트 산업의 판도를 크게 바꿀 전망이다. 더불어 교육 시스템의 변화도 예상된다. 예를 들어 미술 교육의 방향이 ‘그리는 법’에서 ‘상상하는 법’으로 변화할 수 있다는 관점이 제시되고 있다.

이제 우리에게 남은 과제는 ‘이 강력한 도구를 어떻게 현명하게 활용해 더 나은 미래를 만들어갈 것인가’ 하는 점이다. 우리는 모두 이 새로운 디지털 창작의 시대를 각자의 방식으로 맞이하고 있다.

이승준 교수준 다른 콘텐츠 보기