안녕하세요! AI 이미지를 활용한 다양한 작업에 관심이 많으실 텐데요. 시중에 정말 많은 AI 이미지 생성 프로그램이 나와 있지만, 어떤 걸 선택해야 할지 고민되시죠?
이번 포스팅에서는 Kling, Firefly, Gemini, Chat-GPT, Image-FX, Sora 등 주요 AI 이미지 생성 프로그램의 특징과 장단점을 꼼꼼하게 비교 분석하고 프롬프트 작성 시 유용한 팁까지 자세히 알려드릴게요!
원하는 결과물을 얻기 위한 프롬프트 작성 팁
AI 이미지 생성에서 가장 중요한 것은 프롬프트입니다. 다음 팁을 활용해 보세요!
1. 공통 작성 유의사항
• 주 피사체를 명확히 지시해야 합니다.
• 배경 묘사 시 주 피사체와의 혼선이 생길 수 있으므로 지나치게 디테일하게 묘사하지 않는 것이 좋습니다.
• 지나치게 감각적이거나 추상적인 묘사는 자제해야 합니다.
• Chat-GPT나 Deep-Seek 등 LLM 모델이 제안하는 프롬프트를 너무 믿지 마세요.
• AI 이미지 생성 시, 프롬프트에 묘사된 내용을 과장되게 보여주려는 경향이 강하므로 포즈 등이 과장되거나 이상해질 수 있다는 점을 유의해야 합니다.
2. 효과적인 프롬프트 구성 예시
프롬프트를 긍정 묘사(Positive), 배경 묘사, 스타일 묘사, 그리고 부정 묘사(Negative)로 나누어 구체적으로 작성하면 좋습니다.
Positive (긍정 묘사): 인물, 의상, 소품, 외형 등 주 피사체의 특징을 자세히 묘사합니다.
예시: An asian man wearing black suit and brown round glasses. His hairstyle is dark brown, short pompadour style. Dark eyes. Silver watch on his left wrist. 180cm tall, well looking, aesthetic. Holding an umbrella in his right hand. Brown shoes. (인물 묘사)
배경 묘사: 환경, 조명, 구도 등 배경 정보를 명확히 묘사합니다.
예시: The environment is a photo studio with smooth lighting. There is a rectangular soft light on both sides. White fabric at his back. There are few books and stools on the floor.
스타일 묘사: 원하는 결과물의 느낌 (화질, 스타일, 예술가 등)을 명시합니다.
예시: Photo-realistic, aesthetic, 8k, Best quality, Ansel Adams style.
Negative (부정 묘사): 원하지 않는 결과물(오류)을 명시하여 이미지의 품질을 높입니다.
예시: Wrong Anatomy, distorted, wrong fingers, extra fingers, low quality, jpeg artifacts.
자 그럼 동일 프롬프트로 생성된 이미지로 생성 프로그램들을 비교해보겠습니다. (2025년 7월 기준)
- 1. Kling

Kling: 단순 이미지 생성, 레퍼런스를 이용한 이미지 생성, 이미지 리스타일, 동영상 제작 등 다양한 범주에서 사용 가능합니다. 하지만 예상치 못한, 의도하지 않은 결과가 나올 수 있고, 이미지 생성 강도를 파라미터로 조절할 수 없습니다. 생성된 이미지에서 중국인 느낌이 강하게 나타나는 경향이 있습니다.
2. Firefly

Firefly: 이미지 리스타일을 잘하며 리스타일 시 원본 이미지의 구조를 잘 살리는 편이고 화질 및 색감이 좋다는 장점이 있습니다. 또한 파라미터로 이미지 생성 강도를 조절할 수 있습니다. 다만 이미지가 정리되어 나오지 않는 편이며 단순 이미지 생성에서는 약한 편입니다.
3. Gemini

Gemini: 단순 이미지 생성을 잘하는 편이며 생성된 이미지의 퀄리티가 준수한 편입니다. 그러나 이미지 생성 과정 자체가 답답합니다. 한 번 시도 시 하나의 이미지만 얻을 수 있고 생성 키워드를 인식하지 못해 이미지 생성 자체를 안 해줄 때가 있습니다. 또한 GPT에 비해 연결성, 연계성이 부족하며 생성 결과는 프롬프트와 가장 비슷하지만 딱딱하게 묘사되는 경향이 있습니다.
4. Chat-GPT

Chat-GPT: 연속된 이미지 작업 시 이미지들의 연계성이 뛰어나고 캐릭터 일관성 유지가 가능합니다. 하지만 이미지 생성 속도가 굉장히 느리고 16:9, 9:16 등 이미지 생성 비율 조절이 안 되는 단점이 있습니다. 생성된 이미지가 지나치게 미니멀하며 퀄리티 문제로 사용성이 떨어지는 편입니다. 생성 결과는 스타일이 강하고 심플하며 딱딱하게 묘사됩니다.
4. Sora

Sora: 단순 이미지 생성 및 비디오 생성이 가능하며 (토큰 소모), 실사 풍 이미지를 잘 뽑는 편입니다 (Instagram이나 Facebook 느낌). 그러나 리스타일 및 레퍼런스 응용은 불가합니다. 추상적이거나 비현실적인 이미지 생성에서 약점이 있습니다.
5. Image-FX

Image-FX: 시네마틱한 고화질 이미지 생성에 강점이 있으며 생성 이미지가 자연스럽고 부드럽게 묘사됩니다. 반면 공간에 대한 구조적 이해도가 매우 떨어집니다. 그럴듯한 이미지를 만들어주지만 배경 묘사 등에서 문제점들을 많이 찾을 수 있으며 실사 이외의 이미지 생성에 약점이 있습니다.
생성형 AI의 이미지 생성은 날이 갈수록 발전하고 있습니다. 각 프로그램의 특성과 결과물들을 비교해보시고 원하는 결과물을 얻는 데 도움이 되시길 바랍니다.
Post by 정승헌