Gen AI
Image Generator

아이콘, 심볼 이미지 생성을 위한 최고의 생성 AI는?(Text-to-Image)

- [Gen AI]이미지 생성 AI 비교

Sept. 5, 2024, 10:11 p.m.

요즘 너무나 많은 생성형 AI 서비스가 쏟아져 나오고 있습니다.

때문에, 어떤 생성형 AI를 쓰는 것이 좋을지에 대한 고민이 많습니다.

이 프로젝트에서는 나에게 가장 좋은 이미지 생성 AI 서비스를 찾아보기 위하여, 다양한 용도에 대하여 각각 이미지 생성 AI 서비스들을 사용해보고 이를 비교해보고자 합니다.

 

프로젝트의 첫 글로써, 해당 포스트에서는 아래 이미지들과 같은 아이콘(심볼) 또는 간단한 일러스트를 그리기 위해서 생성 AI 서비스들을 각각 이용해보고자 합니다.

 

아무리 생성 AI들이 갈수록 사진과 같은 이미지를 잘 만들어낸다고 하더라도 그런 이미지는 사실 업무적인 차원에서는 활용도가 높지 않은 경우가 많은데요,

오히려 개인적으로 가장 활용도가 높은 부분은 이러한 아이콘이나 간단한 일러스트를 생성하는 것이었습니다.

해당 포스트에서는 아이콘 또는 심볼을 그리는데에 있어서 가장 좋은 AI를 찾기 위해 DALL-E(ChatGPT), Midjourney, Ideogram, Flux, Adobe Firefly를 모두 써보고 비교해보았습니다.

 

주의

해당 포스트는 '아이콘 또는 간단한 일러스트'를 위한 이미지 생성에만 포커스를 맞추어 작성하였습니다.

절대 각 생성형 AI 서비스 전체에 대한 리뷰를 하는 것이 아니기에, 이 점 유의하여 봐주시기 바랍니다.

 

 

이미지에 대한 설명 프롬프트 추출하기

이번 포스트에서는 텍스트를 입력하여 이를 통해 아이콘이나 간단한 일러스트 이미지를 생성하고자 합니다.

이미지 생성을 생성 AI 프롬프트로 입력하기 위해서는 적절한 프롬프트가 필요합니다.

때문에 이러한 프롬프트를 뽑아내기 위하여,

아래 이미지처럼 ChatGPT에 각 이미지를 입력하고, 해당 이미지를 생성형 AI 서비스를 이용하여 똑같이 그리기 위한 프롬프트를 뽑아달라고 요청하였습니다.

 

그 결과는 아래 표와 같습니다.

결과를 보시면 아실 수 있는 것처럼, 색깔부터 자세, 모양 등 아주 자세하게 설명이 되어있는 것을 볼 수 있습니다.

Input Image Prompt
"Create a flat, vector-style illustration of a man wearing a blue business suit with a yellow tie. The man's hair is dark and styled in a simple, short cut. He is smiling widely, showing a cheerful expression. His right arm is bent at the elbow, raised and slightly angled, with his hand closed in a fist. The man's shoes are black, and his overall appearance is friendly and approachable. The colors used in the illustration are simple and clean, with solid fills and no shading or gradients."
"Create a simple, flat, vector-style icon of a round, handheld mirror with a black outline. The mirror is oval-shaped and has a thick outer frame in a light blue color. Inside the mirror is a slightly smaller oval with a reflection effect created by two diagonal lines across the surface, representing glare or shine. The lines are parallel and positioned diagonally from top left to bottom right. The overall style is minimalist with bold outlines and soft, solid colors."
"Create a black, minimalist, vector-style icon of a bowl of noodles. The bowl is depicted in a simple, flat silhouette with a small reflective detail on the left side. Above the bowl, a pair of chopsticks is shown holding wavy noodles. The chopsticks are positioned diagonally, with the noodles hanging down into the bowl. The entire design is in solid black with no shading, providing a clean, simplistic look."

 

이렇게 프롬프트를 뽑아보니 벌써부터 결과가 궁금해지네요.

아래는 각 생성형 AI 서비스 별 결과물입니다.

 

 

 

 

 

 

 

 

 

 

 

DALL-E(ChatGPT) 결과

해당 프롬프트를 ChatGPT에서 뽑아낸 만큼, ChatGPT를 통해 사용할 수 있는 DALL-E가 기대감이 컸습니다.

아래와 같이 프롬프트를 ChatGPT에 입력하여 결과물을 뽑아보았습니다.

 

위와 같이 어느정도 그림체나 색깔이 반영되어있는데, 무엇인가 느낌이 조금 별로입니다. 

그 외의 이미지들까지 모두 정리하여 아래와 같이 표로 만들었습니다.(가장 input과 유사해 보이는 이미지 기준 추출)

 

 ChatGPT 생성 프롬프트 기반 이미지 생성 결과

Input Prompt DALL-E(ChatGPT) Output
"Create a flat, vector-style illustration of a man wearing a blue business suit with a yellow tie. The man's hair is dark and styled in a simple, short cut. He is smiling widely, showing a cheerful expression. His right arm is bent at the elbow, raised and slightly angled, with his hand closed in a fist. The man's shoes are black, and his overall appearance is friendly and approachable. The colors used in the illustration are simple and clean, with solid fills and no shading or gradients."
"Create a simple, flat, vector-style icon of a round, handheld mirror with a black outline. The mirror is oval-shaped and has a thick outer frame in a light blue color. Inside the mirror is a slightly smaller oval with a reflection effect created by two diagonal lines across the surface, representing glare or shine. The lines are parallel and positioned diagonally from top left to bottom right. The overall style is minimalist with bold outlines and soft, solid colors."
"Create a black, minimalist, vector-style icon of a bowl of noodles. The bowl is depicted in a simple, flat silhouette with a small reflective detail on the left side. Above the bowl, a pair of chopsticks is shown holding wavy noodles. The chopsticks are positioned diagonally, with the noodles hanging down into the bowl. The entire design is in solid black with no shading, providing a clean, simplistic look."

모두 이미지 자체는 괜찮은 편이지만, 각 이미지의 느낌이 인풋과 너무 달라서 무엇이 원인인지 생각해보다가,

오히려 포인트만 적어서 간단하게 프롬프트를 작성해보면 어떨까 생각하여 아래와 같이 간단한 프롬프트로 다시 결과를 뽑아보았습니다.

 

사람 작성(간단한 버전) 프롬프트 기반 이미지 생성 결과

Input Prompt DALL-E(ChatGPT) Output
Draw a modern design flat symbol of a man(full body) wearing a blue suit, waving his hand like saying hello.
Draw a super simple flat icon of an oval-shaped light blue color mirror.
Draw a super simple black color flat icon of a bowl of noodle with chopsticks.

 

DALL-E(ChatGPT) 결과 요약

이미지가 간단할수록 그 의도와 비슷한 이미지가 나온 것을 확인할 수 있으며, 아이콘이더라도 다소 복잡한 경우 다소 이상한(?) 스타일의 결과물을 볼 수 있었습니다.

또한, 상세하고 복잡한 프롬프트와 간단하게 포인트만 짚은 프롬프트 모두에서 나쁘지 않은 결과를 확인할 수 있었습니다.

 

 

 

 

 

 

 

 

 

 

 

Flux 결과

Flux역시 동일한 프롬프트를 사용하여 뽑아보았습니다.