Gen AI
Image Generator

아이콘, 심볼 이미지 생성을 위한 최고의 생성 AI는?(Text-to-Image)

- [Gen AI]이미지 생성 AI 비교

Sept. 5, 2024, 10:11 p.m.

요즘 너무나 많은 생성형 AI 서비스가 쏟아져 나오고 있습니다.

때문에, 어떤 생성형 AI를 쓰는 것이 좋을지에 대한 고민이 많습니다.

이 프로젝트에서는 나에게 가장 좋은 이미지 생성 AI 서비스를 찾아보기 위하여, 다양한 용도에 대하여 각각 이미지 생성 AI 서비스들을 사용해보고 이를 비교해보고자 합니다.

 

프로젝트의 첫 글로써, 해당 포스트에서는 아래 이미지들과 같은 아이콘(심볼) 또는 간단한 일러스트를 그리기 위해서 생성 AI 서비스들을 각각 이용해보고자 합니다.

 

아무리 생성 AI들이 갈수록 사진과 같은 이미지를 잘 만들어낸다고 하더라도 그런 이미지는 사실 업무적인 차원에서는 활용도가 높지 않은 경우가 많은데요,

오히려 개인적으로 가장 활용도가 높은 부분은 이러한 아이콘이나 간단한 일러스트를 생성하는 것이었습니다.

해당 포스트에서는 아이콘 또는 심볼을 그리는데에 있어서 가장 좋은 AI를 찾기 위해 DALL-E(ChatGPT), Midjourney, Ideogram, Flux, Adobe Firefly를 모두 써보고 비교해보았습니다.

 

주의

해당 포스트는 '아이콘 또는 간단한 일러스트'를 위한 이미지 생성에만 포커스를 맞추어 작성하였습니다.

절대 각 생성형 AI 서비스 전체에 대한 리뷰를 하는 것이 아니기에, 이 점 유의하여 봐주시기 바랍니다.

 

 

이미지에 대한 설명 프롬프트 추출하기

이번 포스트에서는 텍스트를 입력하여 이를 통해 아이콘이나 간단한 일러스트 이미지를 생성하고자 합니다.

이미지 생성을 생성 AI 프롬프트로 입력하기 위해서는 적절한 프롬프트가 필요합니다.

때문에 이러한 프롬프트를 뽑아내기 위하여,

아래 이미지처럼 ChatGPT에 각 이미지를 입력하고, 해당 이미지를 생성형 AI 서비스를 이용하여 똑같이 그리기 위한 프롬프트를 뽑아달라고 요청하였습니다.

 

그 결과는 아래 표와 같습니다.

결과를 보시면 아실 수 있는 것처럼, 색깔부터 자세, 모양 등 아주 자세하게 설명이 되어있는 것을 볼 수 있습니다.

Input Image Prompt
"Create a flat, vector-style illustration of a man wearing a blue business suit with a yellow tie. The man's hair is dark and styled in a simple, short cut. He is smiling widely, showing a cheerful expression. His right arm is bent at the elbow, raised and slightly angled, with his hand closed in a fist. The man's shoes are black, and his overall appearance is friendly and approachable. The colors used in the illustration are simple and clean, with solid fills and no shading or gradients."
"Create a simple, flat, vector-style icon of a round, handheld mirror with a black outline. The mirror is oval-shaped and has a thick outer frame in a light blue color. Inside the mirror is a slightly smaller oval with a reflection effect created by two diagonal lines across the surface, representing glare or shine. The lines are parallel and positioned diagonally from top left to bottom right. The overall style is minimalist with bold outlines and soft, solid colors."
"Create a black, minimalist, vector-style icon of a bowl of noodles. The bowl is depicted in a simple, flat silhouette with a small reflective detail on the left side. Above the bowl, a pair of chopsticks is shown holding wavy noodles. The chopsticks are positioned diagonally, with the noodles hanging down into the bowl. The entire design is in solid black with no shading, providing a clean, simplistic look."

 

이렇게 프롬프트를 뽑아보니 벌써부터 결과가 궁금해지네요.

아래는 각 생성형 AI 서비스 별 결과물입니다.

 

 

 

 

 

 

 

 

 

 

 

DALL-E(ChatGPT) 결과

해당 프롬프트를 ChatGPT에서 뽑아낸 만큼, ChatGPT를 통해 사용할 수 있는 DALL-E가 기대감이 컸습니다.

아래와 같이 프롬프트를 ChatGPT에 입력하여 결과물을 뽑아보았습니다.

 

위와 같이 어느정도 그림체나 색깔이 반영되어있는데, 무엇인가 느낌이 조금 별로입니다. 

그 외의 이미지들까지 모두 정리하여 아래와 같이 표로 만들었습니다.(가장 input과 유사해 보이는 이미지 기준 추출)

 

 ChatGPT 생성 프롬프트 기반 이미지 생성 결과

Input Prompt DALL-E(ChatGPT) Output
"Create a flat, vector-style illustration of a man wearing a blue business suit with a yellow tie. The man's hair is dark and styled in a simple, short cut. He is smiling widely, showing a cheerful expression. His right arm is bent at the elbow, raised and slightly angled, with his hand closed in a fist. The man's shoes are black, and his overall appearance is friendly and approachable. The colors used in the illustration are simple and clean, with solid fills and no shading or gradients."
"Create a simple, flat, vector-style icon of a round, handheld mirror with a black outline. The mirror is oval-shaped and has a thick outer frame in a light blue color. Inside the mirror is a slightly smaller oval with a reflection effect created by two diagonal lines across the surface, representing glare or shine. The lines are parallel and positioned diagonally from top left to bottom right. The overall style is minimalist with bold outlines and soft, solid colors."
"Create a black, minimalist, vector-style icon of a bowl of noodles. The bowl is depicted in a simple, flat silhouette with a small reflective detail on the left side. Above the bowl, a pair of chopsticks is shown holding wavy noodles. The chopsticks are positioned diagonally, with the noodles hanging down into the bowl. The entire design is in solid black with no shading, providing a clean, simplistic look."

모두 이미지 자체는 괜찮은 편이지만, 각 이미지의 느낌이 인풋과 너무 달라서 무엇이 원인인지 생각해보다가,

오히려 포인트만 적어서 간단하게 프롬프트를 작성해보면 어떨까 생각하여 아래와 같이 간단한 프롬프트로 다시 결과를 뽑아보았습니다.

 

사람 작성(간단한 버전) 프롬프트 기반 이미지 생성 결과

Input Prompt DALL-E(ChatGPT) Output
Draw a modern design flat symbol of a man(full body) wearing a blue suit, waving his hand like saying hello.
Draw a super simple flat icon of an oval-shaped light blue color mirror.
Draw a super simple black color flat icon of a bowl of noodle with chopsticks.

 

DALL-E(ChatGPT) 결과 요약

이미지가 간단할수록 그 의도와 비슷한 이미지가 나온 것을 확인할 수 있으며, 아이콘이더라도 다소 복잡한 경우 다소 이상한(?) 스타일의 결과물을 볼 수 있었습니다.

또한, 상세하고 복잡한 프롬프트와 간단하게 포인트만 짚은 프롬프트 모두에서 나쁘지 않은 결과를 확인할 수 있었습니다.

 

 

 

 

 

 

 

 

 

 

 

Flux 결과

Flux역시 동일한 프롬프트를 사용하여 뽑아보았습니다.

결과물이 상반신만 있고, 그림체도 다소 복잡해지고 무엇보다 표정이 이상해졌네요..

우선은 아래와 같이 테이블로 결과물을 정리하였습니다.

 

ChatGPT 생성 프롬프트 기반 이미지 생성 결과

Input Prompt FLUX Output
"Create a flat, vector-style illustration of a man wearing a blue business suit with a yellow tie. The man's hair is dark and styled in a simple, short cut. He is smiling widely, showing a cheerful expression. His right arm is bent at the elbow, raised and slightly angled, with his hand closed in a fist. The man's shoes are black, and his overall appearance is friendly and approachable. The colors used in the illustration are simple and clean, with solid fills and no shading or gradients."
"Create a simple, flat, vector-style icon of a round, handheld mirror with a black outline. The mirror is oval-shaped and has a thick outer frame in a light blue color. Inside the mirror is a slightly smaller oval with a reflection effect created by two diagonal lines across the surface, representing glare or shine. The lines are parallel and positioned diagonally from top left to bottom right. The overall style is minimalist with bold outlines and soft, solid colors."
"Create a black, minimalist, vector-style icon of a bowl of noodles. The bowl is depicted in a simple, flat silhouette with a small reflective detail on the left side. Above the bowl, a pair of chopsticks is shown holding wavy noodles. The chopsticks are positioned diagonally, with the noodles hanging down into the bowl. The entire design is in solid black with no shading, providing a clean, simplistic look."

결과가 실망스럽지만, 프롬프트를 간단하게 해서 다시 한번 생성해보았습니다.

 

사람 작성(간단한 버전) 프롬프트 기반 이미지 생성 결과

Input Prompt Flux Output
Draw a modern design flat symbol of a man(full body) wearing a blue suit, waving his hand like saying hello.
Draw a super simple flat icon of an oval-shaped light blue color mirror.
Draw a super simple black color flat icon of a bowl of noodle with chopsticks.

 

Flux 결과 요약

대부분 기존 그림체와 많이 벗어난 것을 볼 수 있었고, 가장 단순한 아이콘인 Noodle Icon의 결과는 표현하기 어려울 정도로 최악으로 나왔습니다.

Flux에 대한 호평을 많이 들은 터라 다소 실망스러웠지만, 아이콘이 아닌 다른 형태의 이미지에서는 좋은 결과가 나오길 기대하고 있습니다.

그리고 발견된 또 다른 단점은 종종 이미지 생성이 너무 오래 걸린다는 것 입니다.(flux1.schnell 기준) 평소에는 보통 10초 이내에 생성이 되다가도, 5분 이상 걸리는 경우도 있습니다.

 

 

 

 

 

 

 

 

 

 

Midjourney 결과

동일한 프롬프트를 사용하여 Midjourney에서도 이미지를 생성해보았습니다.

지금까지 결과물 중에 가장 활용도가 높은 스타일의 결과물이 아닌가 싶습니다. 어느정도 그림체도 반영이 된 것 같고요.

하지만 중요한 포인트 중 하나인 팔 모양이 그림과 다른데, 이는 ChatGPT가 생성한 프롬프트가 애매하게 표현을 해서 그런 것 같습니다.

아래는 Midjourney의 이미지 생성 결과물을 역시 테이블로 정리했습니다(가장 input과 유사해 보이는 이미지 기준 추출)

 

ChatGPT 생성 프롬프트 기반 이미지 생성 결과

Input Prompt Midjourney Output
"Create a flat, vector-style illustration of a man wearing a blue business suit with a yellow tie. The man's hair is dark and styled in a simple, short cut. He is smiling widely, showing a cheerful expression. His right arm is bent at the elbow, raised and slightly angled, with his hand closed in a fist. The man's shoes are black, and his overall appearance is friendly and approachable. The colors used in the illustration are simple and clean, with solid fills and no shading or gradients."
"Create a simple, flat, vector-style icon of a round, handheld mirror with a black outline. The mirror is oval-shaped and has a thick outer frame in a light blue color. Inside the mirror is a slightly smaller oval with a reflection effect created by two diagonal lines across the surface, representing glare or shine. The lines are parallel and positioned diagonally from top left to bottom right. The overall style is minimalist with bold outlines and soft, solid colors."
"Create a black, minimalist, vector-style icon of a bowl of noodles. The bowl is depicted in a simple, flat silhouette with a small reflective detail on the left side. Above the bowl, a pair of chopsticks is shown holding wavy noodles. The chopsticks are positioned diagonally, with the noodles hanging down into the bowl. The entire design is in solid black with no shading, providing a clean, simplistic look."

전반적으로 그럴싸한 결과물이 나왔는데요, 간단한 프롬프트로도 이미지를 생성해보겠습니다.

 

사람 작성(간단한 버전) 프롬프트 기반 이미지 생성 결과

Input Prompt Midjourney Output
Draw a modern design flat symbol of a man(full body) wearing a blue suit, waving his hand like saying hello.
Draw a super simple flat icon of an oval-shaped light blue color mirror.
Draw a super simple black color flat icon of a bowl of noodle with chopsticks.

 

Midjourney 결과 요약

세 가지 결과 모두 바로 사용 가능할 정도로 활용도가 높아보이고 쓸만한 이미지였습니다.

상세하고 복잡한 프롬프트부터 간단한 프롬프트까지 모두 그럴듯한 이미지가 생성되었습니다.

하지만 단점이라면, 프롬프트에 명시되어있는 사항을 자의적으로 해석하는 경우(예: 손동작을 바꾸는 경우, 요청도 안한 글씨를 추가하는 경우, minimal하지 않은 아이콘으로 재해석한 경우 등)가 발생하는 것을 확인했습니다.

 

 

 

 

 

 

 

 

 

 

Ideogram 결과

동일한 프롬프트를 활용하여 Ideogram 에서도 이미지를 생성해보았습니다.

결과가 약간 신기한데, 그림체가 모두 예상한 것은 아니지만 동일하게 얼굴과 몸이 많이 단순화된 그림으로 그려져있습니다.

단순하지만, 그만큼 활용도가 괜찮아보이는 그림이네요.

아래는 Ideogram의 이미지 생성 결과물을 역시 테이블로 정리했습니다(가장 input과 유사해 보이는 이미지 기준 추출)

 

ChatGPT 생성 프롬프트 기반 이미지 생성 결과

Input Prompt Ideogram Output
"Create a flat, vector-style illustration of a man wearing a blue business suit with a yellow tie. The man's hair is dark and styled in a simple, short cut. He is smiling widely, showing a cheerful expression. His right arm is bent at the elbow, raised and slightly angled, with his hand closed in a fist. The man's shoes are black, and his overall appearance is friendly and approachable. The colors used in the illustration are simple and clean, with solid fills and no shading or gradients."
"Create a simple, flat, vector-style icon of a round, handheld mirror with a black outline. The mirror is oval-shaped and has a thick outer frame in a light blue color. Inside the mirror is a slightly smaller oval with a reflection effect created by two diagonal lines across the surface, representing glare or shine. The lines are parallel and positioned diagonally from top left to bottom right. The overall style is minimalist with bold outlines and soft, solid colors."
"Create a black, minimalist, vector-style icon of a bowl of noodles. The bowl is depicted in a simple, flat silhouette with a small reflective detail on the left side. Above the bowl, a pair of chopsticks is shown holding wavy noodles. The chopsticks are positioned diagonally, with the noodles hanging down into the bowl. The entire design is in solid black with no shading, providing a clean, simplistic look."

 

사람 작성(간단한 버전) 프롬프트 기반 이미지 생성 결과

Input Prompt Ideogram Output
Draw a modern design flat symbol of a man(full body) wearing a blue suit, waving his hand like saying hello.
Draw a super simple flat icon of an oval-shaped light blue color mirror.
Draw a super simple black color flat icon of a bowl of noodle with chopsticks.

 

Ideogram 결과 요약

첫 번째 사람 이미지 결과를 봤을 때는 크게 기대를 안했는데, 다음 이미지들은 충격적일 정도로 원본과 그 느낌이 비슷해서 놀랐습니다.

간단한 프롬프트의 경우에도 결과가 나쁘지 않으나, 상세하게 설명한 프롬프트가 보다 더 원하는 결과를 도출하기 쉬웠습니다.

Ideogram 이 텍스트를 잘 써주는 것으로 유명해서(참조: 이미지 생성 AI(DALL-E, Flux, Midjourney, Ideogram, Adobe Firefly)의 특징 비교), 사실 이번 포스트에서는 많이 기대를 하지 않았는데 현재까지 가장 만족스러운 결과로 보입니다.

 

 

 

 

 

 

 

 

 

 

Adobe Firefly 결과

동일한 프롬프트를 활용하여 Adobe Firefly 에서도 이미지를 생성해보았습니다.

원본과 다르게 인사하는 이미지는 없지만, 이는 ChatGPT 가 생성한 프롬프트가 애매해서 그런 것 같습니다.

그림체는 어딘가 비슷하면서도 다른데, 원본과도 느낌이 사뭇 다릅니다.

아래는 Adobe Firefly의 이미지 생성 결과물을 역시 테이블로 정리했습니다(가장 input과 유사해 보이는 이미지 기준 추출)

 

ChatGPT 생성 프롬프트 기반 이미지 생성 결과

Input Prompt Firefly Output
"Create a flat, vector-style illustration of a man wearing a blue business suit with a yellow tie. The man's hair is dark and styled in a simple, short cut. He is smiling widely, showing a cheerful expression. His right arm is bent at the elbow, raised and slightly angled, with his hand closed in a fist. The man's shoes are black, and his overall appearance is friendly and approachable. The colors used in the illustration are simple and clean, with solid fills and no shading or gradients."
"Create a simple, flat, vector-style icon of a round, handheld mirror with a black outline. The mirror is oval-shaped and has a thick outer frame in a light blue color. Inside the mirror is a slightly smaller oval with a reflection effect created by two diagonal lines across the surface, representing glare or shine. The lines are parallel and positioned diagonally from top left to bottom right. The overall style is minimalist with bold outlines and soft, solid colors."
"Create a black, minimalist, vector-style icon of a bowl of noodles. The bowl is depicted in a simple, flat silhouette with a small reflective detail on the left side. Above the bowl, a pair of chopsticks is shown holding wavy noodles. The chopsticks are positioned diagonally, with the noodles hanging down into the bowl. The entire design is in solid black with no shading, providing a clean, simplistic look."

전반적으로 그림체가 단순한 아이콘이나 심볼과는 거리가 있는 이미지가 생성되었습니다.

간단한 프롬프트에서는 이러한 특징이 더 부각될 것 같습니다.

 

사람 작성(간단한 버전) 프롬프트 기반 이미지 생성 결과

Input Prompt Firefly Output
Draw an image in flat and super simple style illustration of a man(full body) wearing a blue suit, waving his hand like saying hello.
Draw a super simple flat icon of an oval-shaped light blue color mirror.
Draw a super simple black color flat icon of a bowl of noodle with chopsticks.

 

Adobe Firefly 결과 요약

프롬프트에 기재된 요청사항의 그림체가 반영이 많이 안되고, 모두 어느정도 비슷한 그림체로 결과가 나오고 있습니다.

때문에, 간단한 아이콘과 같은 이미지 생성에는 최선의 서비스는 아닌 것으로 느껴집니다.

 

 

 

 

 

 

 

 

 

 

 

전체 결과 정리(아이콘 생성을 위한 최고의 이미지 생성 AI)

Service Name Pros Cons Recommend or Not
DALL-E(ChatGPT) 1. 상세한 프롬프트 및 간단한 프롬프트 모두 무난한 결과 

1. 복잡한 아이콘의 경우 의도와 많이 달라지는 경우가 있음

2. 원하는 그림체로 구현이 다소 어려움

추천하지 않음
Flux  

1. 결과물이 활용도가 높아보이는 경우가 없음(어색한 이미지 자주 발생)

2. 원하는 그림체로 구현이 어려움

3. 시간이 과도하게 오래 걸리는 경우가 종종 발생 

추천하지 않음
Midjourney

1. 상세한 프롬프트 및 간단한 프롬프트 모두 준수한 결과물

2. 결과물 자체가 활용도가 높은 무난한 디자인

1. 프롬프트에 명시되지 않은 요소까지 생성하는 경우 있음

2. 원하는 그림체로 구현이 다소 어려움

추천
Ideogram

1. 상세한 프롬프트 및 간단한 프롬프트 모두 준수한 결과물

2. 프롬프트가 상세할수록 원하는 그림체 구현 가능함

3. 결과물 자체가 활용도가 높은 무난한 디자인

  추천
Adobe Firefly  

1. 프롬프트에 기재된 내용이 이미지에 반영안되는 경우가 잦음

2. 그림체가 아이콘으로 사용하기에 부적합한 편임

추천하지 않음

해당 포스트는 '아이콘 또는 간단한 일러스트'를 위한 이미지 생성에만 포커스를 맞추어 작성하였습니다.

절대 각 생성형 AI 서비스 전체에 대한 리뷰를 하는 것이 아니기에, 이 점 유의하여 봐주시기 바랍니다.

Reference


Project

Comments


Related Posts