본문 바로가기
푸른지성의 이야기/Stable Diffusion

AI 그림 그리기(SD) #2 - txt2img 툴 설명

by 푸른지성 2023. 2. 18.
반응형

전편에서 설치를 하고 모델도 받고 로라를 받았다면 이제부터 프롬프트를 하나하나 배워봅시다.

아래의 UI가 생소합니다만, 사실 알고 보면 간단합니다.

 

각 탭에대한 설명

txt2img는 우리가 주로 사용하는 이미지 생성기입니다.

img2img, Extras는 만들어놓은 이미지를 재가공할때 쓰입니다.

PNGInfo에선 이미 만들어놓은 파일의 정보를 보거나, 각각의 기능으로 이미지파일을 재전달할때 쓰입니다.

CheckpointMerger는 마음에 드는 모델들을 직접 병합할때 사용됩니다.

일반적으로 3개의 모델을 한번에 병합할수도 있으며 A모델 B모델 C모델 각각의 퍼센테이지를 지정해서 병합할 수도 있습니다.

그 외에 Settings 또는 Extensions는 향후 프롬프트에 익숙해지면 확인해보면 되겠습니다.

우리가 당장 사용할 것은 txt2img입니다.

이곳에 명령 프롬프트를 입력하여 이미지를 생성합니다.

 

txt2img 각 부분의 의미

텍스트를 이미지로 바꾼다는 의미의 txt2img가 우리가 주로 다루는 탭(페이지)입니다.

아래와 같이 3부위별로 나눠서 확인해봅시다.

 

1.명령어 입력

명렁어 입력은 영어로 가능합니다.

상단의 Prompt부위는 우리가 원하는 이미지에 대한 제시어를 입력합니다.

하단의 Negative prompt는 AI가 가급적 피해서 만들어야 하는 제시어를 입력합니다.

오른쪽의 Generate를 클릭하면 이미지 생성이 됩니다.

하단의 버튼 5개는 순서대로 아래와 같습니다.

  1. 직전의 프롬프트를 되살리기 (webUI를 새로고침 한 뒤에도 마지막 프롬프트를 다시 복원해냅니다.)
  2. 프롬프트창 클리어
  3. 설치된 Text Inversion, 하이퍼네트웍스, 체크포인트, 로라등을 추가 선택할 수 있습니다.
  4. 선택한 스타일을 프롬프트 창에 붙여넣습니다. (스타일을 이미 저장해놓은 상태에서, 스타일을 선택한 뒤 클릭이 가능합니다.)
  5. 현재 프롬프트 창의 프롬프트들을 특정 키워드로 저장합니다.

그 아래 Styles에는 이미 저장해놓은 스타일들중 스타일을 선택하면 표기됩니다.

Styles박스 오른쪽의 파란색 아이콘은 스타일박스의 새로고침 버튼입니다.

 

2. 이미지 샘플링

입력받은 프롬프트를 이용하여 이미지를 생성할때의 샘플링 옵션창입니다.

 

(1) 샘플링 메소드는 이미지를 만들때 사용하는 방식이라고 보시면 됩니다.

   예쁘게, 딱딱하게, 부드럽게, 강하게, 애니메이션처럼 만들기 정도로 이해하고,

   하나의 이미지를 각각의 샘플러로 생성해보시길 권장해드립니다.

 

(2) Sampling steps

   이미지를 생성할때 몇번의 가공을 거치느냐를 선택하는 옵션입니다.

   일반적으로 15스탭에서 30스탭사이가 사용됩니다.

   그 이하일 경우 완성이 덜 된 이미지가 보일 수도 있으며,

   프롬프트에 따라 30스탭이 넘어갈 경우 더이상의 가공이 되지 않습니다. (전력낭비)

   물론 이미지의 디테일이나, 복잡성에 따라서 40스탭 50스탭이 넘어가는 경우도 있지만, 굳이 추천하지 않습니다.

   또한 Hires이미지를 생성할 경우 이곳에서 1차 샘플링을 한 이미지를 Hires에서 다시 분해하여 샘플링하기 때문에 15스탭이면 충분합니다.

 

(3) Restore faces

   특수목적으로 제작된 모델 또는 로라를 사용하지 않을 경우,

   이미지 생성후 얼굴이 뒤죽박죽이 되는 케이스가 있습니다.

   이럴때 얼굴 파츠를 재정렬해주는 기능을 합니다. 

   (일반적으로 Cillout이나 기타 여성케를 제작하는 목적을 둔 모델이나 로라를 사용할 경우, 뒤죽박죽되는 케이스가 없으므로 체크 안하셔도 됩니다.)

 

(4) Tilling

   굳이 사용하지 않습니다. 생성한 이미지를 자르고 흔듭니다.

 

(5) Hires. fix

   샘플링된 이미지를 다시한번 업스케일링 할때 사용합니다.

   샘플링때 이미지 사이즈를 작게하고, 업스케일로 이미지를 좀 더 크게하거나, 한번 더 랜더링 시킬때 주로 쓰입니다.

   여기에 대한 설명은 별도로 작성하겠습니다.

 

(6) Width Height

   생성할 이미지의 사이즈를 지정합니다.

 

(7) Batch Count

   해당 프롬프트로 몇개의 이미지를 생성할지를 결정합니다.

   AI가 입력받은 명렁어로 랜덤한 이미지를 만드는 것이므로, 한번에 원하는 이미지를 만들어내는 것은 어렵습니다.

   따라서 몇십개의 이미지를 생성하여 그중에 선택할때 사용합니다.

 

(8) Batch size

   이미지를 생성할때, 동시에 몇개 이미지를 생성하느냐를 결정합니다만,

   작은 이미지를 생성할때나 필요하고, 고화질 이미지는 RTX4080 RTX4090등이 아닐 경우 사용할 일은 거의 없습니다.

 

(9) CFG Scale 

   classifier-free guidance 의 약자입니다만, 이해를 하려면 너무 어려우니, 적당히 7에서 9사이로 지정하시면 됩니다.

   디테일 한 설명으로는 이미지를 생성할때 얼마나 프롬프트를 따를 것이냐, AI의 자율성에 맞출것이냐에 대한 척도입니다.

   좀 더 자세히 공부해보고 싶은분들은 

http://gigazine.net/gsc_news/en/20220928-stable-diffusion-classifier-free-guidance/

 

What exactly is 'CFG (classifier-free guidance)' that determines how much prompt / spell instructions are followed in the image

AI ' Stable Diffusion ', which generates images based on input prompts, has been attracting attention from people all over the world since its public release, and various tools andapplication methods have been announced. Among the setting items for generat

gigazine.net

를 참고하시면 됩니다.

 

(10) Seed

   현재 생성한 이미지의 포지션이라고 보시면 됩니다.

   만약 지금 생성한 이미지가 너무 마음에 든다 할 경우,

   해당 시드를 지정해서 추가로 특수 효과를 넣는다던지,

   업스케일링을 한다던지를 하는 경우 쓰입니다. 

   -1의 경우 랜덤이며 그 외의 숫자는 지정된 이미지의 배치 구도의 포지션이라고 생각하시면 됩니다.

   방금 생성한 이미지를 다시 만들고 싶다면 Seed옆의 재활용 마크를 누르면 됩니다. (반대로 주사위 마크를 누르면 Seed가 -1로 지정됩니다.)

 

(11) Extra, script

   Extra는 시드와 시드의 결합을 사용할때 쓰입니다만, 지금 단계에선 굳이 거기까진 공부 안하셔도 됩니다. 

   script도 아직은 모르셔도 됩니다.

 

3. 생성물 확인 및 처리부

Generate 를 누르면 이미지가 생성되어 프리뷰됩니다.

이때 폴더를 열거나, 이미지를 저장하거나, zip로 다운로드 하거나(배치카운트를 여러개로 했을 경우 용이),

다른 툴로 바로 보내버리는 역할을 합니다.

 

 

원래는 이 편에서 프롬프트를 다룰까 했는데, 툴 설명도 빼먹으면 안되므로 추가하였습니다.

다음편에 간단한 프롬프트와 예제를 보며 배워보시죠.

 

 

 

 

 

 

 

반응형

댓글