Prompt Engineering for Generative AI 온라인 세미나 1 – 7장. Introduction to Diffusion Models for Image Generation – Weighted Terms까지

Chapter 8. Standard Practices for Image Generation with Midjourney

이미지 생성에서 가장 기본적인 관행은 이미지의 형식을 지정하는 것입니다.

For a list of quality boosters, art styles, and artists, visit this template created by one of the authors: Prompt Engineering Template.

여기서 제공하는 122개의 형식은 다음과 같습니다.

1. Photograph: 실제 사진입니다.
2. Painting: 붓과 물감을 사용하여 그림을 그린 것입니다.
3. Oil painting: 오일 페인트를 사용하여 그림을 그린 것입니다.
4. Line drawing: 선으로만 그림을 그린 것입니다.
5. Charcoal drawing: 숯을 사용하여 그림을 그린 것입니다.
6. Macro 35mm photograph: 35mm 카메라를 사용하여 확대한 사진입니다.
7. Album art cover: 앨범의 표지에 사용되는 그림입니다.
8. One-line drawing: 한 줄로만 그림을 그린 것입니다.
9. Crayon drawing: 크레용을 사용하여 그림을 그린 것입니다.
10. Pastel drawing: 파스텔을 사용하여 그림을 그린 것입니다.
11. Watercolor painting: 수채화를 사용하여 그림을 그린 것입니다.
12. Pencil and watercolor drawing: 연필과 수채화를 사용하여 그림을 그린 것입니다.
13. Vector art: 컴퓨터 그래픽 프로그램으로 만든 그림입니다.
14. Stained glass window: 스테인드 글라스로 만든 창문입니다.
15. Cartoon: 만화를 말합니다.
16. 3D render: 3D 소프트웨어를 사용하여 만든 그림입니다.
17. Line art: 선으로만 그린 그림입니다.
18. Pixel art: 작은 사각형으로 만든 그림입니다.
19. Product photography: 제품을 찍은 사진입니다.
20. Diagram: 도표나 그림을 사용하여 설명한 것입니다.
21. Daguerreotype: 초기 사진 기법 중 하나로, 은판 위에 사진을 찍은 것입니다.
22. Screenshot from: 컴퓨터나 스마트폰에서 캡처한 것입니다.
23. Displayed on a store mannequin: 상점에서 마네킹에 전시된 것입니다.
24. Modeling photoshoot: 모델 촬영입니다.
25. Cross stitched sampler: 십자수로 만든 샘플입니다.
26. Manuscripts: 손으로 쓴 문서입니다.
27. Pencil sketch: 연필로 그린 스케치입니다.
28. Advertising poster: 광고 포스터입니다.
29. In Fortnite: 게임 포트나이트에서 만든 것입니다.
30. On Judge Judy: Judge Judy라는 TV 프로그램에서 나온 것입니다.
31. Captured on CCTV: CCTV 카메라에서 찍은 것입니다.
32. On Sesame Street: Sesame Street라는 TV 프로그램에서 나온 것입니다.
33. Under electron microscope: 전자 현미경으로 찍은 것입니다.
34. Kindergartener drawing: 유치원생이 그린 그림입니다.
35. Wikihow: 위키하우에서 만든 그림입니다.
36. Fifth grade yearbook: 5학년 졸업 앨범입니다.
37. Courtroom sketch: 법정에서 그린 스케치입니다.
38. On America’s Got Talent: America’s Got Talent라는 TV 프로그램에서 나온 것입니다.
39. Mugshot: 경찰서에서 찍은 얼굴 사진입니다.
40. In GTA San Andreas: 게임 GTA San Andreas에서 만든 것입니다.
41. US patent: 미국 특허입니다.
42. In Mario Cart: 게임 Mario Cart에서 만든 것입니다.
43. News crew reporting live: 뉴스 크루가 실시간으로 보도하는 것입니다.
44. Cave painting: 동굴 벽화입니다.
45. In Minecraft: 게임 Minecraft에서 만든 것입니다.
46. Book cover: 책의 표지입니다.
47. Trail cam: 숲이나 야생동물 보호구역에서 사용하는 카메라입니다.
48. Polaroid: 폴라로이드 사진입니다.
49. Sketchbook: 스케치북에 그린 그림입니다.
50. Japanese wood block: 일본 목판화입니다.
51. Medieval portrait: 중세 시대의 초상화입니다.
52. Dashcam: 차량에 설치된 카메라입니다.
53. Security footage: 보안 카메라에서 찍은 것입니다.
54. Disposable camera: 일회용 카메라입니다.
55. Autochrome: 초기 사진 기법 중 하나로, 자동 크로마틱 프로세스를 사용하여 색상을 추가한 것입니다.
56. Double exposure: 두 개의 사진을 겹쳐서 만든 것입니다.
57. Editorial fashion photography: 패션 사진을 찍은 것입니다.
58. Advertising campaign: 광고 캠페인입니다.
59. Vogue magazine cover: Vogue 잡지의 표지입니다.
60. Real estate photography: 부동산 사진을 찍은 것입니다.
61. Harsh flash photography: 강한 플래시를 사용하여 찍은 것입니다.
62. Lomography: 로모그래피 스타일의 사진입니다.
63. Long-exposure photograph with slow shutter speed: 슬로우 셔터 스피드를 사용하여 찍은 사진입니다.
64. Camera obscura: 카메라 옵스큐라를 사용하여 찍은 사진입니다.
65. Pinhole photography: 핀홀 카메라를 사용하여 찍은 사진입니다.
66. Theatrical press release: 연극과 관련된 보도 자료입니다.
67. Press release: 보도 자료입니다.
68. Balloon float in the Macy’s Thanksgiving Day Parade: Macy’s 추수감사절 퍼레이드에서 풍선을 사용한 것입니다.
69. Architectural photography from magazine: 잡지에서 찍은 건축 사진입니다.
70. Interior design: 인테리어 디자인입니다.
71. Stunning photograph from landscape

“a pencil sketch of a business meeting” 이 프롬프트로 달리3에서 생성한 결과

https://artsandculture.google.com/category/art-movement

링크에서 그림을 어떻게 그렸는지 기법이 나옵니다. 이 부분을 복사해서 프롬프트 일부로 사용할 수 있습니다.

결국 그림 생성을 위한 프롬프트는 무엇을 그릴 것인지와 어떻게 그릴 것인지를 작성하는 것인데, 어떻게는 포맷이나 기법을 설명할 필요 없이 포맷이나 기법 이름을 제시하면 됩니다.

남녀 커플을 몇 가지 기법으로 그린 것

형식을 지정할 때 주의할 점이 있습니다. 형식이 정해지면 스타일이나 내용도 정해질 수 있다는 것 입니다. 모델이 사전 학습 데이터에 영향을 받기 때문입니다. 예를 들어, 유화 그림에는 컴퓨터가 자주 등장하지 않기 때문에 유화로 지정하면 컴퓨터가 안 나올 수 있습니다. 이런 경우는 다수의 형식을 지정해서 해결 해야 할 수도 있습니다.

예술가의 이름이나 미술 운동의 이름을 언급하는 것은 특정 시각 스타일을 전달하는 지름길입니다. 예술가나 미술 운동이 학습 데이터에 충분한 예시가 있는 한, 그들의 특성을 모방할 수 있습니다. 예술가의 스타일과 같이 뭔가를 지정한다는 것은 제약을 추가하는 것으로 대상이 될 후보를 걸러주는 필터를 더하는 것입니다. 원하는 것이란 결국 자신의 요구에 후보들을 좁혀 가는 것이라는 것입니다.

예) illustration of a dragon, in the style of Alice’s Adventures in Wonderland by Lewis Carroll

비전 모델이 좋아지면서 이미지 생성에서도 역공학을 할 수 있게 되었습니다. 역공학 할 때 그림에 대해 설명해 달라는 것에 더해 Styles Artists Formats Boosters Vibes Perspectives 항목에 대해서도 알려달라고 하면 좀 더 모방을 잘 할 수 있을 것입니다. 물론 모방할 때는 문제 될 수 있으니 확인하고 조심해야 할 사항들은 잘 파악하고 해야 겠죠. 아래 그림 같은 경우는 어떤 형식이나 스타일이 없는 것으로 보이니 그림 설명이 주가 됩니다.

그림 설명:

이미지는 부드럽고 하얀 강아지가 코르크 뚜껑이 있는 큰 유리병 안에 있는 매혹적이고 따뜻한 장면을 담고 있습니다. 강아지는 작고 어린 강아지로 보이며, 부드럽고 폭신한 털과 순수함과 호기심이 묻어나는 표현력 있는 눈을 가지고 있습니다. 유리병의 바닥을 둘러싼 다채로운 꽃들은 분홍색, 흰색, 노란색의 다양한 색조로, 장면에 기발하고 마법 같은 터치를 더하고 있습니다.

유리병 자체는 나무 표면 위에 놓여 있어 자연스럽고 소박한 느낌을 줍니다. 배경은 부드럽고 흐릿하게 초점이 맞춰진 보케 조명으로 가득한 푸르고 꿈 같은 녹색으로, 고요하고 매혹적인 분위기를 아릅답게 만듭니다. 햇빛은 왼쪽 위 모서리에서 장면을 비추어 따뜻하고 황금빛의 광채를 드리워, 신비롭고 마법 같은 분위기를 더욱 부각시킵니다.

이미지 모델에 효과적인 한 가지 트릭은 품질과 관련된 단어를 프롬프트에 추가하는 것입니다.

예술 스타일 중에는 미학적으로 더 뛰어난 것들이 있지만, 4k, 매우 아름다운, 아트스테이션 트렌딩과 같이 스타일에는 큰 영향을 주지 않고 이미지 품질을 향상시키는 것으로 알려진 품질 부스터라는 단어 세트가 있습니다. 생성 모델은 고품질 이미지를 만들려는 것이 아니라 다양한 스타일과 품질의 훈련 세트를 모방하려고 합니다. 고품질 이미지를 원한다면 명시적으로 요청해야 합니다.

Boosters

1. **트렌딩 온 아트스테이션 (Trending on ArtStation)**: 아트스테이션에서 현재 인기가 있는 이미지와 유사한 스타일로 생성합니다.
2. **아름답다 (Beautiful)**: 아름답고 감동적인 이미지를 생성합니다.
3. **선명하다 (Vivid)**: 선명하고 생생한 이미지를 생성합니다.
4. **전문적이다 (Professional)**: 전문적인 수준의 이미지를 생성합니다.
5. **초고해상도 (Extremely Detailed)**: 매우 상세하고 정교한 이미지를 생성합니다.
6. **충격적이다 (Stunning)**: 충격적이고 감동적인 이미지를 생성합니다.
7. **경이롭다 (Wondrous)**: 경이롭고 놀라운 이미지를 생성합니다.
8. **판타스틱하다 (Fantastic)**: 판타스틱하고 이상적인 이미지를 생성합니다.
9. **콘테스트 우승작 (Contest Winner)**: 콘테스트에서 우승할 수 있는 수준의 이미지를 생성합니다.
10. **포스트프로세싱 (Postprocessing)**: 이미지를 후처리하여 보다 생생하고リア리티 있는 이미지를 생성합니다.
11. **詳細하다 (Detailed)**: 상세하고 정교한 이미지를 생성합니다.
12. **트렌딩 온 /r/아트 (Trending on /r/art)**: 레딧의 /r/art 커뮤니티에서 현재 인기가 있는 이미지와 유사한 스타일로 생성합니다.
13. **8K**: 8K 해상도의 이미지를 생성합니다.
14. **4K 해상도 (4K Resolution)**: 4K 해상도의 이미지를 생성합니다.
15. **VFX**: 영화나 광고 등에서 사용되는 시각효과(VFX)와 유사한 이미지를 생성합니다.
16. **언리얼 엔진으로 렌더링 (Rendered in Unreal Engine)**: 언리얼 엔진을 사용하여 이미지를 렌더링합니다.
17. **옥테인 렌더 (Octane Render)**: 옥테인 렌더를 사용하여 이미지를 렌더링합니다.
18. **디지털 아트 (Digital Art)**: 디지털 아트와 유사한 이미지를 생성합니다.
19. **포토레얼리스틱 (Photorealistic)**: 실제 사진과 유사한 이미지를 생성합니다.
20. **하이퍼레얼리스틱 (Hyperrealistic)**: 실제보다 더 생생하고リア리티 있는 이미지를 생성합니다.
21. **렌더링 (Rendering)**: 이미지를 렌더링하여 보다 생생하고リア리티 있는 이미지를 생성합니다.
22. **아름답다 (Very Beautiful)**: 매우 아름답고 감동적인 이미지를 생성합니다.
23. **하이퍼 리얼리스틱 (Hyper Realistic)**: 실제보다 더 생생하고リア리티 있는 이미지를 생성합니다.
24. **4K**: 4K 해상도의 이미지를 생성합니다.
25. **블렌더 3D (Blender 3D)**: 블렌더 3D를 사용하여 이미지를 생성합니다.
26. **70mm**: 70mm 필름과 유사한 이미지를 생성합니다.
27. **하이 디테일 (High Detail)**: 매우 상세하고 정교한 이미지를 생성합니다.
28. **아놀드 렌더 (Arnold Render)**: 아놀드 렌더를 사용하여 이미지를 렌더링합니다.
29. **울트라 하이 폴리 (Ultra High Poly)**: 매우 많은 폴리곤을 사용하여 이미지를 생성합니다.
30. **즈브러쉬 (ZBrush)**: 즈브러쉬를 사용하여 이미지를 생성합니다.
31. **하이디 디테일 (Highly Detailed)**: 매우 상세하고 정교한 이미지를 생성합니다.
32. **디테일을 봐라 (Look at that detail)**: 매우 상세하고 정교한 이미지를 생성합니다.
33. **스튜디오 라이팅 (Studio Lighting)**: 스튜디오에서 사용하는 라이팅과 유사한 이미지를 생성합니다.
34. **잘 보존된 (Well Preserved)**: 잘 보존된 이미지와 유사한 이미지를 생성합니다.
35. **하이 폴리 (High Poly)**: 많은 폴리곤을 사용하여 이미지를 생성합니다.
36. **언리얼 엔진 (Unreal Engine)**: 언리얼 엔진을 사용하여 이미지를 생성합니다.
37. **#-wow**: 충격적

프롬프트:

a space whale, trending on artstation

* “Trending on ArtStation”는 Midjourney 또는 Stable Diffusion과 같은 AI 아트 생성 도구에서 사용되는 프롬프트입니다. 이것은 아트스테이션 플랫폼에서 인기 있고 호평을 받은 스타일을 제안하여 이미지의 미적 품질을 향상시키려는 “품질 부스터”입니다. 즉, AI에게 “아트스테이션에서 인기를 얻는 유형의 아트처럼 보이도록 만들어”라고 지시하는 것입니다.

아트스테이션은 아티스트와 크리에이터가 자신의 작품을 선보이고 업계의 다른 사람들과 연결될 수 있는 온라인 플랫폼입니다. 게임 개발, 영화, 애니메이션과 같은 분야의 전문가들이 널리 사용하고 있습니다. 포트폴리오, 3D 모델, 콘셉트 아트 등을 사이트에서 찾아볼 수 있습니다. 아트스테이션에 대한 자세한 내용은 여기에서 확인하세요: [https://www.artstation.com/](https://www.artstation.com/)

Negative Prompts

종종 두 개념이 훈련 데이터에 너무 밀접하게 얽혀 있어서, 한 개념의 이미지를 생성할 때, 특정하거나 의도하지 않은 경우에도 두 개념이 함께 나타납니다. 예를 들어, 유화를 요청하면, 많은 미술관 소장품에서 유화의 이미지에 포함되어 있기 때문에, 종종 액자와 주변 벽이 함께 나타납니다.

Midjourney 및 Stable Diffusion에서는 이미지에 원하지 않는 것을 지정할 수 있는 네거티브 프롬프트를 추가할 수 있는 기능이 있습니다.

네거티브 프롬프트는 밀접하게 얽힌 두 개념을 효과적으로 분리하고 이미지에 원하지 않는 것이 포함되지 않도록 하는 데 사용할 수 있습니다.

유화와 액자의 예를 들어, 프롬프트의 끝에 “–no”를 추가하고, 그 플래그 뒤에 쉼표로 구분된 목록에 있는 모든 것은 프롬프트에서 제외됩니다. 액자 문제를 해결하려면 그림 8-8에 표시된 것처럼 “frame”과 “wall”을 네거티브 프롬프트로 추가합니다.

네거티브 프롬프트는 이미지에서 원하지 않는 개념을 무효화하여 모델을 피하려는 영역에서 멀리하게 할 수 있습니다. 종종 개념이 너무 잘 상관관계가 있기 때문에 의도한 대로 항상 작동하는 것은 아니지만, 작동할 때는 흥미로운 곳으로 이어질 수 있습니다.

네거티브 프롬프팅은 완전히 신뢰할 수 있는 것은 아니지만, 다양한 시나리오에서 유용할 수 있습니다. 이 기술을 창의적으로 사용하는 한 가지 방법은 유명인의 이름을 네거티브 프롬프트로 추가하여 해당 유명인과 가장 관련된 요소를 줄이는 것입니다. 유명 여배우 카렌 길런은 빨간 머리카락을 가지고 있고 전통적으로 여성스러운 외모를 가지고 있기 때문에, 이를 네거티브 프롬프트로 사용하면 대상이 빨간 머리카락을 가지거나 전통적으로 여성스러운 외모를 가질 가능성이 줄어듭니다.

이 기법을 사용하여 두 개의 분리할 수 없는 개념을 가져와 분리했을 때 어떤 일이 일어나는지 확인하면 매우 창의적이고 예측 불가능한 결과를 얻을 수 있습니다.

프롬프트:

oil painting in the style of Rembrandt –no frame, wall

a Scottish female astronaut –no Karen Gillan

Homer Simpson –no cartoon

Weighted Terms

네거티브 프롬프트는 무언가를 완전히 무효화하려는 경우 유용하지만, 종종 단순히 줄이고 싶을 뿐입니다. 다양한 개념을 혼합하고 일치시키려면 각 개념을 얼마나 원하는지 제어하는 것이 도움이 될 수 있습니다. 개념 이름과 값 사이에 두 개의 콜론 문자(::)로 구분합니다.

프롬프트:

painting of the Golden Gate Bridge::1 in the style of Van Gogh::0.8, in the style of Dali::0.2

가중치는 프롬프트에 많은 가능한 조합을 도입하며, 이는 한 번에 하나씩 반복하는 데 시간이 오래 걸릴 수 있습니다. 이상적인 가중치 조합이 선호도와 일치하는 지점을 파악하려면 많은 가능한 조합을 체계적으로 생성하는 그리드 검색 방식을 권장합니다.

가중치는 강조하고 싶을 때 1보다 높게, 또는 억제하고 싶을 때 1보다 낮게 설정할 수 있습니다. 프롬프트에 음수 가중치를 추가하여 해당 측면을 다양한 정도로 제거할 수도 있습니다. 네거티브 프롬프트에 사용되는 –no 매개변수는 실제로 프롬프트의 해당 섹션에 ::-0.5를 추가하는 지름길입니다. 이미지에 원하지 않는 것이 나타나는 데 어려움을 겪고 있다면, 네거티브 프롬프트 대신 더 강력한 음수 가중치를 사용해 보세요. 이전 예를 사용하면 반 고흐에 -1 가중치를 부여하고 달리의 가중치를 5로 높여 달리의 작품에서 반 고흐의 영향을 제거할 수 있습니다.