Назад к книге «Генеративный искусственный интеллект #Forge&flux. Инструкция по установке и настройке» [Александр Юрьевич Чесалов]

Генеративный искусственный интеллект #Forge&flux. Инструкция по установке и настройке

Александр Юрьевич Чесалов

Эта книга – инструкция для всех желающих познакомиться с передовыми технологиями искусственного интеллекта. В ней простым и доступным языком объясняется, как установить бесплатную систему генеративного искусственного интеллекта Stable Diffusion WebUI Forge на домашний компьютер и создавать невероятные изображения.

Часть текста была ранее опубликована в книге «Генеративный искусственный интеллект #Forge&flux. Учебное пособие для школьников старших классов и студентов первых курсов ВУЗов».

Александр Чесалов

Генеративный искусственный интеллект #Forge&flux. Инструкция по установке и настройке

Введение

Одной из самых впечатляющих способностей генеративного искусственного интеллекта, на мой взгляд, является его умение создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных эпох. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире, которые тем не менее можно материализовать, добавив текстовое описание в программу Stable Diffusion WebUI Forge и создать нечто новое.

Stable Diffusion WebUI Forge – это совершенно бесплатная программа, которую вы можете загрузить и установить на свой компьютер. Она устроена таким образом, что в нее без особого труда можно добавлять различные модули, которые расширяют ее функциональные возможности. Одними из таких модулей являются модели, при помощи которых создаются изображения.

Сейчас наиболее популярными моделями являются Stable Diffusion, Midjourney и DALL-E. Но, не так давно, появилась невероятно мощная модель FLUX.1.

В середине 2024 года модель FLUX.1 стала прорывной технологией в генеративном искусственном интеллекте, оставив позади себя все остальные модели от лидеров рынка. Десятки интернет-сервисов стали рекомендовать ее как наиболее производительную и эффективную при создании изображений. И, как вы уже поняли, именно этой модели уделяется основное внимание в этой книге.

Модель FLUX.1 была создана бывшими инженерами из компании Stability AI, которые занимались разработкой и развитием знаменитой модели Stable Diffusion[1 - . Фетисов В. Стартап Black Forest Labs представил ИИ-генератор изображений FLUX.1 – он отлично справляется с прорисовкой рук человек. [Электронный ресурс] 3dnews.ru URL: https://3dnews.ru/1109014/startap-black-forest-labs-predstavil-iigenerator-izobrageniy-flux1-on-otlichno-spravlyaet-s-prorisovkoy-ruk-cheloveka (дата обращения: 11.09.2024).]. Робин Ромбах (Robin Rombach), Андреас Блаттманн (Andreas Blattmann), Доминик Лоренца (Dominik Lorenz) и Патрик Эссер (Patrick Esser) объединили свои усилия в работе над новым проектом FLUX.1 и создали новую компанию Black Forest Lab[2 - . We are Black Forest Labs. [Электронный ресурс] blackforestlabs.ai URL: https://blackforestlabs.ai/our-team/ (дата обращения: 11.09.2024).].

Black Forest Lab изначально предлажила нам три версии модели FLUX.1[3 - . FLUX.1. A new era of creation. [Электронный ресурс] blackforestlabs.ai URL: https://blackforestlabs.ai/ (дата обращения: 11.09.2024).]:

–FLUX.1 [pro] – самая мощная версия реализация коммерческой модели, доступная к использованию через API у партнеров компании или в индивидуальном порядке.

–FLUX.1 [dev] – немного облегченный вариант первой модели не для коммерческого использования. Варианты реализации модели можно найти на сайте huggingface.

–FLUX.1 [schnell] – самая быстрая реализация модели с открытым исходным кодом, которая так и называется «быстрая / нем. schnell». Она предназначена для использования на локальных компьютерах. Исходный код модели можно найти на сайте GitHub. Варианты ее реализации можно найти на сайте huggingface.

По очень смелой оценке инженеров Black Forest Lab, данная модель более производитель