Stability AI випускає нову версію Stable Diffusion

Stability AI представила Stable Diffusion 3, свою останню та найпотужнішу ітерацію технології штучного інтелекту для створення зображень, яка має на меті протистояти конкуренції з боку OpenAI та Google.

Stability AI — це компанія з відкритим вихідним кодом, заснована Емадом Мостаке, яка займається створенням фотореалістичних зображень штучного інтелекту за допомогою флагманського продукту Diffusion.

Мостак, керований глибоким інтересом до штучного інтелекту та невдоволенням уявною дезорганізацією спільноти штучного інтелекту з відкритим кодом, у 2019 році став співзасновником і самофінансуванням Stability AI.

Diffusion швидко став основним засобом створення зображень із відкритим вихідним кодом до того, як OpenAI випустив DALL-E.

Хоча специфіка обмежена, SD3 може похвалитися новою архітектурою та широкою апаратною сумісністю, хоча й потребує потужних ресурсів.

Використовуючи оновлений «дифузійний трансформатор» і методи «узгодження потоку», SD3 покращує якість зображення без значних витрат.

З діапазоном параметрів від 800 мільйонів до 8 мільярдів, SD3 прагне до універсальності налаштувань апаратного забезпечення, на відміну від моделей конкурентів, пов’язаних із API.

SD3 прагне стати основною генеративною моделлю штучного інтелекту, надаючи пріоритет доступності та безпеці, одночасно розсуваючи межі створення зображень.

Mostaque каже, що новий випуск буде мультимодальним, який поєднує різні типи даних, такі як текст, зображення, мова та числові дані, з кількома алгоритмами обробки інтелектуальних даних.

Час випуску останнього випуску Stability AI є мудрим, оскільки кілька останніх великих імен випустили нові мультимодальні пропозиції перетворення тексту в зображення/відео.

Нещодавно OpenAI випустила Sora, пропозицію компанії для перетворення тексту у відео, яка отримала схвальні відгуки.

У грудні Google вскочив у бійку зі своїм інструментом Gemini.

Модель Stability спрямована на демократизацію використання генеративного створення образів штучного інтелекту, але відкритий характер їхньої моделі зробив неправильне використання на платформі гострою проблемою.

Незрозуміло, чи забезпечить нова модель більше для управління та запобігання зловживанням.