Stability AI представила Stable Diffusion 3, свою останню та найпотужнішу ітерацію технології штучного інтелекту для створення зображень, яка має на меті протистояти конкуренції з боку OpenAI та Google. Stability AI — це компанія з відкритим вихідним кодом, заснована Емадом Мостаке, яка займається створенням фотореалістичних зображень штучного інтелекту за допомогою флагманського продукту Diffusion. Мостак, керований глибоким інтересом до штучного інтелекту та невдоволенням уявною дезорганізацією спільноти штучного інтелекту з відкритим кодом, у 2019 році став співзасновником і самофінансуванням Stability AI. Diffusion швидко став основним засобом створення зображень із відкритим вихідним кодом до того, як OpenAI випустив DALL-E. Хоча специфіка обмежена, SD3 може похвалитися новою архітектурою та широкою апаратною сумісністю, хоча й потребує потужних ресурсів.
Читайте також: Пентагон приймає технічних лідерів на чотириденний симпозіум з ШІ
>Використовуючи оновлений «дифузійний трансформатор» і методи «узгодження потоку», SD3 покращує якість зображення без значних витрат. З діапазоном параметрів від 800 мільйонів до 8 мільярдів, SD3 прагне до універсальності налаштувань апаратного забезпечення, на відміну від моделей конкурентів, пов’язаних із API. SD3 прагне стати основною генеративною моделлю штучного інтелекту, надаючи пріоритет доступності та безпеці, одночасно розсуваючи межі створення зображень. Mostaque каже, що новий випуск буде мультимодальним, який поєднує різні типи даних, такі як текст, зображення, мова та числові дані, з кількома алгоритмами обробки інтелектуальних даних. Час випуску останнього випуску Stability AI є мудрим, оскільки кілька останніх великих імен випустили нові мультимодальні пропозиції перетворення тексту в зображення/відео.
Нещодавно OpenAI випустила Sora, пропозицію компанії для перетворення тексту у відео, яка отримала схвальні відгуки. У грудні Google вскочив у бійку зі своїм інструментом Gemini. Модель Stability спрямована на демократизацію використання генеративного створення образів штучного інтелекту, але відкритий характер їхньої моделі зробив неправильне використання на платформі гострою проблемою. Незрозуміло, чи забезпечить нова модель більше для управління та запобігання зловживанням.
Довгоочікувана гра Blizzard про виживання, анонсована в січні 2022 року, була раптово скасована через масштабні…
Як користувач Mac, ви, можливо, помітили QuickTime Player у списку програм. Він попередньо встановлений на…
Це був невдалий день для Google після випуску нової великої мовної моделі Gemini. Однією з…
Можливо, ви втомилися працювати в жаркому приміщенні через надлишок тепла, який виробляє ваша комп’ютерна система.…
Рідкоземельні метали, також звані лантаноїдами, являють собою групу елементів, прихованих всередині інших елементів. Ці метали…
Робота з помилками чи попередженнями реєстру вашого комп’ютера може бути дуже лякаючою та страшною, особливо…