Как усилить креативность моделей генерации изображений: метод учёных из KAIST

Современные модели генерации изображений на основе текста, такие как Stable Diffusion, могут создавать качественные картинки по текстовым описаниям. Но они не всегда могут быть по-настоящему креативными.
Учёные из KAIST придумали способ сделать эти модели более творческими без дополнительного обучения. Их технология улучшает способность моделей генерировать необычные и креативные изображения, например, стулья.
Исследователи обнаружили, что для повышения креативности нужно усилить определённые части изображения. Они использовали преобразование Фурье для работы с этими частями и нашли, что усиление низкочастотных компонентов помогает создать более оригинальные картинки.
Они также разработали алгоритм, который автоматически настраивает усиление для каждой части изображения. Это позволяет создавать более креативные и оригинальные картинки без обучения на новых данных.
Тестирование показало, что их метод действительно делает изображения более оригинальными, сохраняя их полезность. Учёные также провели опросы, чтобы убедиться, что люди считают эти изображения более новыми и интересными по сравнению с обычными.
© 2015-2025 Сетевое издание «Фактом». Зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Реестровая запись ЭЛ No ФС 77 - 67652 от 10.11.2016.