Новый способ обучения ИИ: аудиовизуальное сопоставление без участия человека

24 мая 2025, 05:08 , Источник: techxplore.com , Источник фото: freepik.com

Люди легко учатся, связывая изображение и звук. Например, наблюдая за игрой на виолончели, мы понимаем, что движения музыканта создают музыку.

Учёные из Массачусетского технологического института и других мест создали новый способ обучения ИИ, который помогает ему учиться так же. Это может быть полезно для журналистики и кинопроизводства, где ИИ может автоматически находить видео и аудио для создания контента.

Учёные улучшили свою модель ИИ, чтобы она могла сопоставлять аудио и видео без помощи людей. Они изменили способ обучения модели, чтобы она лучше понимала, как кадры видео связаны со звуками. Также они внесли изменения в структуру модели, чтобы она могла лучше работать с двумя задачами одновременно.

Эти улучшения делают модель точнее в поиске видео и распознавании действий в аудиовизуальных сценах. Например, теперь ИИ может автоматически и точно связать звук закрывающейся двери с изображением её закрытия в видео.

загрузка...

Политика конфиденциальности Пользовательское соглашение

© 2015-2025 Сетевое издание «Фактом». Зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Реестровая запись ЭЛ No ФС 77 - 67652 от 10.11.2016.