VideoMind: новый инструмент для анализа длинных видео искусственным интеллектом

Несмотря на быстрый прогресс в области искусственного интеллекта (ИИ), ИИ-модели пока плохо понимают длинные видео. Исследователи из Политехнического университета Гонконга создали новый инструмент под названием VideoMind, который помогает ИИ анализировать длинные видео и отвечать на вопросы, как это делает человек.
VideoMind использует новую стратегию, которая экономит вычислительные ресурсы и делает ИИ более эффективным при анализе видео. Результаты этой работы были представлены на важных международных конференциях по ИИ.
Длинные видео содержат много информации, которая раскрывается постепенно: события, причины и следствия, переходы между сценами и т.д. ИИ-моделям нужно не только распознавать объекты на видео, но и понимать, как они меняются со временем. Это требует много вычислительных ресурсов, что затрудняет обработку длинных видео.
Профессор Чанвэнь Чэнь и его команда разработали VideoMind, который работает по принципу, похожему на то, как это делает человек.
© 2015-2025 Сетевое издание «Фактом». Зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Реестровая запись ЭЛ No ФС 77 - 67652 от 10.11.2016.