Кластер Ломоносов , Москва, Раменский бульвар, д. 1
Искусственный интеллект уже давно освоил обработку изображений и распознавание объектов — сегодня современные алгоритмы способны извлекать смысл даже из видеопотока движущихся камер: анализировать последовательность действий персонажей, взаимосвязи между объектами и изменения во времени.
Современные нейросетевые модели используют мультимодальные подходы, сочетая визуальную и текстовую информацию для формирования полного представления о сюжете и событиях видеоролика.
На питч-сессии познакомимся с реальными проектами в этой области, а на лекции разберём, как такие технологии проектируются и внедряются в практику.