Лекция 3: Мультимодальный искусственный интеллект

Аватар автора
Векторша
Серия лекций "Искусственный интеллект. Лаборатория с Викторией Фирсановой" в пространстве "Открытые мастерские" (библиотека "Лиговская", библиотека им. М.Ю. Лермонтова, Санкт-Петербург) Мультимодальный ИИ — это технология, которая может одновременно анализировать текст, изображения, видео, звук и даже сенсорные данные. Такие системы используются для генерации изображений и видео по текстовому описанию, расшифровки аудиозаписей, озвучивание аудиокниг и многого другого. Сегодня такие ИИ используется в разработке цифровых ассистентов для анализа медицинских данных, автоматизации творчества и решения бизнес-задач. На грядущей встрече лаборатории вы: - Узнаете, как и зачем совмещать разные типы данных (текст, изображения, видео) в одной системе. - Разберётесь, какие задачи можно решить с помощью мультимодального ИИ: от анализа соцсетей до создания интерактивного контента. - Познакомитесь с инструментами, которые не требуют навыков программирования: готовые платформы, открытые модели и сервисы. - Создадите прототип своей мультимодальной системы: например, бота, который генерирует описания к фотографиям или анализирует видео-отзывы. Как проходит лаборатория: - Обсудим, как применять ИИ в вашей профессиональной сфере. - Поймём, как безопасно и этично работать с мультимодальными данными. - Выберем подходящие ресурсы и научимся их настраивать. - Запустим простой, но функциональный проект, который сможете развивать после встречи. Лектор: Виктория Фирсанова (преподаватель НИУ...

0/0


0/0

0/0

0/0