Самообучение без разметки: лекция Алексея Зайцева для студентов AI360

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Алексей Зайцев, доцент Сколтеха и руководитель совместной лаборатории Сколтех–Сбер в Центре ИИ, выступил с приглашённой лекцией о самообучении (Self-Supervised Learning) на проектной школе программы AI360, которую Сбер и Яндекс провели для второкурсников МФТИ, ВШЭ, ИТМО, Иннополиса.

Алексей объяснил, почему современный ИИ всё чаще учится не на размеченных датасетах, а на огромных массивах «сырых» данных без меток: разметка дорога и не успевает за ростом моделей, а именно самообучение лежит в основе foundation-моделей, способных строить «модели мира».

На простых примерах он показал, как работает представление объектов (representation learning) и чем отличаются две ключевые линии самообучения — генеративная (когда модель восстанавливает пропуски или предсказывает будущее по прошлому) и контрастивная (когда модель учится считать похожие объекты ближе, а разные — дальше в пространстве признаков).

Отдельный блок был посвящён тому, как эти идеи работают в разных типах данных: изображениях, текстах, временных рядах и последовательностях событий.

Алексей разобрал примеры самообучения на транзакционных данных (MCC, сумма, время и место покупки) и задачах анализа рисков, а также связал основные методы с собственными работами на конференциях уровня A* и в журналах Q1. В итоге студенты AI360 увидели, как «академические» методы самообучения напрямую переходят в практические ИИ-системы — от антифрода и скоринга до сложных моделей, которые мы сегодня воспринимаем как базовую инфраструктуру искусственного интеллекта.


Источник: vk.com

Комментарии: