Курса Андрея Карпаты: «Глубокое погружение в большие языковые модели типа ChatGPT» фокусируется на процессе инференса (вывода) в языковых моделях

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2025-02-19 16:08

ИИ теория

Часть 2 курса Андрея Карпаты: «Глубокое погружение в большие языковые модели типа ChatGPT» фокусируется на процессе инференса (вывода) в языковых моделях. В этом разделе рассматривается практическое применение модели GPT-2, включая как процесс её обучения, так и механизм инференса.

Эта часть логически следует за базовым введением из первой части, где были заложены фундаментальные концепты, и предваряет более глубокое погружение в современные модели, такие как Llama 3.1, и сложные темы вроде пост-обучения.

Понимание процесса инференса особенно важно, так как это один из ключевых аспектов, необходимых для работы с более сложными концепциями, которые будут рассмотрены позже в курсе, такими как пост-обучение и работа с галлюцинациями.

Преподаватель

Андрей был одним из основателей OpenAI (2015), затем старшим директором по ИИ в Tesla (2017-2022), а сейчас является основателем Eureka Labs, которая создает школу, основанную на ИИ. Его цель в этом видео — повысить уровень знаний и понимания современного состояния ИИ, а также помочь людям эффективно использовать новейшие достижения в своей работе.

Переведено и озвучено Фабрикой Контента для Лаборатории Искусственного Интеллекта Центра Истинных Ценностей в Ростове-на-Дону.


Источник: vk.com

Комментарии: