Интервью с Марией Обедковой

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Про NLP-инжениринг расскажет Мария Обедкова

Выпускница ВШЭ (бакалавриат) и Карлова университета в Праге (магистратура)

• Призер Erasmus Mundus Scholarship Award

• NLP-инженер в Германии

— Что вдохновило тебя на карьеру в области NLP-инжиниринга и как ты начала работать в этой области?

Когда я оканчивала университет, была эра трансформеров и BERTa*, все практические применения выглядели безумно интересными для меня и я хотела во все это погрузиться, поэтому выбрала карьеру в индустрии. Работать я начала еще в университете (работы на полставки и стажировки), а самую первую full-time работу нашла сразу после магистратуры.

— Расскажи, какие задачи ты сейчас решаешь в месте, где ты работаешь, как NLP-инженер?

Мне кажется, разнообразный спектр задач. От тренировки различных NLP моделей до использования готовых опенсорсных технологий. Также много задач с периферии NLP: оценка качества и деплоймент* готовых решений, MLOps*, UX*, курирование разметки и т.д.

— Какие навыки — must have для NLP-инженера? Какие языки программирования, инструменты и библиотеки ты обычно используешь в своей работе?

Я бы сказала, что важно хорошее понимание NLP отрасли в целом; какие примерно методы и технологии используются для конкретных задач. Сейчас в NLP безусловно пригодится знание Python, какой-нибудь нейронной библиотеки типа PyTorch, быть знакомым с NLP библиотеками типа transformers, знать как использовать передовые LLMs, например с помощью OpenAI.

— Можешь ли ты поделиться значительным проектом или достижением в области NLP, которым ты особенно гордишься?

Я очень довольна некоторыми своими проектами по работе, где приходилось задействовать более технические знания и придумывать кастомные архитектуры. Я работаю в области Sentiment Analysis*, и проекты на тему TABSA и мультилингвального трансфера были довольно успешными.

— С какими основными проблемами приходится сталкиваться при работе над NLP проектами?

Основная проблема, что для кастомной задачи нужны кастомные данные, которых обычно не так много. Так что приходится либо изворачиваться, либо аннотировать (и то, и другое довольно сложно). Еще не все задачи довольно легко эвалюировать, когда работаешь в индустрии; зачастую оперируешь приблизительными значениями. Напоследок, нужно быть готовым к работе в множество итераций.

* Объяснения слов можно посмотреть в посте


Источник: m.vk.com

Комментарии: