7 августа начнется летний интенсив по автоматической обработке текстов

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2017-07-31 14:01

Семинары

7 августа начнется летний интенсив по автоматической обработке текстов.

В курсе будут рассмотрены основные задачи автоматической обработки текстов и приемы анализа и обработки текстов на русском языке: 

- Морфологический и синтаксический анализ: как определить части речи в предложении? Как найти все глаголы, объекты и субъекты? Как построить дерево зависимостей? Что такое Google SyntaxNet?

- Выделение ключевых слов и словосочетаний: ищем важные слова и словосочетания в тексте. 

- Векторная модель текста и слова: представление текста в виде вектора для последующего машинного обучения, представление слова в виде вектора для моделирования его смысла.

- Методы снижения размерности в векторной модели текста: тематическое моделирование, LDA. 

- Методы снижения в векторной модели слова: word2vec, doc2vec, GloVe.

- Задача классификации текстов. 

- Задача классификации последовательностей: выделение именованных сущностей из текстов на русском языке.

- Глубинное обучение и автоматическая обработка текстов. 

- Сверточные нейронные сети для классификации текстов. 

- Реккурентные нейронные сети для извлечения именованных сущностей.

На практических занятиях будут рассмотрены примеры классификации и кластеризации текстов на реальных русскоязычных данных. Особое внимание уделяется задаче извлечения именованных сущностей (имен, название городов и организаций).

Подробности, запись и отзывы слушателей доступны на странице программы: cs.hse.ru/dpo/textmining

Комментарии: