Компьютерная лингвистика, анализ текстов, корпусная лингвистика

МЕНЮ


Искусственный интеллект. Новости
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАПсихологияТрансгуманизмЛингвистика, обработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

RSS


RSS новости

Авторизация



Новостная лента форума ailab.ru

Последние новости

 

Главные новости

2017-10-27 16:16

Нейронную сеть научили писать отличные отзывы о кафе и ресторанах


искусственные нейронные сети, компьютерная лингвистика

На отзывах держится если не весь интернет, то значительная его часть так точно. Отзывы о различных моделях устройств разных производителей, отзывы об автомобилях и запчастях, не говоря уже об отзывах посетителей ресторанов и кафе — все эти мнения служат средством оценки качества товаров и услуг. Отели, интернет-магазины, каталоги приложений — здесь везде есть, где почитать отзывы.

Маркетологи уже давно поняли, что хороший отзыв — это инструмент, позволяющий привлечь новых покупателей или

2017-09-22 18:44

Надежда Чиркова: анализ текстов


машинное обучение и анализ данных, компьютерная лингвистика

Автор занимается байесовскими методами машинного обучения. Томас Байес (1702 — 7 апреля 1761) — английский математик, пресвитерианский священник, член Лондонского королевского общества (1742)

Презентация:

2017-08-30 10:56

Исследование: искусственный интеллект берет на себя контент-менеджмент


искусственный интеллект, компьютерная лингвистика

Известно, что роботы уже способны заменить журналистов. Но такой сервис, как контент-менеджмент также находится на грани фундаментального сдвига, поскольку искусственный интеллект и машинное обучение уже способны выполнять заказы на корпоративный контент. По мере увеличения объема материалов, становится все сложнее справляться с ними. ИИ и машинное обучение имеют право изменить это, потому что алгоритмы способны лучше работать с большим количеством данных, и это потенциально может коренным

2017-08-18 12:45

Machine Learning в текстовом анализе


компьютерная лингвистика

11 августа в Калининграде завершилась пятая юбилейная Baltic Digital Days  — крупнейшая в регионе конференция по SEO и интернет-маркетингу.   В рамках секции «SEO в русскоязычном интернете» Павел Никулин (Demis Group) представил доклад на тему «Machine Learning для текстового анализа».

Выступление спикера было посвящено метрикам и алгоритмам, предназначенным для  поиска значимого текста в документе, определению его коммерческости, спамности, водности, неестественности,

2017-07-16 12:56

Программисты оживляют книги


компьютерная лингвистика

Британские учёные предложили новый метод цифровой обработки литературных произведений, который позволит визуализировать места действия в них с помощью 3D-анимации, геоинформационных систем (ГИС) и автоматического распознавания текста.

Такая система способна показать читателям «настоящую» анимированную карту Средиземья из трилогии Дж.Р.Р. Толкиена и любые другие локации, описанные в мировой литературе. На разработку выделен крупный грант, сообщается на сайте Ланкастерского университета.

2017-07-12 18:45

“Большие тексты”: алгоритм научат проверять факты в новостях и юридических документах


компьютерная лингвистика

В Образовательном центре “Сириус” команда молодых программистов проекта “Анализ текстов” создает алгоритм, способный “переваривать” большие массивы текстовых данных и находить связи между объектами, описанными в них. Например, общественными деятелями, политиками, учеными, компаниями или абстрактными понятиями. На основе алгоритма ребята планируют сделать чат-бота Telegram, который сможет проверять различные факты на истинность.

В рамках проекта “Анализ текстов” школьники в Центре “Сириус”

2017-07-08 15:08

Оказывается у Яндекса есть "Яндекс-рефераты" - забавный сервис, позволяющий генерировать наукообразный бред


компьютерная лингвистика

Вот этот сервис https://yandex.ru/referats/

А вот пример текста, сгенерированного этим сервисом:

«Классический христианско-демократический национализм: гипотеза и теории»

Социальная парадигма, как бы это ни казалось парадоксальным, символизирует прагматический христианско-демократический национализм. Иначе говоря, понятие политического конфликта представляет собой классический коллапс Советского Союза. Рационально-критическая парадигма ограничивает политический процесс в

2017-07-03 19:36

Классификация текста с помощью нейронной сети на JAVA


архитектура нейронных сетей, компьютерная лингвистика

– Наша Лена уходит в декрет, – сообщил начальник, – поэтому нам надо искать замену на время ее отсутствия. Часть задач мы распределим, а вот как быть с задачей перенаправления обращений пользователей?

Лена – это наш сотрудник технической поддержки. Одна из ее обязанностей – распределение поступающих на электронную почту обращений между специалистами. Она анализирует обращение и определяет ряд характеристик. Например, «Тип обращения»: ошибка системы, пользователю просто нужна консультация,

2017-05-20 15:00

Почему чат-боты — будущее больших данных


Чат-бот, компьютерная лингвистика

Многие впервые услышали о чат-ботах год назад, когда Facebook запустил платформу, позволяющую девелоперам создавать их самостоятельно. Тогда Facebook и другие крупные компании назвали чат-боты «восходящей звездой», революционной диалоговой утилитой, благодаря которой взаимодействие между компаниями и их клиентами вскоре изменится до неузнаваемости. Что же стало с чат-ботами? Играют ли они какую-либо роль сегодня?

Из этой статьи вы узнаете о том, как чат-боты изменили бизнес и почему они —

2017-04-18 22:04

Современные методы анализа тональности текста


компьютерная лингвистика

Анализ тональности текста (sentiment analysis) – распространенное приложение методов обработки естественного языка (natural language processing, NLP), в частности, классификации, целью которой является извлечение из текста эмоционального содержания. Таким образом, анализ тональности можно рассматривать, как метод количественного описания качественных данных, реализуемый путем присваивания некоторых оценок настроения. Хотя тональность в общем случае субъективна, количественный анализ
 

2017-11-17 12:51

Классификация на гуманитариев и технарей по комментариям в VK


компьютерная лингвистика, анализ социальных сетей, реализация нейронной сети

Хочу поделиться своим опытом классификации пользователей социальной сети по их комментариям на два класса по складу ума: гуманитарный или технический. В данной статье не будут использоваться последние достижения глубокого обучения, но будет разобран завершенный проект по классификации текстов: от поиска подходящих данных до предсказаний. В конце будет представлено веб-приложение, в котором вы сможете проверить себя.

Постановка задачи

Задача в нашем случае бинарной классификации

2017-10-30 09:56

Нечёткое сравнение строк: пойми меня, если сможешь


компьютерная лингвистика

На естественном языке сказать об одном и том же факте можно бесконечным числом способов. Можно переставлять слова местами, заменять их на синонимы, склонять по падежам (если говорим о языке с падежами) и тд.

Необходимость определять схожесть двух фраз возникла при решении одной небольшой практической задачи. Я не использовал машинное обучение, не вил нейронные сети, но использовал простые метрики и собранную статистику для калибровки коэффициентов.

Результатом работы, описанием процесса,

2017-10-12 15:24

Как научить свою нейросеть анализировать морфологию


лингвистика, компьютерная лингвистика

Недавно мы рассказывали про генератор стихов. Одной из особенностей языковой модели, лежащей в его основе, было использование морфологической разметки для получения лучшей согласованности между словами. Однако же у использованной морфоразметки был один фатальный недостаток: она была получена с помощью “закрытой” модели, недоступной для общего использования. Если точнее, выборка, на которой мы обучались, была размечена моделью, созданной для Диалога-2017 и основанной на закрытых технологиях и

2017-08-27 16:02

Разработанный в Disney ИИ научился оценивать качество текстов


искусственный интеллект, компьютерная лингвистика

 

Читать большие объёмы текстов — довольно увлекательное, но утомительное занятие. Найти в кипе посредственных рассказиков что-то стоящее тоже бывает не так уж и просто, поэтому разработчики Disney решили переложить этот неблагодарный труд на «плечи» искусственного интеллекта и создали алгоритм, способный анализировать и оценивать тексты. Совместно со специалистами Массачусетского университета Бостона команда Disney Research создала три нейронных сети, которые могут совместными усилиями

2017-08-22 16:01

Будущее веб-технологий: создаём интеллектуального чат-бота, который может слышать и говорить


распознавание речи, компьютерная лингвистика, голосовые помощники, искусственный интеллект, чат-боты

Голосовые интерфейсы в наши дни вездесущи. Во-первых — всё больше пользователей мобильных телефонов используют голосовых помощников, таких как Siri и Cortana. Во-вторых — устройства, вроде Amazon Echo и Google Home, становятся привычным элементом интерьера. Эти системы построены на базе программного обеспечения для распознавания речи, которое позволяет пользователям общаться с машинами с помощью голосовых команд. Теперь же эстафета, в обличье Web Speech API, переходит к браузерам.

В ходе

2017-08-18 17:00

Введение в обработку естественного языка


лингвистика, компьютерная лингвистика

Введение в обработку естественного языка.

Обработка естественного языка (Natural Language Processing, NLP) — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза естественных языков.

1. О курсе: идеология, содержание, структура

2. Обработка естественного языка: обзор дисциплины

3. Морфологический анализ

4. Языковые модели

5-6. Обработка языка (ОЕЯ) в задачах информационного поиска

7-9.

2017-08-15 18:43

Визуализация результатов латентно-семантического анализа средствами Python


компьютерная лингвистика

Постановка задачи Семантический (смысловой) анализ текста – одна из ключевых проблем как теории создания систем искусственного интеллекта, относящаяся к обработке естественного языка (Natural Language Processing, NLP), так и компьютерной лингвистики. Результаты семантического анализа могут применяться для решения задач в таких областях как, например, психиатрия (для диагностирования больных), политология (предсказание результатов выборов), торговля (анализ востребованности тех или иных

2017-07-25 09:10

Как научить свою нейросеть генерировать стихи


лингвистика, реализация нейронной сети, компьютерная лингвистика

Умоляю перестань мне сниться Я люблю тебя моя невеста Белый иней на твоих ресницах Поцелуй на теле бессловесном

Когда-то в школе мне казалось, что писать стихи просто: нужно всего лишь расставлять слова в нужном порядке и подбирать подходящую рифму. Следы этих галлюцинаций (или иллюзий, я их не различаю) встретили вас в эпиграфе. Только это стихотворение, конечно, не результат моего тогдашнего творчества, а продукт обученной по такому же принципу нейронной сети.

Вернее, нейронная сеть нужна

2017-06-06 10:34

Обзор исследований в области глубокого обучения: обработка естественных языков


искусственные нейронные сети, машинное обучение Python, реализация нейронной сети, машинный перевод, лингвистика, компьютерная лингвистика

Это третья статья из серии “Обзор исследований в области глубокого обучения” (Deep Learning Research Review) студента Калифорнийского университета в Лос-Анджелесе Адита Дешпанда (Adit Deshpande). Каждые две недели Адит публикует обзор и толкование исследований в определенной области глубинного обучения. В этот раз он сосредоточил свое внимание на применении глубокого обучения для обработки текстов на естественном языке.

Введение в обработку естественных языков

Введение Под обработкой

2017-05-14 22:38

В Salesforce научились убирать «воду» из текстов при помощи нейросетей


искусственный интеллект, компьютерная лингвистика

Компания рассчитывает, что созданные алгоритмами выжимки упростят чтение новостей и писем от клиентов.

Распечатки новостной ленты в редакции The New York Times, 1942 год. Фото Библиотеки Конгресса

Salesforce — разработчик самой популярной в мире CRM-системы и одна из самых дорогих компаний в области облачных технологий. В 2016 году она купила стартап MetaMind, специализирующийся на машинном обучении и обработке естественного языка.

MetaMind разработала алгоритм на базе