Заменят ли роботы копирайтеров, переводчиков и журналистов через 10 лет?

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2020-03-15 15:03

лингвистика

Речь пойдет о компьютерной лингвистике.

В 50-х гг. надеялись, что можно загрузить в память компьютера описание одного языка, выделить универсальные принципы, решить технические проблемы, и у человечества появится инструмент для письменного общения на любых языках.

Конечно, этого не произошло, в том числе и из-за важности контекста и многозначности слов.

И речь не только о том, что слово «лук» имеет разные значения, но и о том, что словоформа «двери» может в русском языке быть формой пяти падежей. Или, к примеру, задача разрешения анафоры. Под ней понимают предложения типа «Владимир поднялся на холм, он был пологий», в которых мы понимаем, что пологим был холм, а не Владимир, но для машины установить эти отношения сложно. Зато программисты научили машину переводить слово в числовой вид.

В дистрибутивной семантике слово превращается, например, в трехсотмерный вектор, то есть в последовательность из 300 чисел, которая и содержит данные о контексте его употребления.

С помощью дистрибутивной семантики можно установить, что разные написания «МГУ» обозначают одну организацию.

На практике это позволяет, к примеру, находить договоры с одним поставщиком или качественно проводить патентную экспертизу.

Все чаще в новостной ленте попадаются сообщения, что искусственный интеллект (ИИ) пишет новости для той или иной площадки или СМИ, создал целый роман или сценарий.

Создается впечатление, что в скором будущем мы будем читать созданные робожурналистами (термин какой, а??) новостные заметки, боты будут писать сочинения и эссе вместо школьников, а цифровые писатели будут создавать под наш индивидуальный заказ романы в заданном формате, жанре и сеттинге.

Известные СМИ, в числе которых The New York Times и Forbes, используют роботизированные системы для генерации текстов. Шаблон готовит чаще всего человек, а новыми данными его обогащает ИИ (в биржевых сводках, спортивных и криминальных новостях, прогнозах погоды).

Современная компьютерная лингвистика позволяет автоматически извлекать из текстов такие типы данных, как физические и юрлица, топонимы, реквизиты. В журналистской и бизнес-практике это уже используется для выявления аффилированных связей. Ключевой проблемой компьютерных алгоритмов остается невозможность работать с тем, что человек воспринимает как «смысл текста».

Мы можем убрать из текста 10 слов без ощутимых потерь, а можем изменить всего одно слово так, что это кардинально изменит смысл сообщения.

Кроме того, автор при создании текста держит в уме потенциальный опыт читателя, его знакомство с определенными терминами и концепциями, общие культурные коды. Он оценивает, какая информация в тексте требует дополнительного разъяснения, а какая – нет.

Для машин в настоящем и обозримом будущем такая работа с контекстом останется недостижимой.

Комментарии: