Заменят ли роботы копирайтеров, переводчиков и журналистов через 10 лет? |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-03-15 15:03 Речь пойдет о компьютерной лингвистике. В 50-х гг. надеялись, что можно загрузить в память компьютера описание одного языка, выделить универсальные принципы, решить технические проблемы, и у человечества появится инструмент для письменного общения на любых языках. Конечно, этого не произошло, в том числе и из-за важности контекста и многозначности слов. И речь не только о том, что слово «лук» имеет разные значения, но и о том, что словоформа «двери» может в русском языке быть формой пяти падежей. Или, к примеру, задача разрешения анафоры. Под ней понимают предложения типа «Владимир поднялся на холм, он был пологий», в которых мы понимаем, что пологим был холм, а не Владимир, но для машины установить эти отношения сложно. Зато программисты научили машину переводить слово в числовой вид.В дистрибутивной семантике слово превращается, например, в трехсотмерный вектор, то есть в последовательность из 300 чисел, которая и содержит данные о контексте его употребления. С помощью дистрибутивной семантики можно установить, что разные написания «МГУ» обозначают одну организацию. На практике это позволяет, к примеру, находить договоры с одним поставщиком или качественно проводить патентную экспертизу. Все чаще в новостной ленте попадаются сообщения, что искусственный интеллект (ИИ) пишет новости для той или иной площадки или СМИ, создал целый роман или сценарий.Создается впечатление, что в скором будущем мы будем читать созданные робожурналистами (термин какой, а??) новостные заметки, боты будут писать сочинения и эссе вместо школьников, а цифровые писатели будут создавать под наш индивидуальный заказ романы в заданном формате, жанре и сеттинге. Известные СМИ, в числе которых The New York Times и Forbes, используют роботизированные системы для генерации текстов. Шаблон готовит чаще всего человек, а новыми данными его обогащает ИИ (в биржевых сводках, спортивных и криминальных новостях, прогнозах погоды). Современная компьютерная лингвистика позволяет автоматически извлекать из текстов такие типы данных, как физические и юрлица, топонимы, реквизиты. В журналистской и бизнес-практике это уже используется для выявления аффилированных связей. Ключевой проблемой компьютерных алгоритмов остается невозможность работать с тем, что человек воспринимает как «смысл текста».Мы можем убрать из текста 10 слов без ощутимых потерь, а можем изменить всего одно слово так, что это кардинально изменит смысл сообщения. Кроме того, автор при создании текста держит в уме потенциальный опыт читателя, его знакомство с определенными терминами и концепциями, общие культурные коды. Он оценивает, какая информация в тексте требует дополнительного разъяснения, а какая – нет. Для машин в настоящем и обозримом будущем такая работа с контекстом останется недостижимой.Комментарии: |
|