BREAK: данные, чтобы обучить нейросеть понимать суть вопроса |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-02-04 15:48 BREAK — это датасет для решения задачи понимания сути вопроса нейросетью. Он предназначен для того, чтобы модели вычленяли из комплексных вопросов сущности, которые помогут при генерации ответов. Датасет состоит из 83,978 вопросов на естественном языке, которые разметили с помощью предложенного представления QDMR. Question Decomposition Meaning Representation (QDMR) каждого вопроса представляет собой лист пунктов на естественном языке, которые необходимы для ответа на вопрос. Вопросы в BREAK собирали из 10 датасетов для задачи question answering. Сбором датасета занимались исследователи из Allen Institute for AI. Понимание вопросов на естественном языке предполагает возможность разбиения вопроса на пункты, которые необходимы при формулировании ответа. Для этой задачи исследователи предлагают использовать QDMR представления. QDMR представления вопроса — это направленный граф, в котором узел — это пара сущности из вопроса и действия. Из одного узла в другой проводится связь в соответствии с последовательностью совершаемых действий. Исследователи показали, что использование QDMR улучшает перформанс моделей для задачи open-domain question answering на датасете HOTPOTQA. QDMR можно конвертировать в язык формата псевдоSQL. Что такое QDMR представление вопроса Дизайн Question Decomposition Meaning Representation (QDMR) вдохновлен языками для управлениями баз данных и семантическим парсингом. В QDMR вопрос выражается в подвопросы (операторы), которые необходимо последовательно выполнить, чтобы ответить на вопрос. Каждый QDMR оператор может либо выбирать набор сущностей, извлекать информацию об их атрибутах или агрегировать информацию по сущностям. Как устроен датасет BREAK агрегирует в себе вопросы из 10 датасетов для задач question answering:
Исследователи обучили на BREAK нейросетевую модель CopyNet, которая обошла базовые решения. Источник: neurohive.io Комментарии: |
|