Xlam-function-calling-60k — датасет для обучения LLM, способных взаимодействовать с внешними API |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2024-07-18 12:23 Этот репозиторий содержит 60 000 данных, собранных APIGen — конвейером автоматического создания данных, предназначенным для создания проверяемых наборов данных высокого качества для приложений, вызывающих функции. Каждые данные в нашем наборе данных проверяются на трех иерархических этапах: проверка формата, фактическое выполнение функций и семантическая проверка, обеспечивая их надежность и правильность. Мы провели человеческую оценку более 600 выборочных точек данных, и правильный показатель превышает 95%, а у остальных 5% есть незначительные проблемы, такие как неточные аргументы и т. д. Общая структура процедуры сбора набора данных показана ниже. Подробности смотрите на главной странице нашего проекта . ? Новости
Что такое агент вызова функций? Агенты, вызывающие функции, способны выполнять функциональные вызовы API из инструкций на простом языке. Представьте себе, что вы спрашиваете о сегодняшней погоде в Пало-Альто. В ответ агент, вызывающий функцию, быстро интерпретирует этот запрос, подключается к соответствующему API, например, и Наборы данных Наборы данных были созданы с помощью DeepSeek-V2-Chat и Mixtral-8x22B-Inst . Мы используем APIGen и собираем 3673 исполняемых API в 21 различной категории для создания разнообразных наборов данных о вызовах функций масштабируемым и структурированным образом. Первые Набор данных находится по адресу
Формат данных JSON для запросов и ответов Этот формат данных JSON используется для представления запроса вместе с доступными инструментами и соответствующими ответами. Вот описание формата: Состав Данные JSON состоят из следующих пар ключ-значение:
Обратите внимание, что мы форматируем Пример Вот пример данных JSON:
В этом примере запрос просит найти сумму кратных 3 и 5 между 1 и 1000, а также найти произведение первых пяти простых чисел. Доступными инструментами являются Результаты тестов Наряду с набором данных мы также выпускаем две небольшие, но функциональные модели вызова функций, как упоминалось в статье: xLAM-1b-fc-r и xLAM-7b-fc-r . В основном мы тестируем их на Таблице лидеров по вызову функций Беркли (BFCL) , которая предлагает комплексную структуру оценки возможностей LLM по вызову функций в различных языках программирования и областях приложений, таких как Java, JavaScript и Python. Сравнение производительности на бенчмарке BFCL по состоянию на 18.07.2024. Оценивается с помощью Наш Цитирование Если набор данных оказался для вас полезным, укажите:
Источник: huggingface.co Комментарии: |
|