SkyRL-SQL — лёгкий RL-подход для Text-to-SQL от NovaSky, который превзошёл GPT-4o и o4-mini, обучаясь всего на 653 примерах!

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Что это:

SkyRL-SQL — это эффективный RL-фреймворк для генерации SQL-запросов из текста.

Модель `SkyRL-SQL-7B` обучена с нуля с использованием обучения с подкреплением (reinforcement learning), без гигантских датасетов.

Результаты на Spider-бенчмарках:

`| Модель | Spider-Dev | Spider-Test | Realistic | DK | Syn | Среднее |

|--------------------|------------|-------------|-----------|------|------|---------|

| GPT-4o | 81.3 | 82.4 | 80.1 | 72.1 | 71.9 | 77.6 |

| o4-mini | 80.6 | 81.8 | 81.2 | 70.8 | 72.1 | 77.3 |

| **SkyRL-SQL-7B** | **83.9** | **85.2** | **81.1** | 72.0 | 73.7 | **79.2** |`

Особенности:

• RL-обучение по шагам с интерактивной проверкой

• Поддержка уточнения SQL на основе ошибок

• Обучение всего на 653 примерах

• Превосходит более крупные модели на практике

GitHub: https://github.com/NovaSky-AI/SkyRL

Блог: https://novasky-ai.github.io/posts/skyrl-sql

Отличный пример того, как можно бить гигантов с умной архитектурой, а не только размерами.

Github (https://github.com/NovaSky-AI/SkyRL)


Источник: github.com

Комментарии: