Компания Apple совершила прорыв в области искусственного интеллекта

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2024-03-20 12:35

ИИ теория

Исследователи Apple разработали новые методы обучения больших языковых моделей как на тексте, так и на изображениях, что позволяет создавать более мощные и гибкие системы искусственного интеллекта, что может стать значительным шагом вперед для искусственного интеллекта и будущих продуктов Apple.

Работа, описанная в исследовательской статье под названием «MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training», которая была опубликована в arxiv.org на этой неделе, демонстрирует, как тщательное сочетание различных типов обучающих данных и архитектур моделей может привести к высочайшей производительности в ряде тестов ИИ.

«Мы демонстрируем, что для крупномасштабного мультимодального предварительного обучения использование тщательного сочетания изображений-подписей, чередующихся изображений-текста и текстовых данных имеет решающее значение для достижения современных результатов с несколькими кадрами по нескольким тестам», — объясняют исследователи. Обучая модели на разнообразном наборе данных, охватывающем визуальную и лингвистическую информацию, модели MM1 смогли преуспеть в таких задачах, как подписи к изображениям, визуальные ответы на вопросы и вывод на естественном языке.

Масштабирование визуальных компонентов является ключевым фактором

Исследователи также обнаружили, что выбор кодировщика изображений и разрешение входных изображений оказали большое влияние на производительность модели. «Мы показываем, что кодировщик изображений вместе с разрешением изображения и количеством маркеров изображений оказывает существенное влияние, в то время как конструкция коннектора языка машинного зрения имеет сравнительно незначительное значение», — сказали они. Это говорит о том, что дальнейшее масштабирование и совершенствование визуальных компонентов этих мультимодальных моделей станет ключом к получению дальнейших преимуществ.

Удивительно, но самая большая модель MM1 с 30 миллиардами параметров продемонстрировала сильные способности к контекстному обучению, что позволило ей выполнять многоступенчатые рассуждения на нескольких входных изображениях, используя несколько подсказок «цепочки мыслей». Это указывает на потенциал больших мультимодальных моделей для решения сложных, открытых проблем, требующих обоснованного понимания и генерации языка.

Ставка Apple на ИИ на миллиард долларов

Исследование MM1 было проведено в то время, когда Apple наращивает свои инвестиции в искусственный интеллект в попытке догнать таких конкурентов, как Google, Microsoft и Amazon, которые вырвались вперед в интеграции возможностей генеративного искусственного интеллекта в свои продукты. Согласно недавнему отчету Bloomberg, компания планирует тратить $1 млрд в год на разработку искусственного интеллекта.

Источники сообщают, что Apple работает над большой языковой моделью под названием «Ajax», а также над чат-ботом, известным как «Apple GPT». Цель состоит в том, чтобы интегрировать эти технологии в Siri, Сообщения, Apple Music и другие приложения и сервисы. Например, ИИ можно использовать для автоматического создания персонализированных списков воспроизведения, помощи разработчикам в написании кода или участия в открытых беседах и выполнении задач.

Мы рассматриваем искусственный интеллект и машинное обучение как фундаментальные технологии, и они являются неотъемлемой частью практически каждого продукта, который мы поставляем», — сказал генеральный директор Apple Тим Кук во время недавней телефонной конференции. «Я не собираюсь вдаваться в подробности о том, что это такое, потому что, как вы знаете, мы этого не делаем. Но вы можете поспорить, что мы инвестируем, мы инвестируем довольно много, мы собираемся делать это ответственно, и вы увидите прогресс продукта с течением времени, когда эти технологии лежат в их основе».

Высокие ставки в гонке вооружений ИИ

У Apple есть история быстрого следования, а не первопроходца, когда дело доходит до крупных технологических сдвигов. Но поскольку искусственный интеллект готов трансформировать каждый аспект цифрового ландшафта, ставки для производителя iPhone высоки, чтобы оставаться конкурентоспособным. Исследование MM1 показывает, что у Apple есть талант и ресурсы для достижения передовых результатов. Но еще предстоит увидеть, сможет ли компания, известная своей скрытностью, действовать достаточно быстро, чтобы идти в ногу с обостряющейся гонкой вооружений ИИ.

В июне многие будут прикованы к Всемирной конференции разработчиков Apple, на которой, как ожидается, компания представит новые функции и инструменты для разработчиков на основе искусственного интеллекта. В то же время, небольшие достижения в области искусственного интеллекта, такие как инструмент анимации Keyframer, и улучшения производительности, разработанные исследовательскими лабораториями Apple, показывают, что за кулисами достигнут устойчивый прогресс.

Как недавно намекнул Кук во время телефонного разговора о доходах за первый квартал: «Мы рады поделиться подробностями нашей текущей работы в области искусственного интеллекта в конце этого года». Теперь ясно, что эта работа включает в себя амбициозные усилия по освоению мультимодального интеллекта в самых больших масштабах. Эра повсеместно полезного и человекоподобного искусственного интеллекта может наступить раньше, чем мы думаем, и Apple намерена сыграть важную роль в ее формировании.


Источник: dzen.ru

Комментарии: