Компания Apple совершила прорыв в области искусственного интеллекта

2024-03-20 12:35

Исследователи Apple разработали новые методы обучения больших языковых моделей как на тексте, так и на изображениях, что позволяет создавать более мощные и гибкие системы искусственного интеллекта, что может стать значительным шагом вперед для искусственного интеллекта и будущих продуктов Apple.

Работа, описанная в исследовательской статье под названием «MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training», которая была опубликована в arxiv.org на этой неделе, демонстрирует, как тщательное сочетание различных типов обучающих данных и архитектур моделей может привести к высочайшей производительности в ряде тестов ИИ.

«Мы демонстрируем, что для крупномасштабного мультимодального предварительного обучения использование тщательного сочетания изображений-подписей, чередующихся изображений-текста и текстовых данных имеет решающее значение для достижения современных результатов с несколькими кадрами по нескольким тестам», — объясняют исследователи. Обучая модели на разнообразном наборе данных, охватывающем визуальную и лингвистическую информацию, модели MM1 смогли преуспеть в таких задачах, как подписи к изображениям, визуальные ответы на вопросы и вывод на естественном языке.

Масштабирование визуальных компонентов является ключевым фактором

Исследователи также обнаружили, что выбор кодировщика изображений и разрешение входных изображений оказали большое влияние на производительность модели. «Мы показываем, что кодировщик изображений вместе с разрешением изображения и количеством маркеров изображений оказывает существенное влияние, в то время как конструкция коннектора языка машинного зрения имеет сравнительно незначительное значение», — сказали они. Это говорит о том, что дальнейшее масштабирование и совершенствование визуальных компонентов этих мультимодальных моделей станет ключом к получению дальнейших преимуществ.

Удивительно, но самая большая модель MM1 с 30 миллиардами параметров продемонстрировала сильные способности к контекстному обучению, что позволило ей выполнять многоступенчатые рассуждения на нескольких входных изображениях, используя несколько подсказок «цепочки мыслей». Это указывает на потенциал больших мультимодальных моделей для решения сложных, открытых проблем, требующих обоснованного понимания и генерации языка.

Ставка Apple на ИИ на миллиард долларов

Исследование MM1 было проведено в то время, когда Apple наращивает свои инвестиции в искусственный интеллект в попытке догнать таких конкурентов, как Google, Microsoft и Amazon, которые вырвались вперед в интеграции возможностей генеративного искусственного интеллекта в свои продукты. Согласно недавнему отчету Bloomberg, компания планирует тратить $1 млрд в год на разработку искусственного интеллекта.

Источники сообщают, что Apple работает над большой языковой моделью под названием «Ajax», а также над чат-ботом, известным как «Apple GPT». Цель состоит в том, чтобы интегрировать эти технологии в Siri, Сообщения, Apple Music и другие приложения и сервисы. Например, ИИ можно использовать для автоматического создания персонализированных списков воспроизведения, помощи разработчикам в написании кода или участия в открытых беседах и выполнении задач.

Мы рассматриваем искусственный интеллект и машинное обучение как фундаментальные технологии, и они являются неотъемлемой частью практически каждого продукта, который мы поставляем», — сказал генеральный директор Apple Тим Кук во время недавней телефонной конференции. «Я не собираюсь вдаваться в подробности о том, что это такое, потому что, как вы знаете, мы этого не делаем. Но вы можете поспорить, что мы инвестируем, мы инвестируем довольно много, мы собираемся делать это ответственно, и вы увидите прогресс продукта с течением времени, когда эти технологии лежат в их основе».

Высокие ставки в гонке вооружений ИИ

У Apple есть история быстрого следования, а не первопроходца, когда дело доходит до крупных технологических сдвигов. Но поскольку искусственный интеллект готов трансформировать каждый аспект цифрового ландшафта, ставки для производителя iPhone высоки, чтобы оставаться конкурентоспособным. Исследование MM1 показывает, что у Apple есть талант и ресурсы для достижения передовых результатов. Но еще предстоит увидеть, сможет ли компания, известная своей скрытностью, действовать достаточно быстро, чтобы идти в ногу с обостряющейся гонкой вооружений ИИ.

В июне многие будут прикованы к Всемирной конференции разработчиков Apple, на которой, как ожидается, компания представит новые функции и инструменты для разработчиков на основе искусственного интеллекта. В то же время, небольшие достижения в области искусственного интеллекта, такие как инструмент анимации Keyframer, и улучшения производительности, разработанные исследовательскими лабораториями Apple, показывают, что за кулисами достигнут устойчивый прогресс.

Как недавно намекнул Кук во время телефонного разговора о доходах за первый квартал: «Мы рады поделиться подробностями нашей текущей работы в области искусственного интеллекта в конце этого года». Теперь ясно, что эта работа включает в себя амбициозные усилия по освоению мультимодального интеллекта в самых больших масштабах. Эра повсеместно полезного и человекоподобного искусственного интеллекта может наступить раньше, чем мы думаем, и Apple намерена сыграть важную роль в ее формировании.

Источник: dzen.ru



		Компания Apple совершила прорыв в области искусственного интеллекта
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2024-03-20 12:35 ИИ теория Исследователи Apple разработали новые методы обучения больших языковых моделей как на тексте, так и на изображениях, что позволяет создавать более мощные и гибкие системы искусственного интеллекта, что может стать значительным шагом вперед для искусственного интеллекта и будущих продуктов Apple. Работа, описанная в исследовательской статье под названием «MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training», которая была опубликована в arxiv.org на этой неделе, демонстрирует, как тщательное сочетание различных типов обучающих данных и архитектур моделей может привести к высочайшей производительности в ряде тестов ИИ. «Мы демонстрируем, что для крупномасштабного мультимодального предварительного обучения использование тщательного сочетания изображений-подписей, чередующихся изображений-текста и текстовых данных имеет решающее значение для достижения современных результатов с несколькими кадрами по нескольким тестам», — объясняют исследователи. Обучая модели на разнообразном наборе данных, охватывающем визуальную и лингвистическую информацию, модели MM1 смогли преуспеть в таких задачах, как подписи к изображениям, визуальные ответы на вопросы и вывод на естественном языке. Масштабирование визуальных компонентов является ключевым фактором Исследователи также обнаружили, что выбор кодировщика изображений и разрешение входных изображений оказали большое влияние на производительность модели. «Мы показываем, что кодировщик изображений вместе с разрешением изображения и количеством маркеров изображений оказывает существенное влияние, в то время как конструкция коннектора языка машинного зрения имеет сравнительно незначительное значение», — сказали они. Это говорит о том, что дальнейшее масштабирование и совершенствование визуальных компонентов этих мультимодальных моделей станет ключом к получению дальнейших преимуществ. Удивительно, но самая большая модель MM1 с 30 миллиардами параметров продемонстрировала сильные способности к контекстному обучению, что позволило ей выполнять многоступенчатые рассуждения на нескольких входных изображениях, используя несколько подсказок «цепочки мыслей». Это указывает на потенциал больших мультимодальных моделей для решения сложных, открытых проблем, требующих обоснованного понимания и генерации языка. Ставка Apple на ИИ на миллиард долларов Исследование MM1 было проведено в то время, когда Apple наращивает свои инвестиции в искусственный интеллект в попытке догнать таких конкурентов, как Google, Microsoft и Amazon, которые вырвались вперед в интеграции возможностей генеративного искусственного интеллекта в свои продукты. Согласно недавнему отчету Bloomberg, компания планирует тратить $1 млрд в год на разработку искусственного интеллекта. Источники сообщают, что Apple работает над большой языковой моделью под названием «Ajax», а также над чат-ботом, известным как «Apple GPT». Цель состоит в том, чтобы интегрировать эти технологии в Siri, Сообщения, Apple Music и другие приложения и сервисы. Например, ИИ можно использовать для автоматического создания персонализированных списков воспроизведения, помощи разработчикам в написании кода или участия в открытых беседах и выполнении задач. Мы рассматриваем искусственный интеллект и машинное обучение как фундаментальные технологии, и они являются неотъемлемой частью практически каждого продукта, который мы поставляем», — сказал генеральный директор Apple Тим Кук во время недавней телефонной конференции. «Я не собираюсь вдаваться в подробности о том, что это такое, потому что, как вы знаете, мы этого не делаем. Но вы можете поспорить, что мы инвестируем, мы инвестируем довольно много, мы собираемся делать это ответственно, и вы увидите прогресс продукта с течением времени, когда эти технологии лежат в их основе». Высокие ставки в гонке вооружений ИИ У Apple есть история быстрого следования, а не первопроходца, когда дело доходит до крупных технологических сдвигов. Но поскольку искусственный интеллект готов трансформировать каждый аспект цифрового ландшафта, ставки для производителя iPhone высоки, чтобы оставаться конкурентоспособным. Исследование MM1 показывает, что у Apple есть талант и ресурсы для достижения передовых результатов. Но еще предстоит увидеть, сможет ли компания, известная своей скрытностью, действовать достаточно быстро, чтобы идти в ногу с обостряющейся гонкой вооружений ИИ. В июне многие будут прикованы к Всемирной конференции разработчиков Apple, на которой, как ожидается, компания представит новые функции и инструменты для разработчиков на основе искусственного интеллекта. В то же время, небольшие достижения в области искусственного интеллекта, такие как инструмент анимации Keyframer, и улучшения производительности, разработанные исследовательскими лабораториями Apple, показывают, что за кулисами достигнут устойчивый прогресс. Как недавно намекнул Кук во время телефонного разговора о доходах за первый квартал: «Мы рады поделиться подробностями нашей текущей работы в области искусственного интеллекта в конце этого года». Теперь ясно, что эта работа включает в себя амбициозные усилия по освоению мультимодального интеллекта в самых больших масштабах. Эра повсеместно полезного и человекоподобного искусственного интеллекта может наступить раньше, чем мы думаем, и Apple намерена сыграть важную роль в ее формировании. Источник: dzen.ru Комментарии:

Компания Apple совершила прорыв в области искусственного интеллекта

Комментарии: