Что такое Gemini? Все, что вам нужно знать об инструменте искусственного интеллекта Google

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Gemini — бесплатный чат-бот, поисковый компаньон и многое другое.

С тех пор, как ChatGPT произвел фурор, технологические компании начали наперегонки выпускать свои конкуренты в области искусственного интеллекта, а Google усилила свою игру в области искусственного интеллекта с помощью Gemini .

Эта модель нового поколения, запущенная в декабре 2023 года компанией Google DeepMind, интегрирована в ряд продуктов Google, включая Google Search и Workspace, а также в телефоны Pixel, что делает эти инструменты более интеллектуальными, отзывчивыми и интуитивно понятными.

Так что же такое Gemini? Это большая языковая модель , разработанная для понимания и генерации текста, очень похожего на то, что может написать человек. Она была разработана для интеграции передового ИИ в повседневное взаимодействие с пользователем и сложные корпоративные решения, и вы можете взаимодействовать с LLM от Google через чат-бот Gemini в Интернете или через мобильное приложение.

Gemini имеет четыре модели: Ultra, Pro, Flash и Nano, каждая из которых предназначена для разных вариантов использования. Одной из новых выдающихся особенностей является расширенное окно контекста токена, которое позволяет получать более расширенные и последовательные ответы. Gemini 1.5 Flash теперь предлагает окно токенов в 1 миллион, тогда как модель 1.5 Pro увеличивает его до колоссальных 2 миллионов. Для сравнения, ChatGPT ограничивается 32 000 токенов в расширенной версии.

Если вы еще не прониклись симпатией ко всему, что связано с ИИ , и все это звучит запутанно, продолжайте читать.

Общая терминология ИИ: LLM, генеративный ИИ, чат-боты, токены

По мере развития технологий возникает новая терминология искусственного интеллекта . Прежде чем погрузиться глубже, давайте быстро разберем некоторые ранее упомянутые ключевые термины.

Генеративный ИИ (или ИИ ген) относится к системам ИИ, которые могут создавать контент — думать текстом, изображениями или даже музыкой — на основе данных, на которых они были обучены. LLM, такие как Gemini, являются типом генеративного ИИ. Они обучаются на огромных наборах данных текста и кода, а затем используют эти знания для понимания и создания текста, похожего на человеческий.

Вероятно, вы уже общались с LLM, будь то через онлайн-чат-бот службы поддержки клиентов или даже ChatGPT.

Тег значка AI Atlas art

Эти чат-боты используют LLM для участия в разговорах в реальном времени, предоставления вам информации и решения проблем — хотя иногда они не попадают в цель и дают странные ответы. Это называется галлюцинациями ИИ . И у Google было с ними немало неудач . Но об этом позже.

Токены — это строительные блоки текста, которые модели ИИ используют для обработки языка. Когда ИИ читает и генерирует текст, он разбивает все на небольшие фрагменты, называемые токенами. Это могут быть целые слова, части слов или даже знаки препинания. Например, в предложении «Hello, world!» ИИ может рассматривать «Hello» и «,» как отдельные токены.

Поэтому, когда мы говорим об ограничениях токенов (например, вышеупомянутом окне контекста в миллион токенов у Gemini), мы говорим о том, сколько ИИ может «запомнить» из разговора, чтобы поддерживать его связность и релевантность.

Следует помнить следующее: как и любая новая технология, Gemini все еще находится в стадии разработки, а искусственный интеллект продолжает совершенствоваться практически ежедневно.

Gemini на телефонах Pixel и поиске Google

Итак, как Gemini работает на устройствах, которые вы используете каждый день? Для начала, он встроен прямо в телефоны Pixel от Google , усиливая многие функции искусственного интеллекта в этих телефонах.

Вы, вероятно, использовали свой Pixel для расшифровки голосового сообщения или генерации быстрого ответа по электронной почте. Это Gemini творит свою магию в фоновом режиме. По сути, он помогает Pixel делать вещи быстрее и более интуитивно.

Gemini также играет большую роль в обзорах ИИ в поиске Google. Если вы заметили, что в верхней части ваших поисков появляются более подробные, контекстно-богатые ответы, то это из-за этой интеграции. Gemini помогает разбить сложные темы на краткие объяснения в результатах поиска.

Google подвергся критике за некоторые советы, которые AI Overviews выдал пользователям при запуске, включая такие, как ежедневное употребление камней и добавление клея в рецепты пиццы. Google отреагировал быстро и с тех пор доработал свой инструмент.

Все пользователи в США в возрасте от 13 лет и старше, которые управляют своими собственными учетными записями Google, могут получить доступ к AI Overviews. В других странах, таких как Великобритания, Индия, Мексика, Бразилия, Индонезия и Япония, пользователи в возрасте от 18 лет и старше также могут получить доступ к этой функции. Google планирует продолжать расширять ее по всему миру, с целью охватить более миллиарда пользователей к концу 2024 года.

Теперь некоторым людям не нравится эта функция, а недостатком является то, что вы не можете отключить обзоры AI. Однако мы рассмотрели несколько обходных путей, которые могут помочь с этим.

Исправление печально известного провала в создании изображений с помощью новых запусков

Когда Gemini только запустился, не потребовалось много времени, чтобы все пошло наперекосяк. Google столкнулся с критикой из-за некоторых галлюцинаций и того, как он изображал исторических личностей и различные расы. Он попал в заголовки, показывая чернокожих и азиатских нацистских солдат, что, как вы можете себе представить, не было хорошо воспринято. Критики обвинили Google в том, что он слишком старается показать разнообразие, но вместо этого он все ухудшил. Google нажал на тормоза в генерации изображений Gemini, пообещав навести порядок.

28 августа, после усовершенствования технологии, Google анонсировала последнюю версию своего инструмента преобразования текста в изображение, Imagen 3 , которая вскоре станет доступна подписчикам Gemini Advanced, Business и Enterprise. Однако возможность создания изображений людей пока не реализована, поскольку на этот раз Google играет наверняка.

Ранее, 13 августа, Google запустил Gemini Live для продвинутых подписчиков на устройствах Android , с планами по скорому расширению на iOS . Gemini Live предлагает разговоры в режиме реального времени без помощи рук с 10 новыми голосовыми опциями, даже когда приложение находится в фоновом режиме или ваш телефон заблокирован. Вы также можете приостанавливать и возобновлять разговоры, когда захотите, что является удобной функцией.

Цены и доступ

Gemini бесплатен как персональный помощник AI, предлагающий доступ к модели 1.5 Flash с контекстным окном в 32 000 токенов — идеально подходит для длительных разговоров. Но для более продвинутых функций Gemini предлагает несколько планов подписки:

Gemini Advanced с моделью 1.5 Pro : 20 долларов в месяц.

Gemini Business : 20 долларов США за пользователя в месяц при годовом плане или 24 доллара США при ежемесячной оплате.

Gemini Enterprise : 30 долларов США за пользователя в месяц по годовому плану, индивидуальные цены согласовываются с отделом продаж Google.

Для разработчиков и предприятий Google создала многоуровневую структуру ценообразования для своих моделей API Gemini, таких как Flash и Pro. Разработчики могут получить к ним доступ через службы API Google Cloud и интегрировать возможности ИИ непосредственно в приложения.

Обе модели предлагают масштабируемое использование ИИ, с ценами и ограничениями скорости, зависящими от уровня и длины токена. Вы можете проверить подробные расценки на официальном сайте Google . Также есть бесплатный уровень, дающий вам возможность попробовать ограниченное использование — отлично подходит для тестирования перед погружением. Барбара Пазур


Источник: vk.com

Комментарии: