Октябрьский нейродайджест

2025-10-31 19:20

На Хэллоуин не только коты в шляпах творят магию.

Я тоже немного поколдовал — и собрал октябрьскую подборку свежих нейроновинок.

Новые модели, браузеры, инструменты для видео, звука и даже образования — всё, на что стоит обратить внимание внимания.

Изображения

1. Seedream 4.0 — это нейросеть для генерации изображений, как Midjourney или DALL·E, но с уклоном в суперреализм и детализацию. Теперь она доступна прямо в DreaminaAI — не нужно API, можно тестить в пару кликов. Главные фишки: картинки в 4К, резкие и сочные, поддержка до 6 референсов (можно задавать стиль или объекты). Стала стабильнее и быстрее

https://dreamina.capcut.com/ai-tool/generate

2. CapCut запустил AI Design — новый инструмент для дизайнеров и маркетологов. Теперь можно создавать постеры, баннеры, логотипы и открытки по текстовому описанию или из загруженного изображения. Инструмент умеет подстраивать дизайн под формат соцсетей, менять фон, адаптировать сцены и даже работать с товарами для e-commerce. Доступен в веб-версии и настольном приложении CapCut. Есть бесплатный доступ.

https://www.capcut.com/tools/desktop-video-editor

Аудио

1. Hume AI представила Octave 2 — многоязычную модель преобразования текста в речь нового поколения. Она поддерживает 11 языков (включая русский), работает на 40 % быстрее и на 50 % дешевле предыдущей версии. Теперь возможен разговор с несколькими спикерами, более точное произношение, а также редактирование фонем и преобразование голоса.

https://demo.hume.ai

2. ElevenLabs запустила Agent Workflows — инструмент для создания голосовых ботов в виде визуальных схем.

Теперь можно делить разговор на этапы, где за каждый отвечает свой мини-агент со своими инструкциями и знаниями.

Боты звучат естественно, не путаются и при необходимости передают разговор человеку.

https://elevenlabs.io/app/sign-in?redirect=/app/agents

3. Udio — это ИИ-сервис для генерации музыки с вокалом и инструменталом. Теперь добавили две функции: смешивание голосов из разных треков и Udio Playground — конструктор музыки из блоков «голос + стиль». Тестировать можно на udio.com

4. Suno выпустила бесплатную модель v4.5- all для генерации музыки. Она звучит заметно живее прошлых версий — вокал стал естественнее, а композиции богаче и сложнее. Пользователям доступно 50 кредитов в день — этого хватает примерно на 10 треков.

https://suno.com/home

5.Fish Audio представила S1 — новую модель для ультрареалистичного клонирования голоса и генерации речи. Она создаёт естественное звучание с живой интонацией и может озвучивать текст в реальном времени с задержкой менее 500 мс. Клонирование голоса занимает всего несколько секунд, а стоимость — в шесть раз ниже ElevenLabs.

https://fish.audio/ru/voice-clone

Видео

1. Luma Labs представила Ray3 — новую видеомодель, которая удерживает детали даже в самых сложных сценах.Теперь она справляется с толпами на улицах и стадионах, сохраняя четкость и реализм каждого объекта в движении. Тонкие текстуры, узоры и микродействия остаются стабильными, а сцены выглядят живыми и естественными даже при динамичной анимации.

https://lumalabs.ai/dream-machine

2. DecartAI запустила Decart XR — мультимодальную платформу, которая объединяет мышление ИИ с трёхмерным восприятием.Теперь ИИ-агенты могут видеть, перемещаться и взаимодействовать в виртуальных мирах в реальном времени.Платформа поддерживает интеграцию с LLM-моделями и открыта для разработчиков — можно создавать собственные интеллектуальные 3D-сцены и VR-среды.

https://vr.decart.ai/

3. Pika представила Predictive Video — новую функцию, которая превращает короткую идею в полноценный видеоролик.

Достаточно написать пару слов вроде «я выступаю на TED Talk» — и модель сама добавит сценарий, музыку, свет, движения и ракурсы камеры. Видео создаётся за минуту без сложных промптов.

https://pika.me

4. OpenAI выпустила подробное руководство по работе с Sora 2 — генератором реалистичных видео нового поколения. В гайде объясняется, как правильно строить промпт: описывать кадр, движение, освещение и цветовую палитру, а также формулировать действия без двусмысленностей. Есть советы по композиции, диалогам и звуку — всё, чтобы видео выглядело живым и выразительным.

https://cookbook.openai.com/examples/sora/sora2_prompting_guide#prompt-anatomy-that-works

5. Google официально представила Veo 3.1 — обновлённую модель для генерации видео. Теперь можно создавать ролики до 60 секунд в 1080p, с реалистичным звуком и поддержкой русской речи. Добавлены ключевые кадры, референсы, улучшено понимание промптов и сохранение персонажей между сценами — видео стали плавнее, детальнее и ближе к кинематографическому качеству.

https://labs.google/fx/ru/tools/flow

6. Grok Imagine получил обновление — теперь можно повышать качество видео до HD прямо в браузере. Функция работает за считанные секунды: достаточно выделить три точки и запустить масштабирование.

https://grok.com/imagine

7. MiniMax представила Hailuo 2.3 и Hailuo 2.3 Fast — новые версии своей видеомодели. Режим Fast ускоряет рендеринг, сохраняя четкость движения и детализацию, а обновлённая система освещения и камера делают сцены более реалистичными.Модель также улучшила передачу микровыражений и согласованность кадров, а пользователи Free теперь могут создавать до 4 видео в день.

https://hailuoai.video

8. OpenAI представила в Sora 2 функцию — Character Cameos. Теперь пользователи могут создавать персонажей, похожих на реальных людей, и использовать их в разных видео, сохраняя внешний вид и поведение между сценами. Функция позволяет органично вводить героев в новые сюжеты и расширяет творческие возможности Sora. Кроме того, вход в приложение теперь открыт без инвайта для пользователей из США, Канады, Японии и Кореи.

http://sora.com/

Тексты

1. OpenAI запустила AgentKit — визуальный конструктор для создания ИИ-агентов без кода. Теперь можно собирать умных помощников, соединяя действия, данные и инструменты как в блок-схеме. В составе:

— Agent Builder — интерфейс для проектирования логики агента;

— ChatKit — добавляет чат-интерфейс;

— Connector Registry — подключение API и баз данных;

— Evals и Guardrails — тестирование и защита от ошибок;

— RFT — обучает агента рассуждать и действовать осознанно.

Также в ChatGPT появились встроенные приложения — Canva, Figma, Booking, Spotify и другие. Работать с ними теперь можно прямо внутри чата, без перехода на сайты. Доступ разворачивается постепенно.

https://platform.openai.com/agent-builder

2. Claude Haiku 4.5 — новая компактная нейросеть от Anthropic, предназначенная для быстрого анализа текста, кода и данных. Она ориентирована на задачи программирования, обработки информации и поддержки рабочих процессов, где важны скорость и эффективность. Модель работает в два раза быстрее и в три раза дешевле, чем Claude Sonnet 4, сохраняя тот же уровень качества и точности.

https://claude.ai

Другое

1. Perplexity Comet — ИИ-браузер, который объединяет поиск, чат и справочную систему в одном окне. Теперь доступен каждому — без инвайтов и ожиданий. Достаточно скачать по ссылке (https://www.perplexity.ai/comet/), но для полного функционала понадобится Pro-аккаунт.

2. Dia — новый ИИ-браузер от создателей Arc. В нём встроен умный ассистент, который понимает контекст: анализирует открытые вкладки, историю и даже сайты, где вы авторизованы. Интерфейс напоминает Chrome или Safari, но с дополнительными «навыками» — можно по команде перевести текст, сделать краткое резюме страницы, отредактировать материал или открыть нужные вкладки разом. Пока доступен только на macOS, версия для Windows появится позже.

https://www.diabrowser.com

3. Google представила Learn Your Way — ИИ-платформу, которая превращает учебники в интерактивные материалы с объяснениями и визуальными резюме.Работает на базе Gemini и LearnLM, подстраиваясь под темп ученика, и уже показала +11 % к усвоению знаний.

https://learnyourway.withgoogle.com/

4. OpenAI выпустила ChatGPT Atlas — новый браузер с встроенным ИИ-ассистентом. Он умеет искать, анализировать и резюмировать информацию прямо во время серфинга, а также выполнять задачи по запросу пользователя. Atlas построен на Chromium, имеет боковую панель ChatGPT, режим агента и систему памяти с контролем данных. Пока доступен для macOS, версии для Windows и мобильных платформ появятся позже.

https://chatgpt.com/atlas

Если такой формат полезен и хочется видеть дайджесты каждый месяц — ? этот пост. И сохраняйте подборку.

AI locus | ChatGPT | MidJourney

Телеграм: t.me/ainewsline

Источник: chatgpt.com



		Октябрьский нейродайджест
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2025-10-31 19:20 ИИ проекты На Хэллоуин не только коты в шляпах творят магию. Я тоже немного поколдовал — и собрал октябрьскую подборку свежих нейроновинок. Новые модели, браузеры, инструменты для видео, звука и даже образования — всё, на что стоит обратить внимание внимания. Изображения 1. Seedream 4.0 — это нейросеть для генерации изображений, как Midjourney или DALL·E, но с уклоном в суперреализм и детализацию. Теперь она доступна прямо в DreaminaAI — не нужно API, можно тестить в пару кликов. Главные фишки: картинки в 4К, резкие и сочные, поддержка до 6 референсов (можно задавать стиль или объекты). Стала стабильнее и быстрее https://dreamina.capcut.com/ai-tool/generate 2. CapCut запустил AI Design — новый инструмент для дизайнеров и маркетологов. Теперь можно создавать постеры, баннеры, логотипы и открытки по текстовому описанию или из загруженного изображения. Инструмент умеет подстраивать дизайн под формат соцсетей, менять фон, адаптировать сцены и даже работать с товарами для e-commerce. Доступен в веб-версии и настольном приложении CapCut. Есть бесплатный доступ. https://www.capcut.com/tools/desktop-video-editor Аудио 1. Hume AI представила Octave 2 — многоязычную модель преобразования текста в речь нового поколения. Она поддерживает 11 языков (включая русский), работает на 40 % быстрее и на 50 % дешевле предыдущей версии. Теперь возможен разговор с несколькими спикерами, более точное произношение, а также редактирование фонем и преобразование голоса. https://demo.hume.ai 2. ElevenLabs запустила Agent Workflows — инструмент для создания голосовых ботов в виде визуальных схем. Теперь можно делить разговор на этапы, где за каждый отвечает свой мини-агент со своими инструкциями и знаниями. Боты звучат естественно, не путаются и при необходимости передают разговор человеку. https://elevenlabs.io/app/sign-in?redirect=/app/agents 3. Udio — это ИИ-сервис для генерации музыки с вокалом и инструменталом. Теперь добавили две функции: смешивание голосов из разных треков и Udio Playground — конструктор музыки из блоков «голос + стиль». Тестировать можно на udio.com 4. Suno выпустила бесплатную модель v4.5- all для генерации музыки. Она звучит заметно живее прошлых версий — вокал стал естественнее, а композиции богаче и сложнее. Пользователям доступно 50 кредитов в день — этого хватает примерно на 10 треков. https://suno.com/home 5.Fish Audio представила S1 — новую модель для ультрареалистичного клонирования голоса и генерации речи. Она создаёт естественное звучание с живой интонацией и может озвучивать текст в реальном времени с задержкой менее 500 мс. Клонирование голоса занимает всего несколько секунд, а стоимость — в шесть раз ниже ElevenLabs. https://fish.audio/ru/voice-clone Видео 1. Luma Labs представила Ray3 — новую видеомодель, которая удерживает детали даже в самых сложных сценах.Теперь она справляется с толпами на улицах и стадионах, сохраняя четкость и реализм каждого объекта в движении. Тонкие текстуры, узоры и микродействия остаются стабильными, а сцены выглядят живыми и естественными даже при динамичной анимации. https://lumalabs.ai/dream-machine 2. DecartAI запустила Decart XR — мультимодальную платформу, которая объединяет мышление ИИ с трёхмерным восприятием.Теперь ИИ-агенты могут видеть, перемещаться и взаимодействовать в виртуальных мирах в реальном времени.Платформа поддерживает интеграцию с LLM-моделями и открыта для разработчиков — можно создавать собственные интеллектуальные 3D-сцены и VR-среды. https://vr.decart.ai/ 3. Pika представила Predictive Video — новую функцию, которая превращает короткую идею в полноценный видеоролик. Достаточно написать пару слов вроде «я выступаю на TED Talk» — и модель сама добавит сценарий, музыку, свет, движения и ракурсы камеры. Видео создаётся за минуту без сложных промптов. https://pika.me 4. OpenAI выпустила подробное руководство по работе с Sora 2 — генератором реалистичных видео нового поколения. В гайде объясняется, как правильно строить промпт: описывать кадр, движение, освещение и цветовую палитру, а также формулировать действия без двусмысленностей. Есть советы по композиции, диалогам и звуку — всё, чтобы видео выглядело живым и выразительным. https://cookbook.openai.com/examples/sora/sora2_prompting_guide#prompt-anatomy-that-works 5. Google официально представила Veo 3.1 — обновлённую модель для генерации видео. Теперь можно создавать ролики до 60 секунд в 1080p, с реалистичным звуком и поддержкой русской речи. Добавлены ключевые кадры, референсы, улучшено понимание промптов и сохранение персонажей между сценами — видео стали плавнее, детальнее и ближе к кинематографическому качеству. https://labs.google/fx/ru/tools/flow 6. Grok Imagine получил обновление — теперь можно повышать качество видео до HD прямо в браузере. Функция работает за считанные секунды: достаточно выделить три точки и запустить масштабирование. https://grok.com/imagine 7. MiniMax представила Hailuo 2.3 и Hailuo 2.3 Fast — новые версии своей видеомодели. Режим Fast ускоряет рендеринг, сохраняя четкость движения и детализацию, а обновлённая система освещения и камера делают сцены более реалистичными.Модель также улучшила передачу микровыражений и согласованность кадров, а пользователи Free теперь могут создавать до 4 видео в день. https://hailuoai.video 8. OpenAI представила в Sora 2 функцию — Character Cameos. Теперь пользователи могут создавать персонажей, похожих на реальных людей, и использовать их в разных видео, сохраняя внешний вид и поведение между сценами. Функция позволяет органично вводить героев в новые сюжеты и расширяет творческие возможности Sora. Кроме того, вход в приложение теперь открыт без инвайта для пользователей из США, Канады, Японии и Кореи. http://sora.com/ Тексты 1. OpenAI запустила AgentKit — визуальный конструктор для создания ИИ-агентов без кода. Теперь можно собирать умных помощников, соединяя действия, данные и инструменты как в блок-схеме. В составе: — Agent Builder — интерфейс для проектирования логики агента; — ChatKit — добавляет чат-интерфейс; — Connector Registry — подключение API и баз данных; — Evals и Guardrails — тестирование и защита от ошибок; — RFT — обучает агента рассуждать и действовать осознанно. Также в ChatGPT появились встроенные приложения — Canva, Figma, Booking, Spotify и другие. Работать с ними теперь можно прямо внутри чата, без перехода на сайты. Доступ разворачивается постепенно. https://platform.openai.com/agent-builder 2. Claude Haiku 4.5 — новая компактная нейросеть от Anthropic, предназначенная для быстрого анализа текста, кода и данных. Она ориентирована на задачи программирования, обработки информации и поддержки рабочих процессов, где важны скорость и эффективность. Модель работает в два раза быстрее и в три раза дешевле, чем Claude Sonnet 4, сохраняя тот же уровень качества и точности. https://claude.ai Другое 1. Perplexity Comet — ИИ-браузер, который объединяет поиск, чат и справочную систему в одном окне. Теперь доступен каждому — без инвайтов и ожиданий. Достаточно скачать по ссылке (https://www.perplexity.ai/comet/), но для полного функционала понадобится Pro-аккаунт. 2. Dia — новый ИИ-браузер от создателей Arc. В нём встроен умный ассистент, который понимает контекст: анализирует открытые вкладки, историю и даже сайты, где вы авторизованы. Интерфейс напоминает Chrome или Safari, но с дополнительными «навыками» — можно по команде перевести текст, сделать краткое резюме страницы, отредактировать материал или открыть нужные вкладки разом. Пока доступен только на macOS, версия для Windows появится позже. https://www.diabrowser.com 3. Google представила Learn Your Way — ИИ-платформу, которая превращает учебники в интерактивные материалы с объяснениями и визуальными резюме.Работает на базе Gemini и LearnLM, подстраиваясь под темп ученика, и уже показала +11 % к усвоению знаний. https://learnyourway.withgoogle.com/ 4. OpenAI выпустила ChatGPT Atlas — новый браузер с встроенным ИИ-ассистентом. Он умеет искать, анализировать и резюмировать информацию прямо во время серфинга, а также выполнять задачи по запросу пользователя. Atlas построен на Chromium, имеет боковую панель ChatGPT, режим агента и систему памяти с контролем данных. Пока доступен для macOS, версии для Windows и мобильных платформ появятся позже. https://chatgpt.com/atlas Если такой формат полезен и хочется видеть дайджесты каждый месяц — ? этот пост. И сохраняйте подборку. AI locus \| ChatGPT \| MidJourney Телеграм: t.me/ainewsline Источник: chatgpt.com Комментарии:

Октябрьский нейродайджест

Комментарии: