Mozilla опубликовала крупнейший набор данных голосов на 18 языках

МЕНЮ

Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ

Новости ИИ

Голосовой помощник
Городские сумасшедшие
ИИ в медицине
ИИ проекты
Искусственные нейросети
Искусственный интеллект
Слежка за людьми
Угроза ИИ

Разработка ИИ

Атаки на ИИ
ИИ теория
Компьютерные науки
Машинное обуч. (Ошибки)
Машинное обучение
Машинный перевод
Нейронные сети начинающим
Психология ИИ
Реализация ИИ
Реализация нейросетей
Создание беспилотных авто
Трезво про ИИ
Философия ИИ

Внедрение ИИ

Big data
Генетические алгоритмы
Капсульные нейросети
Основы нейронных сетей
Промпты. Генеративные запросы
Распознавание лиц
Распознавание образов
Распознавание речи
Творчество ИИ
Техническое зрение
Чат-боты

Работа разума и сознание

Изучение сна
Изучение сознания
Нейроинтерфейс
Психология
Работа мозга
Работа памяти
Работа разума

Модель мозга

Модель мозга

Робототехника, БПЛА

Беспилотные автомобили
БПЛА
Робототехника

Трансгуманизм

Трансгуманизм

Обработка текста

Анализ социальных сетей
Компьютерная лингвистика
Лингвистика
Поисковые алгоритмы

Теория эволюции

Головной мозг
Нейронные сети
Поведение животных
Теория эволюции

Дополненная реальность

Виртулаьная реальность
Дополненная реальность

Железо

Интернет вещей
Квантовый компьютер
Нейронные процессоры
облачные вычисления
Суперкомпьютеры

Киберугрозы

Кибербезопасность

Научный мир

Методы исследования
Наука и образование
Семинары

ИТ индустрия

ИТ-гиганты
Новости ит

Разработка ПО

Разработка ПО
Теория алгоритмов

Теория информации

Кластеризация

Математика

Актуальная математика
Статистика
Теория вероятности
Теория информации
Теория хаоса

Цифровая экономика

Технология блокчейн
Цифровая экономика

Авторизация

RSS

RSS новости

2019-03-01 18:00

алгоритмы распознавания речи, распознавание образов

Mozilla опубликовала открытый датасет Common Voice, который содержит 1400 часов записей человеческой речи на 18 языках, включая английский, французский, немецкий и редкие языки — валлийский, кабильский и другие. Это самый большой доступный мультиязычный набор голосовых данных. Русский язык пока не представлен, но в дальнейшем разработчики собираются расширять датасет.

Компания использует уже использует часть записей из набора данных для разработки собственных голосовых продуктов. Механизм распознавания речи DeepSpeech, обучаясь на данных Common Voice, транскрибирует лекции, телефонные разговоры, и телевизионные программы почти с человеческой точностью в реальном времени. Mozilla утверждает, что конечная цель заключается в том, чтобы предоставить открытые обучающие данные высокого качества разработчикам голосовых сервисов и приложений и улучшить технологии для распознавания разных языков и акцентов.

Датасет Common Voice

Предыдущая версия Common Voice содержала 500 часов записей от 20 000 добровольцев только на английском языке. Новая содержит 1400 часов записей человеческой речи на 18 языках. Набор данных Common Voice дополняет движок распознавания голоса с открытым исходным кодом Mozilla Deep Speech.

Каждая запись в наборе данных состоит из MP3-файла и соответствующего текстового файла. К большей части записей доступны демографические метаданные — возраст, пол и акцент. Они могут помочь в точном обучении моделей распознавания речи.

Можно принять участие в расширении датасета, отправив свой голос через сайт или приложение. Mozilla нацелена создать открытый набор данных с записями на 70 языках. Подробная информация о проекте Common Voice и датасете доступна в блоге разработчиков. Загрузить датасет можно здесь.

Телеграм: t.me/ainewsline

Источник: neurohive.io



		Mozilla опубликовала крупнейший набор данных голосов на 18 языках
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-03-01 18:00 алгоритмы распознавания речи, распознавание образов Mozilla опубликовала открытый датасет Common Voice, который содержит 1400 часов записей человеческой речи на 18 языках, включая английский, французский, немецкий и редкие языки — валлийский, кабильский и другие. Это самый большой доступный мультиязычный набор голосовых данных. Русский язык пока не представлен, но в дальнейшем разработчики собираются расширять датасет. Компания использует уже использует часть записей из набора данных для разработки собственных голосовых продуктов. Механизм распознавания речи DeepSpeech, обучаясь на данных Common Voice, транскрибирует лекции, телефонные разговоры, и телевизионные программы почти с человеческой точностью в реальном времени. Mozilla утверждает, что конечная цель заключается в том, чтобы предоставить открытые обучающие данные высокого качества разработчикам голосовых сервисов и приложений и улучшить технологии для распознавания разных языков и акцентов. Датасет Common Voice Предыдущая версия Common Voice содержала 500 часов записей от 20 000 добровольцев только на английском языке. Новая содержит 1400 часов записей человеческой речи на 18 языках. Набор данных Common Voice дополняет движок распознавания голоса с открытым исходным кодом Mozilla Deep Speech. Каждая запись в наборе данных состоит из MP3-файла и соответствующего текстового файла. К большей части записей доступны демографические метаданные — возраст, пол и акцент. Они могут помочь в точном обучении моделей распознавания речи. Можно принять участие в расширении датасета, отправив свой голос через сайт или приложение. Mozilla нацелена создать открытый набор данных с записями на 70 языках. Подробная информация о проекте Common Voice и датасете доступна в блоге разработчиков. Загрузить датасет можно здесь. Телеграм: t.me/ainewsline Источник: neurohive.io Комментарии:

Mozilla опубликовала крупнейший набор данных голосов на 18 языках

Комментарии: