В TensorFlow появилась функция преобразования датасетов в формат tf.data

МЕНЮ

Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ

Новости ИИ

Голосовой помощник
Городские сумасшедшие
ИИ в медицине
ИИ проекты
Искусственные нейросети
Искусственный интеллект
Слежка за людьми
Угроза ИИ

Разработка ИИ

Атаки на ИИ
ИИ теория
Компьютерные науки
Машинное обуч. (Ошибки)
Машинное обучение
Машинный перевод
Нейронные сети начинающим
Психология ИИ
Реализация ИИ
Реализация нейросетей
Создание беспилотных авто
Трезво про ИИ
Философия ИИ

Внедрение ИИ

Big data
Генетические алгоритмы
Капсульные нейросети
Основы нейронных сетей
Промпты. Генеративные запросы
Распознавание лиц
Распознавание образов
Распознавание речи
Творчество ИИ
Техническое зрение
Чат-боты

Работа разума и сознание

Изучение сна
Изучение сознания
Нейроинтерфейс
Психология
Работа мозга
Работа памяти
Работа разума

Модель мозга

Модель мозга

Робототехника, БПЛА

Беспилотные автомобили
БПЛА
Робототехника

Трансгуманизм

Трансгуманизм

Обработка текста

Анализ социальных сетей
Компьютерная лингвистика
Лингвистика
Поисковые алгоритмы

Теория эволюции

Головной мозг
Нейронные сети
Поведение животных
Теория эволюции

Дополненная реальность

Виртулаьная реальность
Дополненная реальность

Железо

Интернет вещей
Квантовый компьютер
Нейронные процессоры
облачные вычисления
Суперкомпьютеры

Киберугрозы

Кибербезопасность

Научный мир

Методы исследования
Наука и образование
Семинары

ИТ индустрия

ИТ-гиганты
Новости ит

Разработка ПО

Разработка ПО
Теория алгоритмов

Теория информации

Кластеризация

Математика

Актуальная математика
Статистика
Теория вероятности
Теория информации
Теория хаоса

Цифровая экономика

Технология блокчейн
Цифровая экономика

Авторизация

RSS

RSS новости

2019-02-28 16:30

алгоритмы машинного обучения, большие данные big data

Разработчики Google представили функцию TensorFlow Datasets для преобразования любых общедоступных наборов данных в формат tf.data. Открытые наборы данных для обучения моделей распространяются и хранятся в разных форматах. Написание скриптов для загрузки и обработки каждого набора данных требует времени.

Tensorflow Datasets преобразует наборы данных из интернета в подготовленный формат, выполняя всю работу по извлечению исходных и предварительной обработке данных. Он представляет датасеты в формате tf.data.Datasets и массивов NumPy и использует tf.data API для создания высокопроизводительных пайплайнов, которые подготовлены к работе с TensorFlow 2.0 и могут работать с tf.keras моделями.

Попробуйте сами (датасет MNIST):

tfds.load и DatasetBuilder

Для каждого набора данных TFDS реализует подкласс DatasetBuilder, который определяет откуда поступают данные (их URL), что представляет собой набор данных (его особенности), как данные должны быть разделены (например, на выборки TRAIN и TEST).

Сейчас в TFDS доступны 29 датасетов, включая популярные MNIST, Street View House Numbers, 1 Billion Word Language Model, Large Movie Reviews Dataset. В дальнейшем будут добавлены новые.

Можно самостоятельно добавить датасет здесь. Пока что TensorFlow ограничивает возможность добавления датасетов, обработка которых занимает больше одного дня. В ближайшее время это будет реализовано с помощью Apache Beam.

Телеграм: t.me/ainewsline

Источник: neurohive.io



		В TensorFlow появилась функция преобразования датасетов в формат tf.data
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-02-28 16:30 алгоритмы машинного обучения, большие данные big data Разработчики Google представили функцию TensorFlow Datasets для преобразования любых общедоступных наборов данных в формат tf.data. Открытые наборы данных для обучения моделей распространяются и хранятся в разных форматах. Написание скриптов для загрузки и обработки каждого набора данных требует времени. Tensorflow Datasets преобразует наборы данных из интернета в подготовленный формат, выполняя всю работу по извлечению исходных и предварительной обработке данных. Он представляет датасеты в формате tf.data.Datasets и массивов NumPy и использует tf.data API для создания высокопроизводительных пайплайнов, которые подготовлены к работе с TensorFlow 2.0 и могут работать с tf.keras моделями. Попробуйте сами (датасет MNIST): tfds.load и DatasetBuilder Для каждого набора данных TFDS реализует подкласс DatasetBuilder, который определяет откуда поступают данные (их URL), что представляет собой набор данных (его особенности), как данные должны быть разделены (например, на выборки TRAIN и TEST). Сейчас в TFDS доступны 29 датасетов, включая популярные MNIST, Street View House Numbers, 1 Billion Word Language Model, Large Movie Reviews Dataset. В дальнейшем будут добавлены новые. Можно самостоятельно добавить датасет здесь. Пока что TensorFlow ограничивает возможность добавления датасетов, обработка которых занимает больше одного дня. В ближайшее время это будет реализовано с помощью Apache Beam. Телеграм: t.me/ainewsline Источник: neurohive.io Комментарии:

В TensorFlow появилась функция преобразования датасетов в формат tf.data

Комментарии: