Кластеризация

МЕНЮ


Искусственный интеллект. Новости
Поиск
Регистрация на сайте
Сбор средств на аренду сервера для ai-news

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематика

Авторизация




RSS


RSS новости

Новостная лента форума ailab.ru
 

2018-07-30 14:35

Кластеризация: алгоритмы k-means и c-means


методы кластеризации

Как и обещал, продолжаю серию публикаций о технологии Data Mining. Сегодня хочу рассказать о двух алгоритмах кластеризации (k-means и c-means), описать преимущества и недостатки, дать некоторые рекомендации по их использованию. Итак, поехали…

Кластеризация — это разделение множества входных векторов на группы (кластеры) по степени «схожес

2018-06-09 09:02

Классификация ученых


алгоритмы кластеризации

По данным ЮНЕСКО количество ученых во всем мире в 2013 году составило 7,8 миллионов человек. То есть 0,1% всей человеческой популяции профессионально занимается наукой. Финансирование исследований значительной доли этих людей зачастую регулируется чиновниками, далекими от науки. И в этом вопросе научно обоснованная систематизация ученых была б

2018-06-05 11:30

Как машины анализируют большие данные: введение в алгоритмы кластеризации


большие данные big data, кластеризация данных

Перевод How Machines Make Sense of Big Data: an Introduction to Clustering Algorithms.

Взгляните на картинку ниже. Это коллекция насекомых (улитки не насекомые, но не будем придираться) разных форм и размеров. А теперь разделите их на несколько групп по степени похожести. Никакого подвоха. Начните с группирования пауков.

Закончил

2018-06-01 14:27

Классификация больших объемов данных на Apache Spark с использованием произвольных моделей машинного обучения


алгоритмы машинного обучения, большие данные big data, кластеризация данных

Часть 2: Решение

И снова здравствуйте! Сегодня я продолжу свой рассказ о том, как мы классифицируем большие объёмы данных на Apache Spark, используя произвольные модели машинного обучения. В первой части статьи мы рассмотрели саму постановку задачи, а также основные проблемы, которые возникают при организации взаимодействия между

2018-05-24 22:00

Обучение без учителя: 4 метода кластеризации данных на Python


методы кластеризации

Описаны четыре популярных метода обучения без учителя для кластеризации данных с соответствующими примерами программного кода на Python.

Обучение без учителя

Обучение без учителя (unsupervised learning, неконтролируемое обучение) – класс методов машинного обучения для поиска шаблонов в наборе данных. Данные, получаемые на вхо

2018-05-21 23:04

Валерий Бабушкин - Поведенческая кластеризация пользователей Яндекс.Советник


методы кластеризации

Валерий Бабушкин - Поведенческая кластеризация пользователей Яндекс.Советник

2018-03-10 19:17

Р.В. Шамин. Лекция № 4 Сети Кохонена в задачах кластеризации экономических данных


алгоритмы кластеризации данных

Курс "Машинное обучение и искусственный интеллект в задачах математической экономики", читаемый в Математическом институте им. В.А. Стеклова РАН: 

2018-02-14 18:06

Автоэнкодер в задачах кластеризации политических событий


алгоритмы машинного обучения, кластеризация данных

Я не люблю читать статьи, смотрю demo и код

Демо TensorBoard Projector

Работает в Chrome. Открываем и нажимаем на Bookmarks в нижнем правом углу. В верхнем правом углу можем фильтровать классы. В конце статьи есть GIF картинки с примерами использования.
Проект на GitHub Отступление от темы

В данной статье, пойдет речь о средствах

2018-01-16 18:52

Алгоритм машинного обучения впервые запущен на квантовом компьютере


новости квантовых компьютеров, алгоритмы кластеризации

Стартап Rigetti Computing впервые запустил на квантовом компьютере алгоритм кластеризации данных. Этот факт доказывает возможность использования нового типа компьютеров в сфере машинного обучения, что в разы сократит время расчетов.

Компания использует гибридную установку: квантовая машина, размещенная в охладителе,

2018-01-08 23:26

Кластеризация и визуализация текстовой информации


методы кластеризации данных

В русскоязычном секторе интернета очень мало учебных практических примеров (а с примером кода ещё меньше) анализа текстовых сообщений на русском языке. Поэтому я решил собрать данные воедино и рассмотреть пример кластеризации, так как не требуется подготовка данных для обучения.

Большинство используемых библиотек уже есть в дистрибутиве An

2017-12-30 17:49

Мультимодальная кластеризация для анализа данных


анализ больших данных, алгоритмы кластеризации

Мультимодальная кластеризация для анализа данных | Конференция: Машинное обучение и анализ алгоритмов | Лектор: Дмитрий Игнатов | Организатор: CSClub

2017-12-08 00:00

AIML-4-4-1 Задача распознавания


методы кластеризации данных, методы распознавания образов

Классификация и распознавание образов

@iamdev

**********************************************

1 Задача распознавания

2 Построение структуры нейронной сети

3 Kernel Trick

4 Задача классификации

5 Применение карты Кохонена для классификации

6 Анализ и визуализация данных с пом

2017-12-07 13:05

Иерархический кластерный анализ на языке программирование Python


алгоритмы кластеризации, теория программирования

Постановка задачи

Классификация — одна из важнейших задач, встречающихся при анализе данных. В зависимости от постановки можно различать следующие задачи: кластеризацию (классификацию в отсутствии обучающей выборки) и, собственно, классификацию (при наличии обучающей выборки),  когда данные необходимо соотнести с уже известными классами.

2017-12-06 18:00

Видеокурс по кластеризации баз данных


алгоритмы кластеризации

В этом видео автор рассказывает о кластеризации базы данных и как управлять кластерами баз данных с помощью ClusterControl.

Кластеризация базы данных - это когда у вас несколько компьютеров, работающих вместе, которые используются для хранения ваших

данных.

Существует четыре основных причины, почему следует учитывать

2017-11-25 15:59

Кластеризация графов и поиск сообществ. Часть 1: введение, обзор инструментов и Волосяные Шары


методы кластеризации, коммуникации в социальных сетях

В нашей работе часто возникает потребность в выделении сообществ (кластеров) разных объектов: пользователей, сайтов, продуктовых страниц интернет-магазинов. Польза от такой информации весьма многогранна – вот лишь несколько областей практического применения качественных кластеров:

Выделение сегментов пользователей для проведения таргетиров

2017-10-29 15:34

Лекция 7. Обучение без учителя. Открытый курс ODS и Mail.ru по машинному обучению


кластеризация данных, алгоритмы машинного обучения

7-ая лекция от OpenDataScience и Mail.ru Group. Рассказывают про метод главных компонент и различные подходы к задаче кластеризации.

2017-10-26 11:44

Нестандартная кластеризация 5: Growing Neural Gas


алгоритмы кластеризации данных

Часть первая — Affinity Propagation
Часть вторая — DBSCAN
Часть третья — кластеризация временных рядов
Часть четвёртая — Self-Organizing Maps (SOM)
Часть пятая — Growing Neural Gas (GNG)

Доброго времени суток, Хабр! Сегодня я бы хотел рассказать об одном интересном, но крайне малоизвестном алгоритме для выделения кластеров

2017-10-22 14:10

Теория сетей: Обзор курса


алгоритмы кластеризации данных

1 - Теория сетей: Обзор курса

2 - Теория сетей: 1. Сетевая парадигма

3 - Теория сетей: 2. Введение в теорию сетей

4 - Теория сетей: 3. Основы теории графов

5 - Теория сетей: 4. Связи

6 - Теория сетей: 5. Центральность

7 - Теория сетей: 6. Топология сети

8 - Теория сетей: 7. Связност

2017-10-13 11:52

Нестандартная кластеризация 4: Self-Organizing Maps, тонкости, улучшения, сравнение с t-SNE


алгоритмы кластеризации

Часть первая — Affinity propagation
Часть вторая — DBSCAN
Часть третья — кластеризация временных рядов
Часть четвёртая — SOM

Self-organizing maps (SOM, самоорганизующиеся карты Кохонена) — знакомая многим классическая конструкция. Их часто поминают на курсах машинного обучения под соусом «а ещё нейронные сети умеют вот так». SO

2017-09-29 12:07

Кластеризация в ArcGIS Online


алгоритмы кластеризации

Наверняка у вас есть набор данных, содержащий чересчур много точек, по которым невозможно оценить картину на мелком обзорном масштабе? Такая задача решается с помощью кластеризации в вебе, доступной в новой версии ArcGIS Online, при этом можно создавать кластеры по значениям атрибутов – качественных или количественных! Посмотрите как это выгляд

2017-09-21 19:02

Три идеи, как повысить эффективность разработки: итоги хакатона по Machine Learning в СберТехе


Семинары, кластеризация данных, алгоритмы машинного обучения

Мы регулярно проводим внешние хакатоны на разные темы. Но этим летом мы решили дать возможность проявить себя и сотрудникам – ведь наверняка им хочется порешать задачки на имеющихся данных. Что получилось у коллег в СберТехе — рассказывает samorlov, главный руководитель разработки в Отделе разработки лабораторного кластера супермассивов.

У

2017-09-16 10:14

Теория сетей: 10. Распределение степеней


кластеризация данных

Теория сетей (часть 2)

10. Кластеризация и связанность;

11. Распределение степеней;

12. Случайные и распределённые графы;

13. Децентрализованные сети и сети тесного мира;

14. Централизованные и безмасштабные сети;

15. Сетевая динамика;

16. Диффузия и заразительность;

2017-09-15 07:29

Использование различных метрик для кластеризации ключевых запросов


методы кластеризации данных

Технологии определяют результат. Компания Calltouch давно приняла для себя эту истину. 
Наш старший продакт-менеджер Федор Иванов mthmtcn написал материал об использовании различных метрик для кластеризации ключевых запросов.

Введение

На сегодняшний день инструменты по оптимизации конверсий в контекстной рекламе широко испо

2017-08-31 10:16

Кластеризация RNA-Seq стала еще умнее.


алгоритмы кластеризации

пример графика t-SNE кластеризации DIMM-SC

Секвенирование транскриптомов одиночных клеток (scRNA-Seq) стало революционным инструментом для изучения клеточных и молекулярных процессов на уровне одиночной клетки. Среди существующих технологий недавно разработанная платформа на основе технологии droplet обеспечивает

2017-08-24 05:45

Машинное обучение: от Ирисов до Телекома


машинное обучение и анализ данных, алгоритмы кластеризации данных

Мобильные операторы, предоставляя разнообразные сервисы, накапливают огромное количество статистических данных. Я представляю отдел, реализующий систему управления трафиком абонентов, которая в процессе эксплуатации у оператора генерирует сотни гигабайт статистической информации в сутки. Меня заинтересовал вопрос: как в этих Больших Данных (Big Da

2017-07-27 12:50

Нестандартная кластеризация, часть 3: приёмы и метрики для кластеризации временных рядов


алгоритмы кластеризации, анализ больших данных

Пока другие специалисты по машинному обучению и анализу данных выясняют, как прикрутить побольше слоёв к нейронной сети, чтобы она ещё лучше играла в Марио, давайте обратимся к чему-нибудь более приземлённому и применимому на практике.

Кластеризация временных рядов — неблагодарное дело. Даже при группировке статических данных часто пол

2017-07-13 17:24

Актуальная математика Кластеризация


алгоритмы кластеризации данных

Актуальная математика

1. Кластеризация

2. Коллективные эффекты в топологии

3. Математика в нейронных сетях

4. Изгибаемые многогранники

5. Интегрируемая геометрия

6. Многомасштабные взаимодействия

2017-06-26 14:00

Теория сетей: 1. Сетевая парадигма


алгоритмы кластеризации данных

Теория сетей

Теория сетей: Обзор курса

Теория сетей: 1. Сетевая парадигма

Теория сетей: 2. Введение в теорию сетей

Теория сетей: 3. Основы теории графов

Теория сетей: 4. Связи

Теория сетей: 5. Центральность

Теория сетей: 6. Топология сети

Теория сетей: 7. Связность

2017-05-17 19:40

Анализ взаимосвязи навыков с помощью графов в R


анализ больших данных, алгоритмы кластеризации, машинное обучение python

Интересно, но такая область как профессиональное развитие остается немного в стороне от шума из-за data science. Стартапы в сфере HRtech только начинают наращивать обороты и увеличивать свою долю, замещая традиционный подход в сфере работы с профессионалами или, теми, кто хочет стать профессионалом.

Сфера HRtech очень разнообразна и включ

2017-05-15 16:32

Прикладное применение задачи нелинейного программирования


кластеризация данных, разработка по

В свое время, будучи студентом младших курсов, я начал заниматься научно-исследовательской работой в области теории оптимизации и синтеза оптимальных нелинейных динамических систем. Примерно в то же время появилось желание популяризировать данную область, делиться своими наработками и мыслями с людьми. Подтверждением этому служит пара-тройка моих д

2017-05-14 19:41

Рост автономных платформ обработки данных или еще раз про Big Data


большие данные big data, кластеризация данных

Большие данные сегодня, ну, БОЛЬШИЕ. В исследовании IDC за 2016 год под названием «Полугодовое руководство по расходам на большие данные и аналитику» прогнозируется, что общемировой оборот на больших данных вырастет со $130 млрд в 2016-м до более чем $203 млрд в 2020-м, то есть совокупный годовой рост будет на уровне 11,7%. По мнению IDC, росту спо

2017-04-29 11:32

Алгоритмы интеллектуального анализа данных


свёрточные нейронные сети, алгоритмы кластеризации данных

Рассказывает Рэй Ли, автор блога raily.net

Сегодня я постараюсь простым языком объяснить 10 самых важных алгоритмов интеллектуального анализа данных, по результатам  опросов трех разных групп экспертов в этом исследовании.

После того, как я расскажу вам об этих алгоритмах, о том как они работают, что делают и где их можно н

2017-04-03 18:10

Открытый курс машинного обучения. Тема 6. Построение и отбор признаков


машинное обучение python, алгоритмы кластеризации, архитектура нейронных сетей, анализ больших данных

Сообщество Open Data Science приветствует участников курса!

В рамках курса мы уже познакомились с несколькими ключевыми алгоритмами машинного обучения. Однако перед тем как переходить к более навороченным алгоритмам и подходам, хочется сделать шаг в сторону и поговорить о подготовке данных для обучения модели. Известный принцип garbage i

2017-03-19 16:06

Лекция 1: Задачи Data Mining


алгоритмы кластеризации данных, большие данные big data

Алгоритмы интеллектуальной обработки больших объемов данных

1. Задачи Data Mining

2. Задача кластеризации и ЕМ-алгоритм

3. Различные алгоритмы кластеризации

4. Задача классификации

5. Обработка текстов, Naive Bayes

6. Линейные модели для классификации и регрессии

7. Машина опорных в

2017-01-04 14:02

Мир полон вероятностей и неопределенностей, но понять природу случайности дано не каждому


алгоритмы кластеризации данных

Мир полон вероятностей и неопределенностей, но понять природу случайности дано не каждому. Если подброшенная монета 5 раз выпала орлом, чего следует ожидать при следующем броске? Если ваш ответ “решка”, подумайте снова. Орлы и решки равновероятны, у случайных событий нет памяти о том, что случилось прежде.

Даже лучшие математики заблуж

2016-10-05 15:30

Работа с Big Data при помощи GPU: ускорение работы баз данных в десятки раз05.10.2016 12:33


алгоритмы кластеризации, нейросети новости

Уже несколько лет дата-центры многих компаний работают с вычислениями с ускорением на GPU. Наша компания сейчас изучает этот вопрос, поскольку такой тип вычислений становится все более востребованным. Так, вычисления с ускорением на GPU можно (и нужно) использовать для ускорения требовательных к ресурсам п

2016-09-21 18:30

Технологии хранения и обработки больших объёмов данных


алгоритмы кластеризации данных

Курс предназначен программистам, желающим познакомиться с теоретическими и практическими аспектам технологий, связанных с хранением, обработкой, анализом больших объёмов данных и использованием их в приложениях. В основном будут рассматриваться технологии, ставшие массовыми относительно недавно, такие как распределённые файловые системы и NoSQL

2016-02-18 15:30

Новая модель детально воспроизводит крупномасштабную структуру Вселенной


анализ больших данных, алгоритмы кластеризации

Новая модель детально воспроизводит крупномасштабную структуру Вселенной

В ходе обзора неба BOSS была составлена трехмерная карта галактик Вселенной, находящихся на расстояниях до 4,5 миллиарда световых лет, причем общее число объектов исследования составило примерно 1 миллион. Теперь международная команда астрономов смогла воспроизвес