Кластеризация

МЕНЮ


Искусственный интеллект. Новости
Поиск
Регистрация на сайте
Сбор средств на аренду сервера для ai-news

ТЕМЫ


Новости ИИРазработка ИИРабота разума и сознаниеВнедрение ИИРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

Авторизация



RSS


RSS новости

Новостная лента форума ailab.ru

Последние новости

 

Главные новости

2018-06-09 09:02

Классификация ученых


алгоритмы кластеризации

По данным ЮНЕСКО количество ученых во всем мире в 2013 году составило 7,8 миллионов человек. То есть 0,1% всей человеческой популяции профессионально занимается наукой. Финансирование исследований значительной доли этих людей зачастую регулируется чиновниками, далекими от науки. И в этом вопросе научно обоснованная систематизация ученых была бы очень кстати. Подобной социологией научного сообщества озаботились математики из Института проблем управления и Московского физико-технического

2018-05-21 23:04

Валерий Бабушкин - Поведенческая кластеризация пользователей Яндекс.Советник


методы кластеризации

Валерий Бабушкин - Поведенческая кластеризация пользователей Яндекс.Советник

2018-03-10 19:17

Р.В. Шамин. Лекция № 4 Сети Кохонена в задачах кластеризации экономических данных


алгоритмы кластеризации данных

Курс "Машинное обучение и искусственный интеллект в задачах математической экономики", читаемый в Математическом институте им. В.А. Стеклова РАН: 

2018-01-16 18:52

Алгоритм машинного обучения впервые запущен на квантовом компьютере


квантовый компьютер, алгоритмы кластеризации

Стартап Rigetti Computing впервые запустил на квантовом компьютере алгоритм кластеризации данных. Этот факт доказывает возможность использования нового типа компьютеров в сфере машинного обучения, что в разы сократит время расчетов.

Компания использует гибридную установку: квантовая машина, размещенная в охладителе, который поддерживает сверхнизкие температуры, работает в связке с обычным компьютером. Чтобы развить применение квантовых компьютеров

2017-12-30 17:49

Мультимодальная кластеризация для анализа данных


анализ больших данных, алгоритмы кластеризации

Мультимодальная кластеризация для анализа данных | Конференция: Машинное обучение и анализ алгоритмов | Лектор: Дмитрий Игнатов | Организатор: CSClub

2017-12-08 00:00

AIML-4-4-1 Задача распознавания


методы кластеризации данных, методы распознавания образов

Классификация и распознавание образов

@iamdev

**********************************************

1 Задача распознавания

2 Построение структуры нейронной сети

3 Kernel Trick

4 Задача классификации

5 Применение карты Кохонена для классификации

6 Анализ и визуализация данных с помощью карты Кохонена

2017-12-07 13:05

Иерархический кластерный анализ на языке программирование Python


алгоритмы кластеризации, теория программирования

Постановка задачи

Классификация — одна из важнейших задач, встречающихся при анализе данных. В зависимости от постановки можно различать следующие задачи: кластеризацию (классификацию в отсутствии обучающей выборки) и, собственно, классификацию (при наличии обучающей выборки),  когда данные необходимо соотнести с уже известными классами.

Первая задача возникает, как правило, когда исследуются новые объекты или явления; в этом случае кластеризация позволяет выделить однородные группы

2017-12-06 18:00

Видеокурс по кластеризации баз данных


алгоритмы кластеризации

В этом видео автор рассказывает о кластеризации базы данных и как управлять кластерами баз данных с помощью ClusterControl.

Кластеризация базы данных - это когда у вас несколько компьютеров, работающих вместе, которые используются для хранения ваших

данных.

Существует четыре основных причины, почему следует учитывать кластеризацию:

- избыточность данных,

- балансировка нагрузки (масштабируемость),

- высокая доступность,

- мониторинг и автоматизация.

Об этом и

2017-10-29 15:34

Лекция 7. Обучение без учителя. Открытый курс ODS и Mail.ru по машинному обучению


кластеризация данных, алгоритмы машинного обучения

7-ая лекция от OpenDataScience и Mail.ru Group. Рассказывают про метод главных компонент и различные подходы к задаче кластеризации.

2017-10-22 14:10

Теория сетей: Обзор курса


алгоритмы кластеризации данных

1 - Теория сетей: Обзор курса

2 - Теория сетей: 1. Сетевая парадигма

3 - Теория сетей: 2. Введение в теорию сетей

4 - Теория сетей: 3. Основы теории графов

5 - Теория сетей: 4. Связи

6 - Теория сетей: 5. Центральность

7 - Теория сетей: 6. Топология сети

8 - Теория сетей: 7. Связность

9 - Теория сетей: 8. Диаметр и масштаб

10 - Теория сетей: 9. Кластеризация и связанность

2017-09-29 12:07

Кластеризация в ArcGIS Online


алгоритмы кластеризации

Наверняка у вас есть набор данных, содержащий чересчур много точек, по которым невозможно оценить картину на мелком обзорном масштабе? Такая задача решается с помощью кластеризации в вебе, доступной в новой версии ArcGIS Online, при этом можно создавать кластеры по значениям атрибутов – качественных или количественных! Посмотрите как это выглядит в карте-истории

2017-09-16 10:14

Теория сетей: 10. Распределение степеней


кластеризация данных

Теория сетей (часть 2)

10. Кластеризация и связанность;

11. Распределение степеней;

12. Случайные и распределённые графы;

13. Децентрализованные сети и сети тесного мира;

14. Централизованные и безмасштабные сети;

15. Сетевая динамика;

16. Диффузия и заразительность;

2017-08-31 10:16

Кластеризация RNA-Seq стала еще умнее.


алгоритмы кластеризации

пример графика t-SNE кластеризации DIMM-SC Секвенирование транскриптомов одиночных клеток (scRNA-Seq) стало революционным инструментом для изучения клеточных и молекулярных процессов на уровне одиночной клетки. Среди существующих технологий недавно разработанная платформа на основе технологии droplet обеспечивает эффективную параллельную обработку тысяч одиночных клеток с прямым подсчетом копий транскриптов с использованием Unique Molecular Identifier (UMI). Несмотря на технологические

2017-08-18 20:32

Подборка материалов по кластеризации


методы кластеризации данных

Подборка материалов по кластеризации.

Кластеризация — это задача разбиения множества объектов на группы, называемые кластерами. Внутри каждой группы оказываются «похожие» объекты, а объекты разных групп имеют как можно больше отличий. Главное отличие кластеризации от классификации состоит в том, что перечень групп четко не задан и определяется в процессе работы алгоритма, поэтому кластеризация относится к обучению без учителя.

Вики-подобная статья о кластеризации с общей информацией и

2017-08-01 18:02

Кластеризация маркеров на карте Google Maps API


алгоритмы кластеризации данных

Привет, Хабр! Хочу рассказать о моем опыте разработки карты с кластеризованными маркерами на google maps api и React.js. Кластеризация — это группировка близлежащих маркеров, меток, точек в один кластер. Это помогает улучшить UX и отобразить данные визуально понятнее, чем куча наехавших друг на друга точек. Компания, в которой я работаю, создает уникальный продукт для СМИ, это мобильное приложение, смысл которого заключается в съемке фото/видео/стрим материалов и возможности получить отличную

2017-07-18 12:50

Ученый нашел главные слова хеви-метала


методы кластеризации

Частота использования различных слов в песнях heavy metal групп в виде облака тегов. Параметр «металичности» не учитывается. Degenerate State

Специалист по обработке данных, автор блога Degenerate State, опубликовал список слов, наиболее характерных для музыкальных произведений в стиле heavy metal. Ученый проанализировал свыше 200 тысяч текстов песен и выяснил, что самыми «металичными» можно назвать слова burn («сжигать», «ожог»), cries («крики», «вопить»), veins («вены»),

2017-06-26 21:16

10 главных алгоритмов машинного обучения


алгоритмы кластеризации данных, алгоритмы машинного обучения

Нет сомнений, что искусственный интеллект и машинное обучение в течение последних нескольких лет обрели широкую известность. Как технологии Big Data удерживают статус самого обсуждаемого IT-тренда современности, так и алгоритмы машинного обучения можно считать наимощнейшим инструментом, ориентированным на прогнозное приложение больших объемов данных. Один из наиболее глобальных примеров использования машинного обучения — алгоритмы Netflix, которые предлагают

2017-06-01 18:36

Летняя школа по сетевому анализу


алгоритмы кластеризации

Специально для тех, кто еще не разобрался в сетевом анализе!

19-23 июня НИУ ВШЭ проведет VII международную летнюю школу «Теория и методы сетевого анализа» (TMSA-2017).

Тема школы этого года — «Кластеризация сетевых данных: методы и применение».

Первая часть курса посвящена наиболее часто используемым подходам кластеризации, которые реализованы в большинстве статистических программ (R, SPSS, SAS и др.).

Во второй части курса будут представлены кластеринг с реляционным

2017-05-17 19:40

Анализ взаимосвязи навыков с помощью графов в R


анализ больших данных, алгоритмы кластеризации, методы машинного обучения

Интересно, но такая область как профессиональное развитие остается немного в стороне от шума из-за data science. Стартапы в сфере HRtech только начинают наращивать обороты и увеличивать свою долю, замещая традиционный подход в сфере работы с профессионалами или, теми, кто хочет стать профессионалом.

Сфера HRtech очень разнообразна и включает в себя автоматизацию найма сотрудников, развитие и коучинг, автоматизацию внутренних HR процедур, отслеживание рыночных зарплат, трекинг кандидатов,

2017-05-09 20:17

Смешанные регрессионные модели в R — Иван Иванчей


методы кластеризации данных

Смешанные регрессионные модели в R — Иван Иванчей

Классические методы статистического вывода часто требуют сбалансированных по условиям независимых наблюдений. Однако на практике мы постоянно сталкиваемся с разного рода зависимостями в данных: повторными измерениями, кластеризацией наблюдений, несбалансированностью сравниваемых условий. Это может привести к ненадёжным выводам. Один из самых эффективных способов борьбы с такими неприятностями — регрессионные модели, учитывающие отдельно

2017-03-09 21:51

Обзор алгоритмов кластеризации данных


кластеризация данных

В своей дипломной работе я проводил обзор и сравнительный анализ алгоритмов кластеризации данных. Подумал, что уже собранный и проработанный материал может оказаться кому-то интересен и полезен. О том, что такое кластеризация, рассказал sashaeve в статье «Кластеризация: алгоритмы k-means и c-means». Я частично повторю слова Александра, частично дополню. Также в конце этой статьи интересующиеся могут почитать материалы по ссылкам в списке литературы.

Так же я постарался привести сухой

2017-02-20 10:34

Интересные алгоритмы кластеризации, часть вторая: DBSCAN


кластеризация данных

Углубимся ещё немного в малохоженные дебри Data Science. Сегодня в очереди на препарацию алгоритм кластеризации DBSCAN. Прошу под кат людей, которые сталкивались или собираются столкнуться с кластеризацией данных, в которых встречаются сгустки произвольной формы — сегодня ваш арсенал пополнится отличным инструментом.

DBSCAN (Density-based spatial clustering of applications with noise, плотностной алгоритм пространственной кластеризации с присутствием шума), как следует из названия, оперирует

2017-02-04 20:39

Кластеризация дубликатов в Яндекс.Картинках


it новости, алгоритмы кластеризации данных

Сегодня в клубе Яндекс.Субботник появилось интересное видео о том, как Яндекс обрабатывает изображения для исключения дубликатов. Рассказывает Александр Крайнов: он с 2000 года занимается проектами, связанными с обработкой медиаданных. В Яндексе отвечает за проекты, в которых задействовано компьютерное «зрение».

О докладе

Легко найти дубликаты среди тысяч картинок. Сложнее – среди миллионов. И совсем трудно – среди миллиардов. Чем выше полнота работы алгоритма, тем больше проблем. Но в то же

2017-02-02 14:06

Задача кластеризации


анализ больших данных, алгоритмы кластеризации, методы машинного обучения

- Лекция 1: Задачи Data Mining - Лекция 2: Задача кластеризации и ЕМ-алгоритм - Лекция 3: Различные алгоритмы
 

2018-06-05 11:30

Как машины анализируют большие данные: введение в алгоритмы кластеризации


большие данные big data, кластеризация данных

Перевод How Machines Make Sense of Big Data: an Introduction to Clustering Algorithms.

Взгляните на картинку ниже. Это коллекция насекомых (улитки не насекомые, но не будем придираться) разных форм и размеров. А теперь разделите их на несколько групп по степени похожести. Никакого подвоха. Начните с группирования пауков.

Закончили? Хотя здесь нет какого-то «правильного» решения, наверняка вы разделили этих существ на четыре кластера. В одном кластере пауки, во втором — пара улиток, в

2018-06-01 14:27

Классификация больших объемов данных на Apache Spark с использованием произвольных моделей машинного обучения


методы машинного обучения, анализ больших данных, алгоритмы кластеризации

Часть 2: Решение

И снова здравствуйте! Сегодня я продолжу свой рассказ о том, как мы классифицируем большие объёмы данных на Apache Spark, используя произвольные модели машинного обучения. В первой части статьи мы рассмотрели саму постановку задачи, а также основные проблемы, которые возникают при организации взаимодействия между кластером, на котором хранятся и обрабатываются исходные данные, и внешним сервисом классификации. Во второй части мы рассмотрим один из вариантов решения

2018-05-24 22:00

Обучение без учителя: 4 метода кластеризации данных на Python


методы кластеризации

Описаны четыре популярных метода обучения без учителя для кластеризации данных с соответствующими примерами программного кода на Python.

Обучение без учителя

Обучение без учителя (unsupervised learning, неконтролируемое обучение) – класс методов машинного обучения для поиска шаблонов в наборе данных. Данные, получаемые на вход таких алгоритмов обычно не размечены, то есть передаются только входные переменные X без соответствующих меток y. Если в контролируемом обучении (обучении с

2018-02-14 18:06

Автоэнкодер в задачах кластеризации политических событий


алгоритмы машинного обучения, кластеризация данных

Я не люблю читать статьи, смотрю demo и код

Демо TensorBoard Projector Работает в Chrome. Открываем и нажимаем на Bookmarks в нижнем правом углу. В верхнем правом углу можем фильтровать классы. В конце статьи есть GIF картинки с примерами использования. Проект на GitHub Отступление от темы

В данной статье, пойдет речь о средствах машинного обучения, подходах и практических решениях. Анализ проводится на базе политических событий, что не является предметом обсуждения данной статьи.

2018-01-08 23:26

Кластеризация и визуализация текстовой информации


методы кластеризации данных

В русскоязычном секторе интернета очень мало учебных практических примеров (а с примером кода ещё меньше) анализа текстовых сообщений на русском языке. Поэтому я решил собрать данные воедино и рассмотреть пример кластеризации, так как не требуется подготовка данных для обучения.

Большинство используемых библиотек уже есть в дистрибутиве Anaconda 3, поэтому советую использовать его. Недостающие модули/библиотеки можно установить стандартно через pip install «название пакета». Подключаем

2017-11-25 15:59

Кластеризация графов и поиск сообществ. Часть 1: введение, обзор инструментов и Волосяные Шары


методы кластеризации, коммуникации в социальных сетях

В нашей работе часто возникает потребность в выделении сообществ (кластеров) разных объектов: пользователей, сайтов, продуктовых страниц интернет-магазинов. Польза от такой информации весьма многогранна – вот лишь несколько областей практического применения качественных кластеров:

Выделение сегментов пользователей для проведения таргетированных рекламных кампаний. Использование кластеров в качестве предикторов («фичей») в персональных рекомендациях (в content-based методах или как

2017-10-26 11:44

Нестандартная кластеризация 5: Growing Neural Gas


алгоритмы кластеризации данных

Часть первая — Affinity Propagation Часть вторая — DBSCAN Часть третья — кластеризация временных рядов Часть четвёртая — Self-Organizing Maps (SOM) Часть пятая — Growing Neural Gas (GNG)

Доброго времени суток, Хабр! Сегодня я бы хотел рассказать об одном интересном, но крайне малоизвестном алгоритме для выделения кластеров нетипичной формы — расширяющемся нейронном газе (Growing Neural Gas, GNG). Особенно мало информации об этом инструменте анализа данных в рунете: статья в википедии, рассказ

2017-10-13 11:52

Нестандартная кластеризация 4: Self-Organizing Maps, тонкости, улучшения, сравнение с t-SNE


алгоритмы кластеризации

Часть первая — Affinity propagation Часть вторая — DBSCAN Часть третья — кластеризация временных рядов Часть четвёртая — SOM

Self-organizing maps (SOM, самоорганизующиеся карты Кохонена) — знакомая многим классическая конструкция. Их часто поминают на курсах машинного обучения под соусом «а ещё нейронные сети умеют вот так». SOM успели пережить взлёт в 1990-2000 годах: тогда им пророчили большое будущее и создавали новые и новые модификации. Однако, в XXI веке SOM понемногу уходят на задний

2017-09-21 19:02

Три идеи, как повысить эффективность разработки: итоги хакатона по Machine Learning в СберТехе


Семинары, кластеризация данных, алгоритмы машинного обучения

Мы регулярно проводим внешние хакатоны на разные темы. Но этим летом мы решили дать возможность проявить себя и сотрудникам – ведь наверняка им хочется порешать задачки на имеющихся данных. Что получилось у коллег в СберТехе — рассказывает samorlov, главный руководитель разработки в Отделе разработки лабораторного кластера супермассивов. Участникам предложили разработать решения на Machine Learning, которые помогали бы предсказывать сроки выполнения доработок и критичность багов. Эти решения

2017-09-15 07:29

Использование различных метрик для кластеризации ключевых запросов


методы кластеризации данных

Технологии определяют результат. Компания Calltouch давно приняла для себя эту истину.  Наш старший продакт-менеджер Федор Иванов mthmtcn написал материал об использовании различных метрик для кластеризации ключевых запросов.

Введение На сегодняшний день инструменты по оптимизации конверсий в контекстной рекламе широко используются как прямыми рекламодателями, так и агентствами. Мы в компании Calltouch уже больше года ведем разработку своего инструмента по оптимизации ставок в контекстной

2017-08-24 05:45

Машинное обучение: от Ирисов до Телекома


методы машинного обучения, алгоритмы кластеризации

Мобильные операторы, предоставляя разнообразные сервисы, накапливают огромное количество статистических данных. Я представляю отдел, реализующий систему управления трафиком абонентов, которая в процессе эксплуатации у оператора генерирует сотни гигабайт статистической информации в сутки. Меня заинтересовал вопрос: как в этих Больших Данных (Big Data) выявить максимум полезной информации? Не зря ведь одна из V в определении Big Data — это дополнительный доход.

Я взялся за эту задачу, не

2017-08-04 11:59

Поиск лучшего места в мире для ветряка


ИИ проекты, кластеризация данных, Методы научного исследования, алгоритмы машинного обучения

История о том, как NASA, ESA, Датский Технологический Университет, нейронные сети, деревья решений и прочие хорошие люди помогли найти мне лучший бесплатный гектар на Дальнем Востоке, а также в Африке, Южной Америке и других “так себе” местах.

Предыстория Кажется, года два назад, а может быть уже и три, объявили о програ мме раздачи бесплатных гектаров на Дальнем Востоке России. Быстренько посмотрев на карту, стало понятно, что просто так выбрать правильный гектар не так уж и просто, а

2017-07-27 12:50

Нестандартная кластеризация, часть 3: приёмы и метрики для кластеризации временных рядов


алгоритмы кластеризации, анализ больших данных

Пока другие специалисты по машинному обучению и анализу данных выясняют, как прикрутить побольше слоёв к нейронной сети, чтобы она ещё лучше играла в Марио, давайте обратимся к чему-нибудь более приземлённому и применимому на практике.

Кластеризация временных рядов — неблагодарное дело. Даже при группировке статических данных часто получаются сомнительные результаты, что уж говорить про информацию, рассеянную во времени. Однако нельзя игнорировать задачу, только потому что она сложна.

2017-07-13 17:24

Актуальная математика Кластеризация


алгоритмы кластеризации данных

Актуальная математика

1. Кластеризация

2. Коллективные эффекты в топологии

3. Математика в нейронных сетях

4. Изгибаемые многогранники

5. Интегрируемая геометрия

6. Многомасштабные взаимодействия

2017-06-26 14:00

Теория сетей: 1. Сетевая парадигма


алгоритмы кластеризации данных

Теория сетей

Теория сетей: Обзор курса

Теория сетей: 1. Сетевая парадигма

Теория сетей: 2. Введение в теорию сетей

Теория сетей: 3. Основы теории графов

Теория сетей: 4. Связи

Теория сетей: 5. Центральность

Теория сетей: 6. Топология сети

Теория сетей: 7. Связность

Теория сетей: 8. Диаметр и масштаб

Теория сетей: 9. Кластеризация и связанность

Теория сетей: 10. Распределение степеней

@bookflow

2017-05-15 16:32

Прикладное применение задачи нелинейного программирования


кластеризация данных, разработка по

В свое время, будучи студентом младших курсов, я начал заниматься научно-исследовательской работой в области теории оптимизации и синтеза оптимальных нелинейных динамических систем. Примерно в то же время появилось желание популяризировать данную область, делиться своими наработками и мыслями с людьми. Подтверждением этому служит пара-тройка моих детских незрелых статей на Хабре. Тем не менее, на тот момент эта идея оказалась для меня непосильной. Возможно ввиду моей занятости, неопытности,

2017-05-14 19:41

Рост автономных платформ обработки данных или еще раз про Big Data


большие данные big data, кластеризация данных

Большие данные сегодня, ну, БОЛЬШИЕ. В исследовании IDC за 2016 год под названием «Полугодовое руководство по расходам на большие данные и аналитику» прогнозируется, что общемировой оборот на больших данных вырастет со $130 млрд в 2016-м до более чем $203 млрд в 2020-м, то есть совокупный годовой рост будет на уровне 11,7%. По мнению IDC, росту способствуют три фактора: увеличение доступности гигантских объёмов данных, богатый ассортимент развивающихся open source-технологий для работы с

2017-04-29 11:32

Алгоритмы интеллектуального анализа данных


нейросеть пример, алгоритмы кластеризации данных

Рассказывает Рэй Ли, автор блога raily.net

Сегодня я постараюсь простым языком объяснить 10 самых важных алгоритмов интеллектуального анализа данных, по результатам  опросов трех разных групп экспертов в этом исследовании.

После того, как я расскажу вам об этих алгоритмах, о том как они работают, что делают и где их можно найти, я надеюсь, что вы используете свои новоприобретенные знания для еще более глубокого изучения добычи данных.

Что он делает? C4.5 создает классификатор в

2017-04-10 14:50

Открытый курс машинного обучения. Тема 7. Обучение без учителя: PCA и кластеризация


кластеризация данных, алгоритмы машинного обучения

Привет всем! Приглашаем изучить седьмую тему нашего открытого курса машинного обучения!

Данное занятие мы посвятим методам обучения без учителя (unsupervised learning), в частности методу главных компонент (PCA — principal component analysis) и кластеризации. Вы узнаете, зачем снижать размерность в данных, как это делать и какие есть способы группирования схожих наблюдений в данных. Список статей серии

Первичный анализ данных с Pandas Визуальный анализ данных c Python Классификация,

2017-04-03 18:10

Открытый курс машинного обучения. Тема 6. Построение и отбор признаков


алгоритмы машинного обучения, кластеризация данных, реализация нейронной сети, большие данные big data

Сообщество Open Data Science приветствует участников курса!

В рамках курса мы уже познакомились с несколькими ключевыми алгоритмами машинного обучения. Однако перед тем как переходить к более навороченным алгоритмам и подходам, хочется сделать шаг в сторону и поговорить о подготовке данных для обучения модели. Известный принцип garbage in – garbage out на 100% применим к любой задаче машинного обучения; любой опытный аналитик может вспомнить примеры из практики, когда простая модель,

2017-03-19 16:06

Лекция 1: Задачи Data Mining


алгоритмы кластеризации данных, большие данные big data

Алгоритмы интеллектуальной обработки больших объемов данных

1. Задачи Data Mining

2. Задача кластеризации и ЕМ-алгоритм

3. Различные алгоритмы кластеризации

4. Задача классификации

5. Обработка текстов, Naive Bayes

6. Линейные модели для классификации и регрессии

7. Машина опорных векторов

8. Методы снижения размерности пространства

9. Алгоритмические композиции

Все 13 лекций доступны по ссылке:

https://vk.com/videos-54530371?section=album_56085995

2017-02-06 13:34

Интересные алгоритмы кластеризации, часть первая: Affinity propagation


кластеризация данных, большие данные big data

Если вы спросите начинающего аналитика данных, какие он знает методы классификации, вам наверняка перечислят довольно приличный список: статистика, деревья, SVM, нейронные сети… Но если спросить про методы кластеризации, в ответ вы скорее всего получите уверенное «k-means же!» Именно этот золотой молоток рассматривают на всех курсах машинного обучения. Часто дело даже не доходит до его модификаций (k-medians) или связно-графовых методов.

Не то чтобы k-means так уж плох, но его результат почти

2016-12-13 11:25

Математические прогулки


алгоритмы кластеризации данных

Математические прогулки

В ходе беседы герой проекта рассказывает о жизни, математике, о математике вокруг нас, о науке в целом, об ученых, о музыке, о поэзии… Все еще не верите, что математика может быть интересной? Тогда скорее гулять!

1. Коллективные эффекты в топологии

2. Кластеризация

3. Изгибаемые многогранники

2016-10-03 17:56

YT: зачем Яндексу своя MapReduce-система и как она устроена


большие данные big data, алгоритмы машинного обучения, кластеризация данных

В течение последних шести лет в Яндексе идет работа над системой под кодовым называнием YT (по-русски мы называем её «Ыть»). Это основная платформа для хранения и обработки больших объемов данных - мы уже о ней рассказывали на YaC 2013. С тех пор она продолжала развиваться. Сегодня я расскажу о том, с чего началась разработка YT, что нового в ней появилось и что ещё мы планируем сделать в ближайшее время.

Кстати, 15 октября в офисе Яндекса мы расскажем не только о YT, но и о других

2016-07-07 06:15

Natural Language Processing (NLP), обработка естественных языков, — это наука на стыке искусственного интеллекта и компьютерной лингвистики


методы машинного обучения, лингвистика, искусственный интеллект, искусственные нейронные сети, кластеризация данных

Natural Language Processing (NLP), обработка естественных языков, - это наука на стыке искусственного интеллекта и компьютерной лингвистики. И хотя термин этот не настолько популярен сегодня, как Big Data или машинное обучение, все мы сталкиваемся с достижениями NLP каждый день: автоматическим переводом, автозаменой в телефоне, чат-ботами, системами рекомендаций, различными агрегаторами и так далее. Как с помощью методов NLP предсказывать