Большие данные (big data), методы анализа, алгоритмы 2017

МЕНЮ


Искусственный интеллект. Новости
Поиск
Регистрация на сайте

ТЕМЫ


Новости ИИРазработка ИИРабота разума и сознаниеВнедрение ИИРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

Авторизация



RSS


RSS новости

Новостная лента форума ailab.ru

Последние новости

 

Главные новости

2018-04-30 08:01

Ложные корреляции: как Николас Кейдж влияет на смерть в бассейне


анализ больших данных

Шутливая пастафарианская церковь боготворит Летающего макаронного монстра,а первыми приверженцами своего культа называет пиратов,считая их «абсолютно божественными». В доказательство этого приводится график,«демонстрирующий», что снижение числа морских бродяг и разбойников за последние 200 лет привело к… глобальному потеплению.

Впервые на эту «связь» указал основатель пастафарианства Роберт Хендерсон в открытом

2018-04-17 11:37

Data Mining In Action. Рекомендательные системы


большие данные big data

Открытый курс по машинному обучению и анализу данных "Data Mining In Action"

Илья Ирхин

Группа ВК: https://vk.com/data_mining_in_action Репозиторий курса на гитхабе: https://github.com/applied-data-scien.. .

2018-04-09 12:56

ЧТО ТАКОЕ БОЛЬШИЕ ДАННЫЕ. АНАЛИЗ БОЛЬШИХ ДАННЫХ.


большие данные big data

Из названия можно предположить, что термин `большие данные` относится просто к управлению и анализу больших объемов данных. Согласно отчету McKinsey Institute `Большие данные: новый рубеж для инноваций, конкуренции и производительности` ( Big data: The next frontier for innovation, competition and productivity), термин `большие данные` относится к наборам данных, размер которых превосходит возможности типичных баз данных (БД) по занесению, хранению, управлению и анализу информации. И мировые

2018-04-08 19:27

Анализ данных — основы и терминология


большие данные big data

В этой статье я бы хотел обсудить базовые принципы построения практического проекта по (т. н. «интеллектуальному») анализу данных, а также зафиксировать необходимую терминологию, в том числе русскоязычную.

Согласно википедии, Анализ данных — это область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных (в широком смысле) данных; процесс исследования, фильтрации,

2018-04-08 11:38

Олимпиада «ИТМО ВКонтакте»


анализ больших данных, методы машинного обучения

Прямо сейчас ведем прямую трансляцию лекции , директора по росту и исследованиям о Big Data и машинном обучении.

После этого сразу подводим результаты олимпиады «ИТМО ВКонтакте»

2018-03-25 19:14

Анализ данных в спорте: взаимодействие учёных, клубов и федераций. Лекция в Яндексе


большие данные big data

Мы проводим мероприятия не только по темам, которыми занимаемся сами. В феврале мы собрали специалистов по использованию машинного обучения в спорте. Удивительно, как много процессов связывают эти две сферы — анализ данных и спорт — и какое количество нерешенных проблем возникает на стыке между ними. Перед вами доклад Дмитрия Дагаева — заместителя проректора НИУ ВШЭ.

— Сегодня я постараюсь коротко рассказать о задачах, которые уже решаются с помощью анализа данных в спорте. Мы увидим,

2018-03-17 16:00

Майнинг данных. Специалист по Computer Science Алексей Незнанов о проблемах искусственного интеллекта, видах майнинга данных и обработке данных в корпорациях.


искусственный интеллект, компьютерная лингвистика, большие данные big data

Майнинг данных.

Специалист по Computer Science Алексей Незнанов о проблемах искусственного интеллекта, видах майнинга данных и обработке данных в корпорациях.

Майнинг данных (калька с английского Data mining) — это термин, который сейчас в России, с одной стороны, считается не очень удачным, а с другой — становится все более распространенным. Почему так происходит? Все прочие синонимы, например «разработка данных» (от «разработки месторождений»), смешиваются с «разработкой методов».

2018-03-14 11:57

Samara JS #4 Владимир Малик. Современные Big Data и Machine Learning для чайников.


анализ больших данных, методы машинного обучения

1. Ирина Шилина, Web accessibility

2. Алексей Гурьянов, CerebralJS, A declarative state and side effects management

3. Владимир Малик, Современные Big Data и Machine Learning для чайников

2018-03-12 10:30

Big Data. Занятие 1.1 и 1.2 Что такое большие данные, их виды и как их получить.


анализ больших данных

Видеоуроки по BIG DATA. Основы работы с массивами больших данных.

Презентации: yadi.sk/d/NRCupnST3LNR5d

Дополнительные материалы и книги: yadi.sk/d/F2xBwxce3LNR5b

2018-03-04 16:58

Google открыла доступ к самой большой базе мировых достопримечательностей Google-Landmarks


ИТ-гиганты, большие данные big data, распознавание образов

1 марта Google открыла доступ к большой базе данных для распознавания мировых памятников искусственного и природного происхождения. Набор «знаний» получил название Google-Landmarks и представлен в рамках соревнований от Kaggle на лучшие системы по распознаванию и поиску достопримечательностей.

Особенности Google-Landmarks

Набор данных содержит более 2 миллионов изображений, описывающих около 30 тысяч уникальных культурных

2018-02-24 03:06

Победа по расчету


алгоритмы машинного обучения, ИИ проекты, большие данные big data

В командных играх спорта на тренерский штаб, особенно во время крупных соревнований, ложится большая аналитическая нагрузка. Специалистам приходится на ходу вести статистику ударов, промахов, сейвов, удачных и неудачных действий защитников и нападающих, чтобы выбрать оптимальную тактику и состав на следующую игру. Учитывая современный уровень развития компьютерных алгоритмов, естественно предположить, что искусственный интеллект справится с этими задачами быстрее и лучше людей. Чтобы узнать о

2018-02-17 18:00

Информационно-измерительная система «ИНФОТРАНС-Ласточка»


IoT, анализ больших данных

Видели ли вы "особенную Ласточку" на МЦК с синей подсветкой ходовой части одного из вагонов? Если да, то наверняка было интересно узнать, что же это такое? Ну а если нет, то мы так и так вам расскажем. Информационно-измерительная система «ИНФОТРАНС-Ласточка» - наша сегодняшняя тема.

Система «ИНФОТРАНС-Ласточка» - часть инновационного проекта «Цифровая железная дорога» компании «РЖД». В основе программы лежат современные IT-технологии, например, интернет вещей (Internet of Things, IoT) и

2018-02-17 11:57

«В какой-то момент нейронные сети научились строить вещи, который человек предсказать не способен!»


теория распознавания образов, искусственный интеллект, искусственные нейронные сети, большие данные big data

«Облако» за минуту с Леонидом Волковым:

— «Большие данные» и их магия;

— Нейронные сети строят прогнозы лучше, чем человек;

— Анализ картинок и нейросеть, которая учит себя сама;

— Распознавание лиц.

Смотрите «Облако» целиком: youtu.be/W2mRzsjSBAc

2018-02-14 11:01

Всё о машинном обучении и анализе данных


большие данные big data, алгоритмы машинного обучения

У нас вышло новое интервью с супер-гением машинного обучения. По классике в нашем ток-шоу - разбор темы, приятный подарок от спикера, отличный скринкаст, на этот раз по анализу данных, а также парочка интересных фактов о том, кто же все таки сидит в Одноклассниках.? Весьма неожиданная информация)

2018-02-13 20:43

Большие данные и машинное обучение


анализ больших данных, методы машинного обучения

Облако . Гость — Анатолий Орлов (anatolix), руководитель лаборатории больших данных

2018-02-13 11:05

SmartData 2017 лучшее - YouTube


теория распознавания образов, нейросеть пример, большие данные big data, искусственный интеллект

Видео с конференции SmartData 2017 открыты для всех желающих!

Творческий ИИ, Data Science, свёрточные сети, распознавание образов и математический хардкор – мастхэв для тех, кто может в Big Data.

2018-02-04 05:46

Хорошо интерпретируемые методы анализа данных


большие данные big data, искусственный интеллект в медицине

Специалист по Computer Science Алексей Незнанов об интерпретируемости методов анализа данных, применении систем искусственного интеллекта в клинике и значимости объяснений для доказательной медицины

Современная область, которая обычно называется «науки о данных», ? это междисциплинарная область, которая своим названием подчеркивает как раз объект исследования, то есть данные в любых формах, и пытается тем самым застолбить себе место во всех возможных приложениях. Сейчас нас в первую очередь

2018-01-30 15:25

Спецпроекты в Сбербанк-Технологиях: как в банках готовят Hadoop, Spark, Kafka и прочую Big Data


методы машинного обучения, анализ больших данных

Все мы любим посмеяться над дремучим legacy на Java, которое якобы живёт в банках. После прочтения этой статьи у вас появится понимание другой грани этой истории. Оказывается, конкретно в Сбербанк-Технологиях есть целые большие отделы, занимающиеся прорывными технологиями и направлениями, включая Big Data и Machine Learning. Более того, скоро мы можем оказаться в мире, где Machine Learning встроен чуть ли не в каждую кофеварку. К добру или к худу, но Internet of Things, следящий за нами тысячью

2018-01-29 18:57

Апелляционный суд запретил Double Data использовать открытые данные пользователей «ВКонтакте».


анализ больших данных, исследование социальных сетей

«Апелляционная инстанция отменила решение суда первой инстанции и частично удовлетворила иск «ВКонтакте» в части запрета использования Double Data принадлежащей истцу базы данных, отказав во взыскании какой-либо компенсации», — сообщили в фонде «Сколково», чьим резидентом является Double Data. Суд также не удовлетворил изначальные требования «ВКонтакте» об уничтожении всех носителей, на которых хранились данные.

Double Data создаёт продукты для снижения просроченной задолженности и

2018-01-09 13:00

Лучшие языки программирования для Data Science


большие данные big data, разработка по

Рассмотрим языки программирования для . Как они появились, их сильные и слабые стороны, а также отметим простые для старта.

R

Язык R появился на свет в 1995 году как прямой наследник более старого языка S. Созданный с использованием C, фортрана и себя самого, R поддерживается организацией R Foundation for Statistical Computing.

Лицензия

Бесплатный.

Плюсы Отличный ассортимент качественных специализированных пакетов с открытым исходным кодом. R имеет пакеты практически

2018-01-06 00:19

Машинное обучение в электронной коммерции – практика использования и подводные камни


алгоритмы машинного обучения, большие данные big data

Доклад позволит соориентироваться в плеяде современных алгоритмов машинного обучения в разрезе прикладного использования для электронной коммерции и выбрать необходимые бесплатные библиотеки для реализации задач. Мы поделимся практическим опытом и историями успеха использования данных технологий в продакшн-среде.

Также особое внимание уделим технике использования популярных платформ и библиотек: Apache Spark, Spark MLlib, Hadoop, Amazon Kinesis, deeplearning4j. Отдельно остановимся на

2018-01-03 14:00

Прикладные задачи анализа данных. Евгений Соколов


алгоритмы машинного обучения, большие данные big data

Интенсив для преподавателей НИУ ВШЭ в рамках проекта Data Culture. Как современные методы машинного обучения и искусственного интеллекта меняют подходы во многих научных областях? Почему владение основами этих методов становится частью общей научной культуры исследователя вне зависимости от конкретной предметной области? Ответы на эти и другие вопросы в рамках лекции даёт Евгений Соколов, Заместитель руководителя Департамент больших данных и информационного поиска Факультета компьютерных наук

2018-01-03 03:18

Триггеры в аналитике данных на Большом адронном коллайдере


алгоритмы машинного обучения, большие данные big data

Для того чтобы принять решение, сохранять нам фотографию события, происходящего на коллайдере, или нет, нам необходима система триггеров. Дело в том, что события происходят очень часто. Пересечение двух встречных сгустков протонов происходит с частотой порядка нескольких десятков миллионов раз в секунду. К сожалению, каждая фотография события занимает несколько мегабайтов и у нас нет возможности сохранять все события. Да и, кроме того, большинство событий не являются интересными с точки зрения

2017-12-30 17:49

Мультимодальная кластеризация для анализа данных


анализ больших данных, алгоритмы кластеризации

Мультимодальная кластеризация для анализа данных | Конференция: Машинное обучение и анализ алгоритмов | Лектор: Дмитрий Игнатов | Организатор: CSClub

2017-12-23 12:20

МТС для ритейла


методы машинного обучения, анализ больших данных

Открывайте точки продаж там, где они нужны вашим клиентам, и повышайте доходность розничной сети! На основе технологии Big Data специалисты МТС анализируют множество параметров, которые позволяют определить наиболее актуальную и эффективную локацию для открытия розничного магазина, кафе или предприятия сферы услуг. К примеру, социально-демографические характеристики, пешеходный и автомобильный трафик, время нахождения абонентов в районе предполагаемого открытия, типы гаджетов, использование
 

2018-05-10 10:21

Выявление преступных группировок, ворующих из магазинов – Data Mining


анализ больших данных

Группа из 3–4 лиц по предварительному сговору способна вынести из большого магазина типа «Ашана» или «Перекрёстка» товара до 400 тысяч рублей в месяц. Если обычные шоплифтеры просто мирно воруют колбасу, протаскивая её под одеждой или ещё где, то эти парни оказываются в разы наглее и деструктивнее. Разница вот в чём. Во-первых, они имеют возможность запутать всю систему наблюдения, выстроенную для поиска одиночных воров. Самая простая связка — один берёт товар, передаёт незаметно другому, тот

2018-05-03 16:00

Математика больших данных тензоры, неи?росети, баи?есовскии? вывод - Ветров Д.П.


анализ больших данных

Математика больших данных: тензоры, нейросети, байесовский вывод

2018-05-01 17:51

Разрабатываем простую модель глубокого обучения для прогнозирования цен акций с помощью TensorFlow


разработка по, реализация нейронной сети, большие данные big data

Эксперт в области data science и руководитель компании STATWORX Себастьян Хайнц опубликовал на Medium руководство по созданию модели глубокого обучения для прогнозирования цен акций на бирже с использованием фреймворка TensorFlow. Мы подготовили адаптированную версию этого полезного материала. Автор разместил итоговый Python-скрипт и сжатый датасет в своем репозитории на GitHub.

Импорт и подготовка данных

Хайнц экспортировал биржевые данных в csv-файл. Его датасет содержал n = 41266 минут

2018-02-13 01:11

Datalore: открываем бета-версию приложения для анализа данных на Python


анализ больших данных

В рядах инструментов JetBrains пополнение. Мы запускаем открытую бета-версию Datalore — умной веб-среды для анализа и визуализации данных на языке Python.

Машинное обучение уверенно захватывает мир: алгоритмы интеллектуального анализа данных стоят за современными коммерческими разработками и исследованиями. Мы разработали приложение, с которым решать задачи машинного обучения легко и приятно: все необходимые инструменты data science доступны из коробки, а умный редактор кода на Python

2018-01-28 17:19

052. ML в киберспорте – Пётр Ромов


большие данные big data

Подборка русскоязычных выступлений с конференции «Data Ёлка 2017», объединяющей специалистов в области Data Science для подведения итогов года:

1. ML в киберспорте.

2. Алиса: что внутри?

3. Соревнования по анализу данных.

4. Технологии беспилотных автомобилей.

5. NIPS, будущее и хайп.

2018-01-18 16:59

Feature Engineering, о чём молчат online-курсы


методы машинного обучения, анализ больших данных

Sherlock by ThatsWhatSheSayd

Чтобы стать великим сыщиком, Шерлоку Холмсу было достаточно замечать то, чего не видели остальные, в вещах, которые находились у всех на виду. Мне кажется, что этим качеством должен обладать и каждый специалист по машинному обучению. Но тема Feature Engineering’а зачастую изучается в курсах по машинному обучению и анализу данных вскользь. В этом материале я хочу поделиться своим опытом обработки признаков с начинающими датасаентистами. Надеюсь, это поможет

2017-10-25 14:20

Артур Хачуян- «Настоящая Big Data в рекламе»


анализ больших данных, Семинары

Артур Хачуян ушел из рекламного агентства «Апостол» Тины Канделаки — и весь отдел кибернетики ушел вместе с ним.

Сегодня они круглосуточно скачивают открытую информацию из соцсетей, блогов, форумов и медиа. Бесконечные массивы данных связывают и анализируют по заказу клиентов: бренды хотят прицельно таргетировать рекламу и угадывать желания клиентов, журналисты — проводить расследования, госорганы — находить преступников.

Ребятам есть что интересного показать и рассказать. Обязательно

2017-10-22 13:00

Математика больших данных: тензоры, нейросети, байесовский вывод - Ветров Д.П.


большие данные big data

Математика больших данных.

Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейронов и как можно осуществить его без переобучения? Можно ли обрабатывать информацию "на лету", не сохраняя поступающие последовательно данные? Как оптимизировать функцию за время меньшее чем уходит на ее вычисление в одной точке? Что дает обучение по слаборазмеченным данным? И почему для решения всех перечисленных

2017-10-06 15:35

Топливо для ИИ: подборка открытых датасетов для машинного обучения


большие данные big data

Связанные проекты сообщества Open Data (проект Linked Open Data Cloud). Многие датасеты на этой диаграмме могут включать в себя данные, защищенные авторским правом, и они не упоминаются в данной статье

Если вы прямо сейчас не делаете свой ИИ, то другие будут делать его вместо вас для себя. Ничто более не мешает вам создать систему на основе машинного обучения. Есть открытая библиотека глубинного обучения TensorFlow, большое количество алгоритмов для обучения в библиотеке Torch,

2017-08-17 10:07

Основы нейронных сетей и Deep Learning


большие данные big data

Подборка выступлений с Moscow Data Science Meetup — русскоязычного мероприятия для интересующихся Data Science, анализом, майнингом и визуализацией структурированных и неструктурированных данных.

Прикрепленные видео:

1. Основы нейронных сетей и Deep Learning — Алексей Озерин.

2–3. Обработка больших данных при помощи Apache Spark — Виталий Худобахшов.

4. Как перестать бояться и начать решать convai.io — Валентин Малых.

5. Градиентный бустинг: возможности, особенности и фишки

2017-08-16 17:08

#1 Большие данные в большой компании | Включайся!


большие данные big data

Что такое Big Data и как это на самом деле влияет на мир вокруг нас?

Прямо сейчас в прямом эфире Екатерина Линкевич – директор по аналитике больших данных большой компании МегаФон.

2017-08-10 19:07

Лекция 1: Общее понятие о больших данных


большие данные big data

Видеокурс «Введение в аналитику больших массивов данных».

Русскоязычный курс, знакомящий слушателей с основными понятиями в области аналитической обработки больших данных. В курсе изложены основы машинного обучения, визуализации и хранения больших данных.

В данном видеокурсе:

1. Общее понятие о больших данных.

2. Основные вызовы больших данных.

3. Определение термина «большие данные».

4. Процесс аналитики.

5. Введение в когнитивный анализ данных.

6.

2017-08-05 13:10

37 причин, почему ваша нейросеть не работает


большие данные big data, реализация нейронной сети

Сеть обучалась последние 12 часов. Всё выглядело хорошо: градиенты стабильные, функция потерь уменьшалась. Но потом пришёл результат: все нули, один фон, ничего не распознано. «Что я сделал не так?», — спросил я у компьютера, который промолчал в ответ.

Почему нейросеть выдаёт мусор (например, среднее всех результатов или у неё реально слабая точность)? С чего начать проверку?

Сеть может не обучаться по ряду причин. По итогу многих отладочных сессий я заметил, что часто делаю одни и те же

2017-07-22 19:07

Методы и системы обработки больших данных | Иван Пузыревский


анализ больших данных

Видеокурс «Методы и системы обработки больших данных».

Русскоязычный курс, посвященный методам построения систем обработки больших данных и существующим инструментам в этой области. Цель курса — дать понимание внутреннего устройства, механики работы, области применимости существующих решений, осветить сильные и слабые стороны, научить практическим навыкам анализа больших массивов информации.

В данном видеокурсе:

1. HDFS.

2. MapReduce.

3. HBase.

4. Cassandra.

5.

2017-07-14 11:07

Big Data — всё по этой теме для программистов


алгоритмы машинного обучения, большие данные big data

Всё для изучения Python: 181 бесплатный материал + бонус

В данном списке вы сможете найти материалы для изучения языка Python с целью применения его в анализе данных и не только. Последний раздел — это бонус: если этой подборки вам оказалось... Читать дальше

Уникальное событие: эксперт по Big Data Кристал Валентайн приедет с единственным выступлением в Россию

Информация подтвердилась, на крупнейшей конференции программистов России «Разработка ПО» Кристал Валентайн расскажет, как технологии

2017-07-09 10:33

011. Neural conversational models: как научить нейронную сеть светской беседе — Борис Янгель


анализ больших данных

Подборка лекций с Data & Science — конференции, на которой ведущие учёные и эксперты рассказывают о применении больших данных в фундаментальной и прикладной науке.

Прикрепленные к посту видео:

1. Neural conversational models: как научить нейронную сеть светской беседе — Борис Янгель.

2. Goal-Oriented диалоговые движки — Евгений Волков.

3. What’s hot in bioinformatics? From data to implementations — Андрей Афанасьев.

4. Алгоритмические задачи в биоинформатике — Игнатий

2017-06-28 10:33

Автоматическое извлечение семантической информации из текста - Иван Титов


изучение социальных сетей, системы технического зрения, лингвистика, большие данные big data

Подборка лекций от ведущих исследователей анализа данных, информационного поиска и других областей.

Прикрепленные видео:

1. Автоматическое извлечение семантической информации из текста — Иван Титов.

2. Квантовое хеширование — Фарид Аблаев.

3. Будущее нейрокомпьютерных интерфейсов — Nathan Intrator.

4. Компьютерное зрение — Andrea Vedaldi.

5. Экстремальные свойства графов, возникающие из социальных сетей — Konstantin Avrachenkov.

6. Торги в реальном времени — Jun

2017-06-19 06:02

Ловись Data большая и маленькая! (Краткий обзор курсов по Data Science от Cognitive Class)


анализ больших данных

В последнее время все чаще натыкаюсь на упоминание о «Data Science» или по-нашему «Наука о данных». Не являюсь специалистом в области IT и на протяжении всей жизни не дружу с мат. анализом и статистикой, поэтому я достаточно долго проходил мимо этого вопроса и наверное, продолжал бы проходить стороной, но в какой-то момент любопытство взяло верх.

Итак, Cognitive Class, он же Big Data University от IBM (иногда сокращенно BDU) – портал с бесплатными курсами по тематике близкой к BIG Data и

2017-05-15 22:31

Введение в обработку Больших Данных


анализ больших данных

Фразы «Большие данные», «искусственный интеллект» мы слышим сегодня буквально каждый день. Для многих они ассоциируются с фильмами Матрица / Терминатор, а вовсе не с реальной жизнью. И уж тем более не с реальными профессиями в области IT.

На мастер-классе я расскажу, почему IT-специалистам (особенно будущим) крайне важно понимать эти термины сейчас. Мы обсудим базовые понятия и инструменты в области обработки Больших Данных и где этому научиться.

Дополнительные материалы по теме:

2017-04-30 07:28

Весь мир — BIG DATA


алгоритмы машинного обучения, большие данные big data

Практически любой близкий к IT-индустрии человек хоть раз да слышал эти загадочные два слова — «BIG DATA». Что за ними скрывается, где применяются технологии обработки больших объемов данных и с чего можно начать при их изучении, рассказал Евгений Чернов — преподаватель образовательного проекта «Техносфера» и создатель онлайн курсов по Hadoop — системе обработки больших объемов данных.

В первую очередь с большими объемами данных столкнулись, конечно же, большие компании, такие как Google.

2017-04-23 20:46

Артур Хачуян: «Настоящая Big Data в рекламе»


анализ больших данных

Познавательная лекция о том, как действительно работает Big Data в рекламе сегодня. Можно извлечь кучу идей для своих проектов! ?

2017-03-21 06:43

Открытый курс машинного обучения. Тема 4. Линейные модели классификации и регрессии


анализ больших данных, методы машинного обучения, пример нейронной сети

Сегодня мы детально обсудим очень важный класс моделей машинного обучения – линейных.

Ключевое отличие нашей подачи материала от аналогичного в курсах эконометрики и статистики – это акцент на практическом применении линейных моделей в реальных задачах (хотя и математики тоже будет немало).

Пример двух таких задач – это соревнования Kaggle Inclass по прогнозированию популярности статьи на Хабре и по идентификации взломщика в Интернете по его последовательности переходов по сайтам. Домашним

2017-03-19 16:06

Лекция 1: Задачи Data Mining


алгоритмы кластеризации данных, большие данные big data

Алгоритмы интеллектуальной обработки больших объемов данных

1. Задачи Data Mining

2. Задача кластеризации и ЕМ-алгоритм

3. Различные алгоритмы кластеризации

4. Задача классификации

5. Обработка текстов, Naive Bayes

6. Линейные модели для классификации и регрессии

7. Машина опорных векторов

8. Методы снижения размерности пространства

9. Алгоритмические композиции

Все 13 лекций доступны по ссылке:

https://vk.com/videos-54530371?section=album_56085995

2017-01-11 13:12

Машинное обучение — это легко


алгоритмы машинного обучения, большие данные big data

В данной статье речь пойдёт о машинном обучении в целом и взаимодействии с датасетами. Если вы начинающий, не знаете с чего начать изучение и вам интересно узнать, что такое «датасет», а также зачем вообще нужен Machine Learning и почему в последнее время он набирает все большую популярность, прошу под кат. Мы будем использовать Python 3, так это как достаточно простой инструмент для изучения машинного обучения.

Для кого эта статья? Каждый, кому будет интересно затем покопаться в истории за

2016-09-11 21:03

"Опыт участия в Microsoft Malware Classification Challenge" Михаил Трофимов (Machine Learning Works)


большие данные big data, распознавание образов, алгоритмы машинного обучения, искусственные нейронные сети, реализация нейронной сети

Несколько докладов по анализу данных и машинному обучению с недавнего Python Data Science meetup

1. О том, как проанализировать 200 Гб данных на ноутбуке, какие проблемы могут возникнуть в процессе и как автор с ними боролся.

2. Об опыте построения алгоритма классификации изображений автомобилей.

3. Как научить приложение распознавать категории объявлений по изображениям.