Кластеризация RNA-Seq стала еще умнее.

МЕНЮ


Новости ИИ
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАТрансгуманизмЛингвистика, обработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

АРХИВ


Август 2017
Июль 2017
Июнь 2017
Май 2017
Апрель 2017
Март 2017
Февраль 2017
Январь 2017
Декабрь 2016
Ноябрь 2016
Октябрь 2016
Сентябрь 2016
Август 2016
Июль 2016
Июнь 2016
Май 2016
Апрель 2016
Март 2016
Февраль 2016
Январь 2016
0000

RSS


RSS новости
Ураган харви в США

Новостная лента форума ailab.ru

2017-08-31 10:16

Кластеризация

пример графика t-SNE кластеризации DIMM-SC

Секвенирование транскриптомов одиночных клеток (scRNA-Seq) стало революционным инструментом для изучения клеточных и молекулярных процессов на уровне одиночной клетки. Среди существующих технологий недавно разработанная платформа на основе технологии droplet обеспечивает эффективную параллельную обработку тысяч одиночных клеток с прямым подсчетом копий транскриптов с использованием Unique Molecular Identifier (UMI). Несмотря на технологические достижения, надежные статистические методы и вычислительные инструменты по-прежнему отсутствуют для анализа данных scRNA-Seq на основе технологии droplet. В частности, подходы для кластеризации крупномасштабных транскриптомных данных одиночных клеток все еще недостаточно изучены. Исследователи из Департамента биостатистики Университета Питтсбурга разработали DIMM-SC, новую статистическую модель на основе распределения Дирихле для кластеризации транскриптомных данных scRNA-Seq на основе технологии droplet. Этот подход явно моделирует данные каунтов UMI из экспериментов scRNA-Seq и характеризует вариацию в разных кластерах клеток через распределение Дирихле. Для вывода параметров использутеся алгоритм максимизации ожиданий.

Было проведено комплексное моделирование данных для оценки DIMM-SC и сравнеие его с существующими методами кластеризации, такими как K-means, CellTree и Seurat. Кроме того, авторы проанализировали общедоступные наборы данных scRNA-Seq с известными кластерными метками и стандартизированными наборами данных scRNA-Seq из исследования системного склероза с использованием предшествующих биологических знаний для проверки и проверки DIMM-SC. Как симуляционные исследования, так и анализы реальных данных показали, что в целом DIMM-SC обеспечивает существенно более высокую точность и значительно меньшую вариабельность кластеризации по сравнению с другими существующими методами. Что еще более важно, в качестве основанного на модели подхода DIMM-SC может количественно определять неопределенность кластеризации для каждой отдельной клетки, что облегчает строгий статистический контроль надежности результатов и биологической интерпретации, что, как правило, недоступно для существующих методов кластеризации.

Ссылка на R-пакет

Ссылка на статью 


Источник: compbiol.ru