Power Idea: кластеризация идей форума АСИ |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-12-27 06:03 В начале июля 2020 года Агентство стратегических инициатив совместно с Фондом «Росконгресс» запустило федеральный форум «Сильные идеи для нового времени», который продлился 5 месяцев и включал в себя несколько этапов. Деньги в мандаринах 272 просмотров
Например, в топ-100 идей по нашему субтреку «Доступность данных. Данные как ресурс» прошли три идеи. Для комфортной работы всех участников форума мы проанализировали идеи форума разбили их на кластеры, о чем расскажем подробнее. Построение графов На крауд-платформу поступило огромное количество идей, которые довольно сложно обработать без использования технологий – всего люди из различных регионов России представили 14 770 идей. Для повышения качества аналитики этих идей, было решено применить инструменты анализа данных. При этом базовая гипотеза состояла в том, что несмотря на четко сформулированные треки и субтреки, могут возникать идеи на их пересечении, близкие по смыслу друг к другу. С этой целью мы и применили расчет авторским алгоритмом АСИ по кластеризации корпуса текстов без обучающей выборки на основе векторизации корпуса и дальнейшей кластеризации векторов с помощью алгоритма на графах. Для составления визуализации мы провели семантический анализ идей. В результате анализа повторяющиеся идеи и идеи, между которыми есть связи, скомпонованы в кластеры. Всего было проанализировано 14 770 идей и выявлено 464 идеи, которые так или иначе связаны между собой. По итогам расчета получилось 47 кластеров. Для интерпретации этих данных и их визуализации, мы использовали открытую библиотеку – force-graph. Дополнительно были визуализированы идеи, отобранные экспертами и народным рейтингом и идеи, наиболее близкие по семантике. Если рассматривать рейтинг идей по народному голосованию, то наиболее популярными темами стали: станции зарядки электромобилей (48420 голосов), поддержка социального предпринимательства (36600 голосов) и социальные услуги (24958 голосов). При этом наиболее популярной темой по связанности идей стал рынок труда – 32 идеи. Еще одна тема, которая волнует людей, связана с проблемой бездомных животных – таких идей 28. На третьем месте тема детей с ОВЗ – 20 связанных идей. Особое внимание у коллег вызвала тема, связанная с борщевиком – этот кластер был в треке «Городское развитие» – 5 идей по борьбе с борщевиком. Для понимания связности наиболее популярных идей, мы выделили топ-15 кластеров. Кроме того, мы посмотрели кластеры в разрезе регионов, которые активно подавали идеи. В качестве примера можно привести Томскую область. Основными направлениями по связанности идей в регионе стали три темы: дети с ОВЗ – 20 идей, меры поддержки для МСП – 13, креативная индустрия – 11. Приоритизация и запрос на сервисы Анализируя идеи, которые поступили на форум, мы увидели сквозную тему по всем направлениям – информационные сервисы. Для нашего субтрека по данными такой инсайт позволил сформировать инициативу, связанную с общественным диалогами по сервисам для их приоритизации. Авторами идей было представлено почти 350 запросов, направленных на создание или поддержку различных сервисов. Больше всего запросов получено по направлению «Новая технологическая стратегия» – 131 идея, из которых 98 находятся в субтреке «Доступность данных. Данные как ресурс». По направлению «Новая социальная стратегия получено 112 запросов, «Новые компетенции» – 45, «Новые идеи для бизнеса» – 23, «Новое городское развитие» – 17, «Современная экономика» – 14, «Новая молодежная повестка» – 7. Обработать эти запросы помогли также алгоритмы анализа данных. Этот же запрос звучит в диалоге с владельцами данных и технологическим компаниями: им важно понимать правила игры, как они могут встроить государственные данные в свои сервисы, а также какими данными могут быть полезны государству. Большой пласт работы проделали разработчики платформы. То качество данных, которые мы получили для визуализации идей заслуживает отдельной благодарности. Про создание воронки идей и работу с сообществом форума команда WikiVote подробно рассказала здесь. Источник: vc.ru Комментарии: |
|