Рост на глазах: как запустить стартап в области компьютерного зрения |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-09-03 23:20 Алексей Мяков, директор подразделения компьютерного зрения в Internet of Things Group (IOTG) компании Intel, рассказывает, как новейшая технология превращается в бизнес, в том числе в России Фото: Gregor Fischer / DPA / ТАСС По прогнозам Илона Маска, полноценный искусственный интеллект будет создан к 2040 году. Но уже сейчас компьютер решает массу задач быстрее и лучше, чем человек, в частности извлекает информацию из изображений разного типа. Это область технологий, получившая название компьютерного зрения. Глаза и мозг Если искусственный интеллект создается с оглядкой на нервную систему и мышление человека, то компьютерное зрение пытается имитировать, как человек видит. Мы не просто воспринимаем объект глазами, но и анализируем мозгом: определяем цвет, форму, проводим ассоциации с уже известными нам объектами. Алгоритмы компьютерного зрения работают точно так же: они фиксируют объект в объективе камеры, а затем идентифицируют и анализируют в соответствии с заданными характеристиками и правилами. Для этого нужно заранее обучить компьютер на большом количестве специально подготовленных изображений — чтобы знал, что конкретно ему нужно увидеть. Долгое время применение компьютерного зрения для решения практических задач сдерживали технологические сложности — большая ресурсоемкость и высокие затраты на внедрение. В последние два-три года ситуация стала резко меняться: видеосенсоры и камеры дешевеют и встраиваются во всевозможные устройства, вычислительные мощности растут, алгоритмы совершенствуются. Аналитики прогнозируют взрывной рост рынка решений в области компьютерного зрения: по оценкам исследовательского агентства Tractica, к 2025 году его объем достигнет $26,2 млрд. Увидеть нишу Системы видеонаблюдения используются в самых разных сферах бизнеса и экономики. Но данные, которые фиксируют камеры, в 90–95% случаев никак не интерпретируются. Их анализ мог бы повысить эффективность той или иной области. Вот какие задачи можно решать с помощью компьютерного зрения. 1. Биометрия. С помощью компьютерного зрения можно считывать разные биометрические параметры — лицо, радужную оболочку глаз, отпечатки пальцев. Технология распознавания лиц считается самой популярной и совершенствуется быстрее всего. «Умная» система позволяет автоматически получать из видеопотока не отдельные кадры, а события — такой-то человек был там-то в такое-то время — и сопоставлять их друг с другом. Технологию активно внедряют как госструктуры, чтобы обеспечить общественную безопасность, так и коммерческие организации. Например, в школе программирования, запущенной Сбербанком в 2018 году, тестируется система контроля доступа людей в помещение, разработанная компанией VisionLabs. Камеры на входе работают как FaceID, и посетители проходят через турникет, не доставая пропуск из кармана. В ретейле и банкинге такие системы позволят вам расплачиваться в магазинах без наличных и банковских карт, подтверждая транзакцию лишь взглядом в камеру. 2. Медицина. Искусственный интеллект не хуже докторов может справиться с анализом медицинских данных и постановкой диагноза. Это доказывают соревнования, неоднократно проводимые в последние годы в Китае, где явный дефицит квалифицированного медперсонала. Например, во время конкурса в Пекине в 2018 году компьютер и врачи изучали снимки 225 пациентов с подозрением на опухоль головного мозга. Машина поставила верный диагноз в 87% случаев за 15 минут, в то время как команда докторов из лучших клиник страны — в 66% за 30 минут. Технологии компьютерного зрения имеют в этом процессе критическое значение: чем быстрее и точнее производится обработка рентгеновских снимков, КТ, МРТ, УЗИ и других изображений, тем выше вероятность, что удастся своевременно с необходимой точностью распознать отклонение от нормы. В России тоже начинают появляться стартапы в этой нише. Компания Botkin.AI занимается повторным анализом результатов разного рода медицинских исследований, загруженных в архивы учреждений. Во время пилотной обкатки платформы на Ямале, например, обработано 600 снимков компьютерных томографий и в 49 случаях заподозрены признаки рака легких на ранних стадиях. В половине из них диагноз подтвердился. Сейчас идет речь о внедрении сервиса в федеральном масштабе. 3. Автономные системы вождения. В основе функционирования беспилотных автомобилей лежит целый комплекс интеллектуальных систем. Но именно компьютерное зрение служит ключевой технологией. Оно позволяет автономной машине распознать встречные и соседние объекты, оценить расстояние до них, предсказать вероятность и не допустить возникновения критической ситуации. Сегодня этим направлением плотно занимаются большинство крупных автопроизводителей (Tesla, Ford, General Motors, Hyundai и др.) и технологических компаний, которые не только ведут собственные разработки, но и часто покупают профильные компании, стартапы с передовыми технологиями и талантливыми командами. Имеются и нишевые истории успеха. Например, российский стартап RoboCV специализируется на автономных складских роботах-погрузчиках для компаний уровня Volkswagen и «Газпром нефти», а компания Vist Robotics — на системах для беспилотных карьерных самосвалов, которые уже обкатываются в Марокко. 4. Автоматизация промышленности. Компьютерное зрение — одна из основных технологий экосистемы «Индустрия 4.0» и уже сейчас широко используется на производствах. Причем для решения самых разных задач — от обеспечения безопасности (контрольно-пропускной режим, выявление задымлений, проверка наличия касок на рабочих и т.д.) до контроля качества. С помощью «умных» камер можно определять движение того или иного объекта по сборочной линии с момента производства заготовки до конечного продукта. А по пути выявлять сбои, дефекты и даже хищения, нередко быстрее и точнее, чем это могут делать люди. В прошлом году b2b-платформу с функциями компьютерного зрения, предназначенную в том числе для промышленности, представила компания Mail.Ru Group. Она же оценила объем этого рынка в России — до 2 млрд руб. к 2019–2020 годам. 5. Видеоаналитика. Компьютер может не только распознавать отдельные предметы, но и анализировать контекст — ситуации, в которых эти предметы задействованы. Машину можно обучить, чтобы она выявляла любые аномалии: оставленные вещи, пожары на спутниковых снимках, пересечение границ и т.д. По этому принципу уже работает система автоматического выписывания штрафов за превышение скорости — выявляет нарушителей по регистрационным номерам автомобилей. Есть и нетипичные варианты применения. Например, в сельском хозяйстве: компания Bosch вместе со стартапом Amazone разработала робота, который помогает выращивать овощи — спаржу, морковь и др. С помощью встроенных камер он распознает и выпалывает сорняки, а также определяет состояние растущих овощей и при необходимости поливает. Зри в корень Классическая ошибка стартапа — отталкиваться от инновационной технологии в его распоряжении, а не от потребностей рынка и сильной бизнес-модели. В идеале компании, которая хочет начать бизнес, связанный с компьютерным зрением, нужна команда «о двух головах». В ней должен быть тот, кто хорошо понимает «боль» какой-либо индустрии и видит проблему, которую можно решить с помощью искусственного интеллекта. И тот, кто знает, какие технологии могут в этом помочь. Бизнес-идея — приоритет компании. Оглядитесь по сторонам: вы увидите множество процессов, которые могло бы улучшить компьютерное зрение, от контроля усталости дальнобойщиков на рейсах до систем выявления воришек в магазинах. Доступ к данным — необходимое условие для старта бизнеса в области компьютерного зрения. Именно обширные, разнообразные и релевантные данные отвечают за то, насколько точной будет математическая модель в основе вашей технологии. Например, компьютеру, чтобы научить качественно распознавать лица в видеопотоке, придется «скормить» как минимум 1 млн изображений, в то время как для успешного распознавания действий нужно собрать по крайней мере несколько десятков видео с каждым из них. Массив данных сначала нужно разметить, то есть присвоить каждой картинке или видео теги с правильной информацией. Для разметки используется специальное программное обеспечение. Затраты на сбор и разметку данных могут достигать сотен тысяч долларов — для небольшого стартапа неподъемная сумма. Поэтому стоит заранее подумать о вариантах взаимовыгодного сотрудничества, как это делает упомянутая выше Botkin.AI: компания получает доступ к медицинским данным, а в обмен предлагает услуги по оцифровке и упорядочению архивов. Кроме того, уже появились не только платные, но и бесплатные инструменты с открытым кодом. Программные средства для компьютерного зрения развиваются по пути упрощения разработки и демократизации доступа. ПО помогает ускорить процесс создания приложений для систем компьютерного зрения и позволяет оптимально запускать код на разнообразных аппаратных платформах, почти не меняя его. Другими словами, можно прорабатывать бизнес-идею, не привязываясь к какому-то определенному «железу». Аппаратные средства, к которым относятся камеры, сенсоры, серверы и прочее оборудование и инфраструктура для работы, — важная, но далеко не первоочередная составляющая успешного стартапа в сфере компьютерного зрения. Сейчас (за исключением, пожалуй, специализированных аппаратных ускорителей) гораздо больше активности в экосистеме происходит в области программного обеспечения. Подготовкой специалистов в той или иной степени компаниям придется заниматься самостоятельно. Вузы дают сильные знания в области линейной алгебры, математического анализа, дискретной математики, и все это, безусловно, необходимо специалисту по компьютерному зрению. Но учебная программа не успевает меняться с той же скоростью, с какой эволюционируют технологии на рынке. К счастью, есть огромное количество книг, онлайн-курсов и корпоративных курсов компаний-вендоров на тему искусственного интеллекта и компьютерного зрения, которые компании могут использовать, чтобы актуализировать знания специалистов. Сегмент компьютерного зрения остается инвестиционно емким, а порог входа в него в ближайшие годы будет снижаться. Происходит качественный рывок вычислительных алгоритмов. Согласно Национальному институту стандартов и технологий Министерства торговли США, компьютер уже научился допускать меньше ошибок при распознавании объектов, чем человек. Пожалуй, единственным сдерживающим фактором для развития технологий машинного зрения может стать запутанная регуляторика в области доступа и распоряжения теми или иными массивами данных. Но и это обстоятельство решаемо: скажем, МВД и правительство Москвы успешно взаимодействуют в вопросе обмена данными по базе государственных регистрационных номеров автомобилей. Очевидно, что в будущем компьютерное зрение продолжит менять целые отрасли и создавать новые возможности для бизнеса. Источник: pro.rbc.ru Комментарии: |
|