Рост на глазах: как запустить стартап в области компьютерного зрения

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2019-09-03 23:20

ит новости

Алексей Мяков, директор подразделения компьютерного зрения в Internet of Things Group (IOTG) компании Intel, рассказывает, как новейшая технология превращается в бизнес, в том числе в России

Фото: Gregor Fischer / DPA / ТАСС

По прогнозам Илона Маска, полноценный искусственный интеллект будет создан к 2040 году. Но уже сейчас компьютер решает массу задач быстрее и лучше, чем человек, в частности извлекает информацию из изображений разного типа. Это область технологий, получившая название компьютерного зрения.

Глаза и мозг

Если искусственный интеллект создается с оглядкой на нервную систему и мышление человека, то компьютерное зрение пытается имитировать, как человек видит.

Мы не просто воспринимаем объект глазами, но и анализируем мозгом: определяем цвет, форму, проводим ассоциации с уже известными нам объектами. Алгоритмы компьютерного зрения работают точно так же: они фиксируют объект в объективе камеры, а затем идентифицируют и анализируют в соответствии с заданными характеристиками и правилами. Для этого нужно заранее обучить компьютер на большом количестве специально подготовленных изображений — чтобы знал, что конкретно ему нужно увидеть.

Долгое время применение компьютерного зрения для решения практических задач сдерживали технологические сложности — большая ресурсоемкость и высокие затраты на внедрение. В последние два-три года ситуация стала резко меняться: видеосенсоры и камеры дешевеют и встраиваются во всевозможные устройства, вычислительные мощности растут, алгоритмы совершенствуются.

Аналитики прогнозируют взрывной рост рынка решений в области компьютерного зрения: по оценкам исследовательского агентства Tractica, к 2025 году его объем достигнет $26,2 млрд.

Увидеть нишу

Системы видеонаблюдения используются в самых разных сферах бизнеса и экономики. Но данные, которые фиксируют камеры, в 90–95% случаев никак не интерпретируются. Их анализ мог бы повысить эффективность той или иной области. Вот какие задачи можно решать с помощью компьютерного зрения.

1. Биометрия. С помощью компьютерного зрения можно считывать разные биометрические параметры — лицо, радужную оболочку глаз, отпечатки пальцев.

Технология распознавания лиц считается самой популярной и совершенствуется быстрее всего. «Умная» система позволяет автоматически получать из видеопотока не отдельные кадры, а события — такой-то человек был там-то в такое-то время — и сопоставлять их друг с другом. Технологию активно внедряют как госструктуры, чтобы обеспечить общественную безопасность, так и коммерческие организации.

Например, в школе программирования, запущенной Сбербанком в 2018 году, тестируется система контроля доступа людей в помещение, разработанная компанией VisionLabs. Камеры на входе работают как FaceID, и посетители проходят через турникет, не доставая пропуск из кармана. В ретейле и банкинге такие системы позволят вам расплачиваться в магазинах без наличных и банковских карт, подтверждая транзакцию лишь взглядом в камеру.

2. Медицина. Искусственный интеллект не хуже докторов может справиться с анализом медицинских данных и постановкой диагноза. Это доказывают соревнования, неоднократно проводимые в последние годы в Китае, где явный дефицит квалифицированного медперсонала.

Например, во время конкурса в Пекине в 2018 году компьютер и врачи изучали снимки 225 пациентов с подозрением на опухоль головного мозга. Машина поставила верный диагноз в 87% случаев за 15 минут, в то время как команда докторов из лучших клиник страны — в 66% за 30 минут.

Технологии компьютерного зрения имеют в этом процессе критическое значение: чем быстрее и точнее производится обработка рентгеновских снимков, КТ, МРТ, УЗИ и других изображений, тем выше вероятность, что удастся своевременно с необходимой точностью распознать отклонение от нормы.

В России тоже начинают появляться стартапы в этой нише. Компания Botkin.AI занимается повторным анализом результатов разного рода медицинских исследований, загруженных в архивы учреждений. Во время пилотной обкатки платформы на Ямале, например, обработано 600 снимков компьютерных томографий и в 49 случаях заподозрены признаки рака легких на ранних стадиях. В половине из них диагноз подтвердился. Сейчас идет речь о внедрении сервиса в федеральном масштабе.

3. Автономные системы вождения. В основе функционирования беспилотных автомобилей лежит целый комплекс интеллектуальных систем. Но именно компьютерное зрение служит ключевой технологией. Оно позволяет автономной машине распознать встречные и соседние объекты, оценить расстояние до них, предсказать вероятность и не допустить возникновения критической ситуации.

Сегодня этим направлением плотно занимаются большинство крупных автопроизводителей (Tesla, Ford, General Motors, Hyundai и др.) и технологических компаний, которые не только ведут собственные разработки, но и часто покупают профильные компании, стартапы с передовыми технологиями и талантливыми командами. Имеются и нишевые истории успеха. Например, российский стартап RoboCV специализируется на автономных складских роботах-погрузчиках для компаний уровня Volkswagen и «Газпром нефти», а компания Vist Robotics — на системах для беспилотных карьерных самосвалов, которые уже обкатываются в Марокко.

4. Автоматизация промышленности. Компьютерное зрение — одна из основных технологий экосистемы «Индустрия 4.0» и уже сейчас широко используется на производствах. Причем для решения самых разных задач — от обеспечения безопасности (контрольно-пропускной режим, выявление задымлений, проверка наличия касок на рабочих и т.д.) до контроля качества.

С помощью «умных» камер можно определять движение того или иного объекта по сборочной линии с момента производства заготовки до конечного продукта. А по пути выявлять сбои, дефекты и даже хищения, нередко быстрее и точнее, чем это могут делать люди. В прошлом году b2b-платформу с функциями компьютерного зрения, предназначенную в том числе для промышленности, представила компания Mail.Ru Group. Она же оценила объем этого рынка в России — до 2 млрд руб. к 2019–2020 годам.

5. Видеоаналитика. Компьютер может не только распознавать отдельные предметы, но и анализировать контекст — ситуации, в которых эти предметы задействованы.

Машину можно обучить, чтобы она выявляла любые аномалии: оставленные вещи, пожары на спутниковых снимках, пересечение границ и т.д. По этому принципу уже работает система автоматического выписывания штрафов за превышение скорости — выявляет нарушителей по регистрационным номерам автомобилей.

Есть и нетипичные варианты применения. Например, в сельском хозяйстве: компания Bosch вместе со стартапом Amazone разработала робота, который помогает выращивать овощи — спаржу, морковь и др. С помощью встроенных камер он распознает и выпалывает сорняки, а также определяет состояние растущих овощей и при необходимости поливает.

Зри в корень

Классическая ошибка стартапа — отталкиваться от инновационной технологии в его распоряжении, а не от потребностей рынка и сильной бизнес-модели.

В идеале компании, которая хочет начать бизнес, связанный с компьютерным зрением, нужна команда «о двух головах». В ней должен быть тот, кто хорошо понимает «боль» какой-либо индустрии и видит проблему, которую можно решить с помощью искусственного интеллекта. И тот, кто знает, какие технологии могут в этом помочь.

Бизнес-идея — приоритет компании. Оглядитесь по сторонам: вы увидите множество процессов, которые могло бы улучшить компьютерное зрение, от контроля усталости дальнобойщиков на рейсах до систем выявления воришек в магазинах.

Доступ к данным — необходимое условие для старта бизнеса в области компьютерного зрения. Именно обширные, разнообразные и релевантные данные отвечают за то, насколько точной будет математическая модель в основе вашей технологии.

Например, компьютеру, чтобы научить качественно распознавать лица в видеопотоке, придется «скормить» как минимум 1 млн изображений, в то время как для успешного распознавания действий нужно собрать по крайней мере несколько десятков видео с каждым из них. Массив данных сначала нужно разметить, то есть присвоить каждой картинке или видео теги с правильной информацией. Для разметки используется специальное программное обеспечение. Затраты на сбор и разметку данных могут достигать сотен тысяч долларов — для небольшого стартапа неподъемная сумма. Поэтому стоит заранее подумать о вариантах взаимовыгодного сотрудничества, как это делает упомянутая выше Botkin.AI: компания получает доступ к медицинским данным, а в обмен предлагает услуги по оцифровке и упорядочению архивов. Кроме того, уже появились не только платные, но и бесплатные инструменты с открытым кодом.

Программные средства для компьютерного зрения развиваются по пути упрощения разработки и демократизации доступа. ПО помогает ускорить процесс создания приложений для систем компьютерного зрения и позволяет оптимально запускать код на разнообразных аппаратных платформах, почти не меняя его. Другими словами, можно прорабатывать бизнес-идею, не привязываясь к какому-то определенному «железу».

Аппаратные средства, к которым относятся камеры, сенсоры, серверы и прочее оборудование и инфраструктура для работы, — важная, но далеко не первоочередная составляющая успешного стартапа в сфере компьютерного зрения. Сейчас (за исключением, пожалуй, специализированных аппаратных ускорителей) гораздо больше активности в экосистеме происходит в области программного обеспечения.

Подготовкой специалистов в той или иной степени компаниям придется заниматься самостоятельно. Вузы дают сильные знания в области линейной алгебры, математического анализа, дискретной математики, и все это, безусловно, необходимо специалисту по компьютерному зрению. Но учебная программа не успевает меняться с той же скоростью, с какой эволюционируют технологии на рынке. К счастью, есть огромное количество книг, онлайн-курсов и корпоративных курсов компаний-вендоров на тему искусственного интеллекта и компьютерного зрения, которые компании могут использовать, чтобы актуализировать знания специалистов.

Сегмент компьютерного зрения остается инвестиционно емким, а порог входа в него в ближайшие годы будет снижаться. Происходит качественный рывок вычислительных алгоритмов. Согласно Национальному институту стандартов и технологий Министерства торговли США, компьютер уже научился допускать меньше ошибок при распознавании объектов, чем человек. Пожалуй, единственным сдерживающим фактором для развития технологий машинного зрения может стать запутанная регуляторика в области доступа и распоряжения теми или иными массивами данных. Но и это обстоятельство решаемо: скажем, МВД и правительство Москвы успешно взаимодействуют в вопросе обмена данными по базе государственных регистрационных номеров автомобилей. Очевидно, что в будущем компьютерное зрение продолжит менять целые отрасли и создавать новые возможности для бизнеса.


Источник: pro.rbc.ru

Комментарии: