![]() |
![]() |
![]() |
![]() |
Как мы создаем Сognitive Agro Data Factory — самый большой нейронный университет в мире |
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2022-06-06 01:32 Беспилотный автомобили, алгоритмы машинного обучения, реализация нейронной сети
начну с революционного: когда мы внедряем Искусственные мозги C-Pilot в сельхозтехнику, мы немного уподобляемся Создателю. Мы Предмет превращаем в думающее и анализирующее Существо, то есть комбайн с Cognitive Agro Pilot начинает видеть и понимать, что происходит вокруг, а также принимать решения по дальнейшим действиям в рамках той производственной задачи, которая перед ним стоит. В каком-то смысле идет создание нового социального слоя тружеников села — слой агроботов с Искусственным Интеллектом C-Pilot, которые обдумывают и решают поставленные человеком агрозадачи.
По сути это зарождающийся слой существ, который надо массово и правильно учить. У человечества были тысячелетия на развитие эволюционного слоя сознания, у роботов это — месяцы. Но для этого надо создать необходимую среду, масштабную фабрику по обучению Искусственных мозгов и подготовки информации для них. В этой статье мы приоткроем тайны Cognitive Data Factory: комбайнa для сбора и переработки данных для агроотрасли. То по каким учебникам и с какими учителями учатся Ваши дети имеет определяющее значение в их развитии и будущей карьере. Так и в автомотив отрасли — качественные данные и их правильная разметка имеют первостепенное значение для создателей ИИ для беспилотного транспорта и других высокоавтоматизированных систем управления. Cognitive Pilot учится через нашу уникальную Data Factory. Как это устроено внутри? Видеоинформация — пища для роста и обучения нейросеток, составляющих основу любого Искусственного мозга. Когда Маск говорит, что для мозгов Tesla ежедневно собирается информация с 35000 машин в облаке, это лишь слегка преувеличение, но это и база их конкурентного превосходства относительно Mercedes, например. И когда Zoox объявляет, что им нужно еще полмиллирада, чтобы тысячи машин ездили и собирали данные, то все инвесторы воспринимают это очень серьезно. Мы в Cognitive начали готовиться ко всему этому с 2012 года. И сейчас мы с гордостью представляем одну из самых лучших Data Factory в мире. Своя команда лучше аутсорсеров Процессы классификации и разметки данных практически одинаковы для наших сельскохозяйственных и железнодорожных проектов или для трамвая с автопилотом. Мы не стали создавать дублирующие одни и те же функции структуры: в Cognitive Pilot их выполняет один отдел, который поддерживает внутренний сервис для всех проектов. Команда профессионалов работает эффективнее разрозненных специалистов, размазанных тонким слоем по штатному расписанию разных департаментов. К тому же у нас появилась общее хранилище, через которое любой сотрудник компании может получить доступ к собранной смежниками информации. Освоили комбайн — освоим и трактор Рассматривать работу Data Factory лучше всего на примере сельскохозяйственного проекта. У нас уже сделан автопилот для комбайна, который использует видеокамеры, устройство геопозиционирования, а также датчики скорости хода и угла поворота. Теперь настал черед тракторов: информацию наши инженеры собирают в нескольких регионах на полях заинтересованных во внедрении современных решений сельхозпредприятий-партнеров. Съемки идут второй год, поскольку техника задействована в сезонных работах: культивации, посеве, внесении удобрений, прополке, опрыскивании и т.д. Приходится устанавливать несколько видеокамер и вести съемку с разных ракурсов, но механизаторы этого не замечают — их день проходит как обычно. ![]() Сохранить и переработать Собранная на полигонах информация попадает в хранилище — специальный машинный зал. Обязательно делается резервное копирование, чтобы нажитое непосильным трудом не терялось из-за сбоев. Поступившие данные смотрят люди, чтобы отобрать полезные. По агротехническим проектам в Data Factory загружается большой объем видеороликов, поэтому полевые сотрудники также помогают их отсматривать. Часто приходится выбрасывать ненужное, если, к примеру, техника стоит во время перерыва. Для облегчения навигации отобранные файлы переименовываются в соответствии с внутренними правилами и упорядочиваются по т.н. стендам. Также можно посмотреть, какие данные еще не были нарезаны, если часть потока мы не успели обработать. Data Factory позволяет нам учитывать уже размеченные объекты и получать статистику по разметке: например, среднюю скорость на стенде или на эпизоде. Хранится и другая внутренняя информация, которую мы отобрали по определенным критериям. Можно посмотреть на карте, где проходила съемка, какие сенсоры были использованы для записи и т.д. ![]() Из готовых стендов мы формируем тестовые и обучающие выборки. В зависимости от задачи из видео могут браться не все кадры: для автоматизации управления сельхозтехникой часто хватает 1 кадра в секунду, что существенно упрощает обработку. Помимо сельскохозяйственного Data Factory обслуживает и другие проекты компании со своими задачами и требованиями. Теория поля Отобранные видеоролики попадают на разметку, которая зависит от решаемой задачи. Например, классификация всех пикселей изображения по заданным категориям или выделение границы кромки поля. Если у нас появляется новый вид работ или новая сельскохозяйственная культура, обученных нейросетей для обработки видео под них еще нет и первичную разметку кадров приходится делать вручную. На следующих этапах используется автоматизированная предобработка, которая существенно упрощает процесс — для разметки мы применяем созданные внутри компании инструменты, которые постоянно совершенствуются. Ими также занимаются сотрудники отдела Data Factory: помимо разметчиков у нас в штате есть и разработчики, хотя на самом деле жесткое деление по отделам в Cognitive Pilot не практикуется. ![]() Обучаем комбайны После получения сегментационной карты необходимо определить траекторию, по которой будет осуществляться движение комбайна (для самоуправляемых тракторов этот этап еще впереди). Задача решается по-разному в зависимости от режима работы и вида сельскохозяйственной культуры. Можно выделить три режима: уборка по кромке поля, движение по валку и удержание рядков. Уборка по кромке Режим, в котором комбайн движется по полю, удерживая необходимый захват культуры жаткой. По результатам семантической сегментации находится граница между классами «уже скошенное место» и «еще не скошенная культура». В системе координат робота по этой границе строится траектория движения с учетом ширины жатки, высоты культуры, показаний датчиков, предыдущих результатов и других параметров. ![]() Уборка по валкам Валок — лежащий на поле ряд срезанной зерновой культуры. В этом режиме комбайн с установленным подборщиком должен двигаться по направлению рядов. Задача похожа на предыдущую, только теперь необходимо двигаться не по границе классов, а удерживать комбайн в центре сегмента валка. Уборка по рядкам Уборка кукурузы ведется с помощью специальных жаток для рядковых культур. Для этого случая предусмотрен режим работы, при котором комбайн пытается удержать жатку посередине между рядками. Получив карту сегментации кадра и зная положение жатки, можно найти так называемую vanishing point и рассчитать отклонение зуба жатки от необходимого положения. Сколько полей, культур и погод мы храним? Начал масштабную глобальную эпопею лично Владимир Яловенко (низкий поклон человеку), предложив своё агрохозяйство в конце прошлого года в качестве индустриального пилота для масштабирования нашей Data Factory и инновационного расширения этих работ на трактора помимо комбайнов. Далее глобальный контракт с «Русагро» сразу на роботизацию 242 комбайнов на всей территории России приблизил собираемые объемы данных по полям к амбициям и размерам Zoox. И потянулись западные партнеры с вопросами и предложениями. База то уникальная. В мире такого нет. А догнал ситуацию до мирового максимума сервисный контракт с «ЭкоНивой», который говорит об инновационном обслуживании и установке 10000 устройств за три года в: Архангельскую, Владимирскую, Волгоградскую, Вологодскую, Ивановскую, Калужскую, Кировскую, Костромскую, Ленинградскую, Московскую, Новгородскую, Псковскую, Рязанскую, Ростовскую, Смоленскую, Тверскую, Тульскую, Ярославскую области, республику Карелия, Пермский край, Республику Марий ЭЛ, Республику КОМИ, Республику Удмуртия, Краснодарский край, Ставропольский край, республику Калмыкия, Новосибирскую, Кемеровскую, Томскую, Омскую области, Алтайский край, Иркутскую, Воронежскую, Курскую, Белгородскую области. Обратная связь В Data Factory хранятся не только сырые данные или разобранная по стендам информация, здесь есть и готовые (размеченные) датасеты. Помимо обучающих, как мы уже писали, существуют тестовые выборки. Если, скажем, инженеры на новом полигоне понимают, что работа системы идет не по плану, ее можно прогнать на этих наборах. Иногда по результатам тестов сотрудникам Data Factory приходится доразмечать обучающие выборки: скажем, добавлять в них новые классы. При этом существующую разметку мы не меняем, если в ней отсутствуют критические ошибки. Также мы мониторим наличие релевантных своим задачам открытых датасетов и если находим подходящие, обязательно используем их в работе. Cognitive Agro Dataset До недавних пор открытые датасеты были доступны в сфере автотранспорта, а для сельского хозяйства публиковались только единичные наборы датасетов под отдельные задачи, вроде опрыскивания полей гербицидами. Мы решили изменить эту ситуацию и поделиться с сообществом своими наработками. В первом квартале запущен проект по подготовке Cognitive Agro Dataset — всеобъемлющей базы собранных в реальных условиях данных, которая позволит обучать нейронные сети для автоматизации сельхозтехники. В Cognitive Agro Dataset будут доступны изображения с видеокамер, а также данные с установленных на беспилотной технике датчиков одометрии и инерциальных сенсоров. Сняты они в различных условиях: меняется геометрия полигонов, сельхозкультуры, а также виды работ. Общее дело Часть дата-сетов российским разработчикам будет доступна бесплатно, и мы рассчитываем, что это станет серьезным стимулом для развития отечественной беспилотной сельхозтехники. Источник: habr.com Комментарии: |
|