![]() |
![]() |
![]() |
|||||
![]() |
Новая наука заглядывания за угол |
||||||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2018-09-26 17:00 Исследователи компьютерного зрения обнаружили имеющийся у нас в распоряжении скрытый мир визуальных сигналов, где есть незаметные движения, выдающие то, что было сказано, и расплывчатые изображения того, что находится за углом ![]() ![]() «У нашей Мэри был баран», — говорит человек на аудиозаписи, воссозданной с движений пустого пакетика из-под чипсов, которые учёные снимали сквозь звуконепроницаемое окно в 2014 году (это первые слова, записанные Томасом Эдисоном в 1877 году на фонографе). Исследования по поводу заглядывания за углы и построения предположений об объектах, не видимых напрямую, или «построение изображений не в прямой видимости», начались в 2012 году с работы Торральбы и Фримана по случайной камере, и с ещё одной переломной работы, проведённой отдельной группой учёных из MIT под руководством Рамеша Раскара. В 2016 году, в частности, и благодаря их результатам, Управление перспективных исследовательских проектов Министерства обороны США (DARPA) запустила программу REVEAL стоимостью $27 млн (Revolutionary Enhancement of Visibility by Exploiting Active Light-fields – революционное улучшение видимости с использованием активных световых полей). Программа финансирует появляющиеся по всей стране лаборатории. С тех пор поток новых идей и математических трюков делает построение изображений не в прямой видимости всё более мощным и практичным.
Случайные камеры Лучи света, переносящие изображение мира, находящегося за пределами нашего поля зрения, постоянно падают на стены и другие поверхности, после чего отражаются и попадают нам в глаза. Но почему эти визуальные остатки так слабы? Просто слишком много лучей идёт по слишком большому количеству направлений, и изображения размываются. ![]() ![]() Представьте, что вы снимаете внутреннюю стену комнаты через щель в жалюзи. Многого вы не увидите. Внезапно в вашем поле зрения появляется рука. Сравнение интенсивности света на стене при наличии и при отсутствии руки выдаёт полезную информацию о сцене. Набор лучей света, падающих на стену в первом кадре, на мгновение блокируется рукой в следующем. Вычитая данные второго кадра из данных первого, как говорит Фриман, «можно вычислить то, что блокировала рука» – набор световых лучей, представляющих изображение части комнаты. «Если изучать то, что блокирует свет, и то, что пропускает свет, — сказал он, — можно расширить набор мест, где можно встретить пинхол-камеры». Вместе с работой по изучению случайных камер, воспринимающих небольшие изменения в интенсивности, Фриман с коллегами разработали алгоритмы, определяющие и усиливающие небольшие изменения цвета – такие, как изменение цвета лица человека при приливе или отливе крови, а также крохотные движения – это то, благодаря чему можно было записать разговор, снимая пакетик чипсов. Теперь они легко могут заметить движение в одну сотую пикселя, которое в обычных условиях просто потонуло бы в шуме. Их метод математически преобразует изображения в конфигурации синусоид. В полученном пространстве шум не доминирует над сигналом, поскольку синусоиды представляют средние значения, взятые над многими пикселями, поэтому шум распределяется по ним. Благодаря этому исследователи могут определять сдвиги синусоид от одного кадра видео к другому, усиливать эти сдвиги, а потом преобразовывать данные обратно. Теперь они начали комбинировать все эти трюки для извлечения скрытой визуальной информации. В исследовании, описанном в прошлом октябре, которое проводила Кэти Боумен (тогда студентка под руководством Фримана, а ныне учёный из Гарвард-Смитсонианского астрофизического центра), было показано, что углы зданий работают как камеры, создающие грубое изображение того, что находится за углом. ![]() Грани и углы, как и пинхолы с точечными камерами, препятствуют прохождению солнечных лучей. Используя обыкновенные камеры, те же iPhone, при дневном свете, Боумен с коллегами снимали полутень на углу здания – область с тенями, подсвечиваемую подмножеством световых лучей, идущих из скрытого участка за углом. Если, к примеру, там пройдёт человек в красной рубашке, эта рубашка отправит небольшое количество красного света в полутень, и этот свет будет перемещаться по полутени, пока человек идёт, невидимый обычным глазом, но обнаруживаемый после постобработки. В революционной работе, опубликованной в июне, Фриман с коллегами воссоздали «световое поле» комнаты – картину интенсивности и направления хода лучей света в комнате – из теней, отбрасываемых лиственным растением, стоявшим рядом со стеной. Листья работали в качестве точечных камер, каждый из которых блокировал свой набор световых лучей. Сопоставление тени каждого листа с остальными тенями выдавало это недостающий набор лучей, и позволяло получить изображение части спрятанной сцены. Учитывая параллакс, исследователи затем смогли свести все эти изображения вместе. Такой подход даёт куда как более чёткие изображения, чем ранние работы со случайными камерами, поскольку в алгоритм встроены заранее приобретённые знания о мире. Зная форму растения, полагая, что естественные изображения должны быть гладкими, и учитывая несколько других предположений, исследователи смогли сделать определённые выводы, касающиеся сигналов, содержащих шум, что помогло сделать итоговое изображение резче. Технология работы со световым полем «требует знаний об окружающем мире для создания реконструкции, но и даёт вам много информации», — сказал Торральба. Рассеянный свет А пока Фриман, Торральба и их протеже раскрывают изображения, которые были спрятаны, в другом месте кампуса MIT Рамеш Раскар, специалист по компьютерному зрению, выступавший с докладами на TED, намеревается «изменить мир» и выбирает подход под названием «активное построение изображений». Он использует специализированные дорогие системы лазерных камер для создания изображений высокого разрешения, отображающих то, что находится за углом. ![]() В 2012 году в рамках реализации идеи, посетившей его пять лет назад, Раскар с командой впервые создали технологию, при которой необходимо выпускать лазерные импульсы в стену. Малая часть рассеянного света сумеет обойти препятствие. А через небольшое время после каждого импульса они используют «камеру вспышек», записывающую отдельные фотоны со скоростью миллиарды кадров в секунду, чтобы обнаружить фотоны, отскочившие от стены. Измеряя время, потраченное фотонами на возвращение, исследователи могут узнать, насколько далеко они улетали, и в деталях воссоздать трёхмерную геометрию скрытых за препятствием объектов, на которых рассеялись фотоны. Одна из сложностей состоит в том, что для формирования трёхмерного изображения необходимо проводить растровое сканирование стены лазером. Допустим, что за углом прячется человек. «Тогда свет, отразившийся от определённой точки на голове, от определённой точки на плече, и от определённой точки на колене может прибыть в камеру в одно и то же время, — сказал Раскар. Но если посветить лазером немного в другое место, тогда свет от трёх этих точек уже не прибудет в камеру в одно и то же время». Необходимо скомбинировать все сигналы и решить «обратную задачу» для воссоздания скрытой трёхмерной геометрии. Оригинальный алгоритм Раскара для решения обратной задачи требовал слишком много вычислительных ресурсов, а сам аппарат стоил полмиллиона долларов. Но была проделана серьёзная работа по упрощению математики и уменьшению расходов. В марте в журнале Nature была опубликована работа, задавшая новый стандарт эффективного и экономичного построения трёхмерных изображений объекта – в работе воссоздавали фигурку кролика – находящегося за углом. Авторы, Мэтью О’Тул, Дэвид Линдел и Гордон Вецтейн из Стэнфордского университета разработали новый мощный алгоритм для решения обратной задачи и использовали относительно недорогие камеры SPAD – полупроводниковые устройства, частота кадров у которых ниже, чем у вспышковых камер. Раскар, ранее работавший куратором двух авторов работы, назвал её «очень хитроумной» и «одной из моих любимых». ![]() ![]() Где находятся вещи Исследователи из группы Фримана начали совмещать пассивный и активный подходы. В работе, проведённой под руководством исследователя Кристоса Трампулидиса, показано, что при активном построении изображений при помощи лазера точечную камеру известной формы, находящуюся за углом, можно использовать для воссоздания скрытой сцены, совсем не используя информацию о времени полёта фотонов. «И это должно получиться у нас при помощи обычной ПЗС-матрицы», — сказал Трампулидис. Построение изображений не в прямой видимости когда-нибудь сможет помочь спасательным командам и автономным роботам. Велтен сотрудничает с Лабораторией реактивного движения НАСА, работая над проектом, направленным на построение на расстоянии изображений объектов, находящихся внутри пещер Луны. А Раскар с компанией используют их подход для чтения первых нескольких страниц закрытой книги, и для того, чтобы видеть в тумане. Источник: habr.com ![]() Комментарии: |
||||||