Полностью российская разработка
Как рассказали CNews в российской компании Smart Engines, разработанный ими программный комплекс Smart Tomo Engine для реконструкции рентгеновских томографических снимков в режиме реального времени принял участие в сравнительном тестировании, которое проводилось на системах с различными российскими процессорами семейства «Эльбрус» компании «МЦСТ», включая новейший «Эльбрус-8СВ», и современными чипами AMD с архитектурой x86-64.
Как показали итоги тестирования, отечественные процессоры обладают достаточной производительностью для того, чтобы решать томографические задачи в режиме реального времени. Результаты тестирования также подтвердили, что полностью отечественная технология Smart Tomo Engine российской компании Smart Engines подходит для использования в составе программно-аппаратных комплексов на платформе «Эльбрус» для медицинских и промышленных сканеров всех поколений, а также для новейших нано-томографов субмикронного разрешения и синхротронных центров.
«В соответствии с Европейской классификацией готовности технологий его можно оценить как TRL7, – сказал Владимир Арлазаров, к.т.н., генеральный директор Smart Engines. – Это означает, что наша система показала работоспособность и эффективность в связке с реальным томографом, находящимся в эксплуатации, на серийном вычислителе. Разработанное нами программное обеспечение – это готовый к внедрению продукт, который может быть интегрирован как на стадии разработки принципиально новых томографов, так и адаптирован к уже существующем в эксплуатации образцам».
Современная томографическая рентгенография
Неинвазивная диагностика на основе компьютерной томографической рентгенографии (КТ) позволяет сформировать изображение формы и внутренней структуры живых и неживых объектов с помощью рентгеновского излучения. Для формирования объемной структуры снимка при рентгеновской КТ используются рентгенограммы, снятые под разными углами. Набор проекций проходит специальную обработку – реконструкцию, за счет которой воссоздается внутренняя морфологическая структура объекта.
Экспериментальный микротомограф ФНИЦ КФ РАН
Как пояснили CNews в Smart Engines, программная платформа Smart Tomo Engine обеспечивает реконструкцию трехмерного цифрового изображения объекта по набору его трансмиссионных томографических изображений в рентгеновском диапазоне.
Платформа выполнена на базе специальной библиотеки томографической реконструкции, которая через API обеспечивает функции чтения томографических проекций, непосредственно томографическую реконструкцию с применением одного из трех алгоритмов, а также сохранение результатов в медицинском формате DICOM или распространенном PNG. ПО также включает графический интерфейс для двухмерной визуализации томографических изображений и результатов реконструкции.
Графический интерфейс Smart Tomo Engine
Для послойной двумерной реконструкции используется классический алгоритм FBP (Filtered Back Projection) с обратным проецированием и линейной фильтрацией, частотный DFR (Direct Fourier Reconstruction) с применением быстрого преобразования Фурье для фильтрации и обратного проецирования, а также отечественный HFBP (Hough FBP), где для обратного проецирования используется алгоритм Брейди быстрого вычисления преобразования Хафа, а для ускорения линейной фильтрации применяется метод Дериша.
Как пояснили CNews в Smart Engines, потребность в аппаратах для компьютерной томографической рентгенографии очень высока. В настоящее время в России установлено порядка 2000 медицинских установок КТ, что значительно меньше в пересчете на одного пациента в мировом масштабе, при этом количество поставок составляет около 100 аппаратов ежегодно и объемы сокращаются в условиях ограничений.
Что касается спроса на промышленные аппараты компьютерной томографической рентгенографии, речь может идти о десятках тысяч, так как применение таких систем многократно выросло как в области неразрушающего контроля изделий в промышленности, так и в области транспортной безопасности (досмотровые комплексы на транспорте, таможне и т.д.).
По поводу конкурентоспособности разработки Smart Engines на мировом рынке в компании пояснили CNews следующее. Каждый производитель томографов использует то или иное ПО для реконструкции изображений, и в этом месте существует B2B рынок. Преимущества разработки Smart Engines заключаются в более высокой скорости работы за счет принципиально новых высокопроизводительных алгоритмов, увеличении реального разрешения получаемых изображений за счет более точных моделей формирования сигнала, а также возможности снижения дозы за счет применения методики контролируемой реконструкции (monitored reconstruction). Снижение лучевой нагрузки на пациента в условиях многократных КТ, необходимых при контроле состояния внутренних органов -— это очень важный фактор, особенно в условиях пандемии, подчеркнули в компании.
Стратегия Smart Engines пока не включает планы по выводу этого ПО на внешние рынки: в актуальных условиях необходимо выводить на рынок ПО в составе программно-аппаратного комплекса, рассказали CNews в компании.
«Мы демонстрируем в нашем случае, что созданный нами программный комплекс способен работать не только на популярных распространенных вычислительных платформах, но и на системах российского производства, при этом демонстрируя высокое качество и скорость работы, достаточное для проведения исследований, — отметил Владимир Арлазаров. — Для нашей страны это важно прежде всего тем, что дает возможность создания полностью отечественного программно-аппаратного комплекса КТ внутри России. Впрочем, по академической лицензии мы также планируем поставлять свое ПО в ведущие мировые синхротронные центры».
Как и что тестировалось
Испытания отечественного ПО Smart Tomo Engine проводилось сотрудниками компании Smart Engines в сотрудничестве с учеными из институтов Российской академии наук (ИППИ РАН и ФИЦ ИУ РАН) и инженерами компании «МЦСТ», производителя процессоров «Эльбрус».
ПО Smart Tomo Engine работает в системах под управлением российской ОС «Эльбрус», Microsoft Windows, Apple macOS и различных дистрибутивов Linux, а также совместимо с различными процессорными архитектурами, включая VLIW-архитектуру «Эльбрус» и x86-архитектуру x86-64.
Тестовая реконструкция производилась на синтетических данных и реальных изображениях, полученных при съемке майского жука на микротомографе ФНИЦ КФ РАН. Синтетический датасет «Шепп-Логан 3D» получен методом математического моделирования с использованием веерной схемы и послойным расчетом проекции от трехмерного фантома Шеппа-Логана. Размер проекции составил 511х51 пикселей.
Объемная рентгенограмма майского жука
Реальные томографические данные датасета «Майский жук» собраны на микротомографе ФНИЦ КФ РАН. Размер пикселя использованного детектора составил 9 микрон, в качестве образца использовался высушенный майский жук. Размер проекции составил 1175х1175 пикселей.
Замеры скорости выполнения алгоритмов реконструкции проводились в однопоточном (1П) и многопоточном (МП) режимах на пяти вычислительных системах: рабочей станции «Эльбрус-401» (процессор «Эльбрус-4С»), сервере «Эльбрус-804» с четырьмя процессорами «Эльбрус-8С», рабочей станции «Эльбрус-801СВ» с новейшим процессором «Эльбрус-8СВ», а также системами на процессорах AMD Ryzen 7 2700 и AMD Ryzen Threadripper 3970X.
Новейший процессор «Эльбрус-8СВ» интересен наличием восьми ядер с частотой 1,5 ГГц, поддержкой оперативной памяти DDR4-2400 (впервые для процессоров «МЦСТ»), а также двое увеличенным числом ALU.
Процессор «Эльбрус-8СВ»
«Эльбрус-8СВ лучше работает с невыровненными данными, и в нем масса других небольших улучшений по сравнению с Эльбрус-8С», – сказал Константин Трушкин, заместитель генерального директора по маркетингу «МЦСТ».
Итоги тестирования
Анализ результатов показал, что многопоточном режиме 4-процессорный сервер «Эльбрус-804» затратил 19 секунд на реконструкцию 511 слоев фантома с алгоритмом HFBP (0,037 с на каждый слой), послойная частота составила 26,8 слоев в секунду (26,8 ips), что по факту означает проведение реконструкции практически в режиме реального времени. Реконструкция 1261 слоя датасета «Майский жук» заняла в многопоточном режиме 189 с (6,7 ips).
CPU | Эльбрус 4С, 800 МГц | Эльбрус 8С, 1,2 ГГц | Эльбрус 8СВ, 1,5 ГГц | AMD Ryzen 7 2700 | AMD Ryzen 3970X (Threadripper) | |||||
---|---|---|---|---|---|---|---|---|---|---|
Система | 1 CPU x 4 ядра / 4 потока | 4 CPU x 8 ядер / 8 потоков | 1 CPU x 8 ядер / 8 потоков | 1 CPU x 8 ядер / 16 потоков | 1 x 32(64) | |||||
Режим | 1П | 4П | 1П | 32П | 1П | 8П | 1П | 16П | 1П | 64П |
«Шепп-Логан» 3D (511 слоев) | ||||||||||
FBP | 959 с | 271 с | 569 с | 31 с | 514 с | 85 с | 213 с | 52 с | 237 с | 19 с |
DFR | 853 с | 234 с | 546 с | 23 с | 497 с | 69 с | 60 с | 10,5 с | 61 с | 5,1 с |
HFBP | 760 с | 200 с | 496 с | 19 с | 406 с | 55 с | 46 с | 8,3 с | 42 с | 2,3 с |
«Майский жук» (1261 слой) | ||||||||||
FBP | 17755 с | 6593 с | 8845 с | 685 с | 8342 с | 1992 с | 4789 с | 1061 с | 4326 с | 568 с |
DFR | 9910 с | 2847 с | 6351 с | 236 с | 5575 с | 733 с | 771 с | 141 с | 724 с | 77 с |
HFBP | 9075 с | 2419 с | 5512 с | 189 с | 4540 с | 597 | 578 с | 97 с | 579 с | 41 с |
Источник: Smart Engines
Проведение реконструкции с использованием российской платформы, удовлетворяет требованиям по скорости, предъявляемым в кардиологии, где основным реперным параметром является период сокращения сердца, который в среднем составляет одну секунду, пояснили CNews в Smart Engines.
При работе с алгоритмом FBP отставание «Эльбрусов» умеренное, при нормировании относительно тактовой частоты результаты схожие, но с алгоритмами DFR и HFBP отставание «Эльбрусов» больше.
В Smart Engines в связи с этим заявили, что ПО Smart Tomo Engine пока что недостаточно оптимизировано под платформу «Эльбрус». На оптимизацию софта под платформу x86-64 было потрачено пять лет, под «Эльбрусы», особенно под новейший «Эльбрусы-8СВ», процесс оптимизации большей части программ и алгоритмов лишь начался, и это процесс займет примерно два человекомесяца, заявили в компании.
В ближайшее время в компании планируют оптимизировать вычисления под 128-битное SIMD-распараллеливание процессоров «Эльбрус-8СВ» и ускорить работу платформы с алгоритмом HFBP – как минимум, в несколько раз.
Ранее, в сентябре 2020 г. CNews также рассказал об итогах сравнительного тестирования систем хранения данных (СХД) на процессорах «Эльбрус» и Intel, проведенного компанией «Аэродиск». Несмотря на то, что в этом тестировании новейшие процессоры «Эльбрус 8СВ» еще не использовались, в ряде тестов производительность российских процессоров оказалась сопоставима с зарубежными решениями, а в некоторых из них СХД на «Эльбрусах» смогли даже удивить.