Spirit патентует технологию сверхсжатия информации под «закон Яровой»

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Отечественная ВКС-компания Spirit оформила патентную заявку на технологию сверхсжатия видео и голоса большого объема, которая может оказаться востребована российским рынком в связи с принятием пакета «законов Яровой».

Патентная заявка Spirit

Российская компания Spirit, разработчик ВКС-сервера Videomost подала заявку на получение патента на технологию сверхсжатия мультимедийной информации (видео и голоса) большого объема для размещения в системах хранения данных (СХД).

В патентной заявке говорится, что изобретение относится к области сжатия, передачи и хранения в компактном виде мультимедийной информации, циркулирующей в системах передачи/записи видео, изображений, речевых/аудио потоков, графических и текстовых файлов, включая системы речевой связи, видеоконференции, видеонаблюдение, системы хранения данных, а также поисковые системы.

Предложенная концепция интеграции интеллектуальной классификации разных фрагментов мультимедийной информации и известных методов кодирования источника с потерями, разработанная Spirit, позволяет, с точки зрения компании, минимум на порядок повысить эффективность компактного представления мультимедийной информации по сравнению с традиционными методами сжатия изображений, видео, речевых сообщений и аудиосигналов и позволяет ответить на вопросы мета-уровня: что хранить, как и в каком формате, как определить ценность хранимой информации для системы принятия решения, как ее закодировать и записать в цифровую память.

Рыночная подоплека

В Spirit считают, что сегодня в связи с принятием так называемого пакета законов Яровой резко возрос интерес отечественных операторов связи к технологиям эффективного сжатия и хранения данных в компактном виде, которые бы позволили существенно экономить ресурсы СХД. В прессе фигурируют космические значения стоимости ЦОДов, которые необходимы для реализации закона. Однако все эти расчеты сделаны для стандартных протоколов связи и кодирования голоса и видео, говорят в компании.

Видео сегодня занимает более 70% пропускной способности мировых телеком-сетей. Запись и последующее декодирование качественного, разборчивого голоса критически важны для исполнения закона Яровой, для последующего анализа и поиска в записанной речи программными средствами или человеком, добавляют разработчики.

Возможности сжатия речи

Популярные международные стандарты ITU-T для операторов связи - голосовые кодеки G.729, G.723.1 сжимают речь примерно в 8 раз (с потерями), после этого Spirit, по заявлению компании, может сжать речь еще в 3 раза. «Один из высокоэффективных специализированных кодеков для записи речи SpiritVostoc (VoiceStorageCodec) уже прошел обкатку и временем и клиентами», - говорят разработчики.

Spirit Vostoc - это специализированный вокодер, работающий на скорости 2400 бит/с и спроектированный специально для хранения речи. По качеству ее воспроизведения Vostoc в своем классе превосходит мировые аналоги, заверяют в компании. «Когда заходит речь о поиске лучшего решения для хранения большого объема мультимедийных данных, необходимо уделять внимание двум основным параметрам: степени сжатия и качеству записанной речи», - поясняет Владимир Свириденко, технический директор Spirit. - У нас разработаны и уже используются на мировом рынке технологии сжатия голоса, которые позволяют записать в 1 МБ памяти почти 2 часа вокодированной речи».

Возможности сжатия видео

Популярные международные стандарты ITU-T для операторов связи и ВКС-вендоров - видео кодеки H.263/H.264 - сжимают видео в среднем примерно в 50 раз (с потерями), после этого Spirit, по заявлению компании, может сжать видео еще в 100 раз, путем интеллектуального анализа информации на основе ее важности.

«Закон требует записывать и хранить все мультимедийные данные, и, если текст не занимает много места в СХД, то для хранения речи, аудио и видео, потребуются на порядки большие ресурсы. Нет надобности хранить весь -информационный мусор-, более компактно можно записать малоинформативную часть данных, а вот все самые важные фрагменты записи должны быть представлены качественно» - комментирует профессор Владимир Свириденко, технический директор Spirit и автор патентной заявки.

Ликбез Spirit по кодированию

Для кодирования видео широко используются кодеки ITU-T Н.26Х, а также проприетарные кодеки VPх. Коэффициент сжатия варьируется от 10 до 500 раз в зависимости от допустимой скорости видеопотока или выделенного объема памяти для хранения изображений/видео, уровня заданного качества, типа кодека и специфики материала. Широко используемый в таких кодеках принцип сжатия изображений и видео с потерями - это устранение пространственной избыточности на базе перехода из пространственной области в частотную на базе трансформации матрицы изображения, как в JPEG (или опорного кадра, как в MPEG 2 и 4) и использования системы ортогональных функций (преобразование Фурье, Уолша, дискретного косинусного преобразования (DCT), вейвлетов и др.) и тонкого или грубого квантования компонент, что вносит погрешность, и последующее кодирование квантованных компонент на принципах энтропийного кодирования без потерь (в частности, арифметического кодирования); устранение временной избыточности в соседних кадрах видеопотока, в которых, как правило, есть небольшие изменения за счет движения объектов в кадре или видеокамеры, выявляемые наблюдателем движения (motion estimator) и определением векторов движения для кодирования только измененных фрагментов нового кадра по отношению к опорному (что детально описано в стандартах MPEG 2 и 4, Н.26х).

Для кодирования речи используются речевые кодеки по стандартам ITU-T серии G.7xx (G.711, G.718, G.719, G.722.2 (AMR WB), G.723.1, G.726, G.729, G.729.1 и др.), кодеки GSM, SILC, iLBC и другие проприетарные кодеки. Коэффициент сжатия варьируется от 5 до 50 раз в зависимости от требуемой скорости речевого потока на выходе кодера, уровня заданного качества, допустимой задержки и специфики речевого сигнала (с учетом пауз в речи). Если же форма оригинального сигнала сохраняется на выходе кодека с контролируемой погрешностью, то такие кодеки называются кодеками речевой волны (waveform codecs).

Для кодирования аудио-сигналов используются такие известные и широкоиспользуемые аудио-кодеки как МР3, ААС, ААС+, WMA и др. Практически все аудио-кодеки построены на основе метода waveform coding, но обработка сигнала производится, как правило, в частотной области. Коэффициент сжатия аудиопотока варьируется от 5 до 30 раз и зависит от полосы частот аудио-сигнала и требуемого качества воспроизведения аудио при декодировании.

Несколько фактов о Spirit

Компания Spirit - разработчик известного на рынке ВКС-решения Videomost - специализируется в области разработки и лицензирования программных движков для передачи голоса и видео по IP-сетям. Ее коммуникационная программная платформа операторского класса Spirit используется операторами связи, производителями оборудования, разработчиками программного обеспечения и веб-сервисов и обслуживает свыше миллиарда пользователей более чем в 100 странах мира - «больше чем Skype», как любят подчеркивать в компании.

Программные продукты компании лицензированы и/или стоят внутри популярных потребительских продуктов Apple, Adobe, ARM, AT&T, Avaya, Blizzard, BroadSoft, BT, China Mobile, Dialogic, Ericsson, HP, HTC, Huawei, Korea Telecom, Kyocera, LG U+, Mitel, Microsoft, NEC, Oracle, Polycom, Reliance, Samsung, Skype, Texas Instruments, Toshiba, Viber, ZTE и более 250 других мировых технологических лидеров. Прямые клиенты Spirit сегодня являются производителями более 60% смартфонов в мире. 


Источник: www.cnews.ru

Комментарии: