Spirit патентует технологию сверхсжатия информации под «закон Яровой» |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2016-10-05 18:29 Отечественная ВКС-компания Spirit оформила патентную заявку на технологию сверхсжатия видео и голоса большого объема, которая может оказаться востребована российским рынком в связи с принятием пакета «законов Яровой». Патентная заявка Spirit Российская компания Spirit, разработчик ВКС-сервера Videomost подала заявку на получение патента на технологию сверхсжатия мультимедийной информации (видео и голоса) большого объема для размещения в системах хранения данных (СХД). В патентной заявке говорится, что изобретение относится к области сжатия, передачи и хранения в компактном виде мультимедийной информации, циркулирующей в системах передачи/записи видео, изображений, речевых/аудио потоков, графических и текстовых файлов, включая системы речевой связи, видеоконференции, видеонаблюдение, системы хранения данных, а также поисковые системы. Предложенная концепция интеграции интеллектуальной классификации разных фрагментов мультимедийной информации и известных методов кодирования источника с потерями, разработанная Spirit, позволяет, с точки зрения компании, минимум на порядок повысить эффективность компактного представления мультимедийной информации по сравнению с традиционными методами сжатия изображений, видео, речевых сообщений и аудиосигналов и позволяет ответить на вопросы мета-уровня: что хранить, как и в каком формате, как определить ценность хранимой информации для системы принятия решения, как ее закодировать и записать в цифровую память. Рыночная подоплека В Spirit считают, что сегодня в связи с принятием так называемого пакета законов Яровой резко возрос интерес отечественных операторов связи к технологиям эффективного сжатия и хранения данных в компактном виде, которые бы позволили существенно экономить ресурсы СХД. В прессе фигурируют космические значения стоимости ЦОДов, которые необходимы для реализации закона. Однако все эти расчеты сделаны для стандартных протоколов связи и кодирования голоса и видео, говорят в компании. Видео сегодня занимает более 70% пропускной способности мировых телеком-сетей. Запись и последующее декодирование качественного, разборчивого голоса критически важны для исполнения закона Яровой, для последующего анализа и поиска в записанной речи программными средствами или человеком, добавляют разработчики. Возможности сжатия речи Популярные международные стандарты ITU-T для операторов связи - голосовые кодеки G.729, G.723.1 сжимают речь примерно в 8 раз (с потерями), после этого Spirit, по заявлению компании, может сжать речь еще в 3 раза. «Один из высокоэффективных специализированных кодеков для записи речи SpiritVostoc (VoiceStorageCodec) уже прошел обкатку и временем и клиентами», - говорят разработчики. Spirit Vostoc - это специализированный вокодер, работающий на скорости 2400 бит/с и спроектированный специально для хранения речи. По качеству ее воспроизведения Vostoc в своем классе превосходит мировые аналоги, заверяют в компании. «Когда заходит речь о поиске лучшего решения для хранения большого объема мультимедийных данных, необходимо уделять внимание двум основным параметрам: степени сжатия и качеству записанной речи», - поясняет Владимир Свириденко, технический директор Spirit. - У нас разработаны и уже используются на мировом рынке технологии сжатия голоса, которые позволяют записать в 1 МБ памяти почти 2 часа вокодированной речи». Возможности сжатия видео Популярные международные стандарты ITU-T для операторов связи и ВКС-вендоров - видео кодеки H.263/H.264 - сжимают видео в среднем примерно в 50 раз (с потерями), после этого Spirit, по заявлению компании, может сжать видео еще в 100 раз, путем интеллектуального анализа информации на основе ее важности. «Закон требует записывать и хранить все мультимедийные данные, и, если текст не занимает много места в СХД, то для хранения речи, аудио и видео, потребуются на порядки большие ресурсы. Нет надобности хранить весь -информационный мусор-, более компактно можно записать малоинформативную часть данных, а вот все самые важные фрагменты записи должны быть представлены качественно» - комментирует профессор Владимир Свириденко, технический директор Spirit и автор патентной заявки. Ликбез Spirit по кодированию Для кодирования видео широко используются кодеки ITU-T Н.26Х, а также проприетарные кодеки VPх. Коэффициент сжатия варьируется от 10 до 500 раз в зависимости от допустимой скорости видеопотока или выделенного объема памяти для хранения изображений/видео, уровня заданного качества, типа кодека и специфики материала. Широко используемый в таких кодеках принцип сжатия изображений и видео с потерями - это устранение пространственной избыточности на базе перехода из пространственной области в частотную на базе трансформации матрицы изображения, как в JPEG (или опорного кадра, как в MPEG 2 и 4) и использования системы ортогональных функций (преобразование Фурье, Уолша, дискретного косинусного преобразования (DCT), вейвлетов и др.) и тонкого или грубого квантования компонент, что вносит погрешность, и последующее кодирование квантованных компонент на принципах энтропийного кодирования без потерь (в частности, арифметического кодирования); устранение временной избыточности в соседних кадрах видеопотока, в которых, как правило, есть небольшие изменения за счет движения объектов в кадре или видеокамеры, выявляемые наблюдателем движения (motion estimator) и определением векторов движения для кодирования только измененных фрагментов нового кадра по отношению к опорному (что детально описано в стандартах MPEG 2 и 4, Н.26х). Для кодирования речи используются речевые кодеки по стандартам ITU-T серии G.7xx (G.711, G.718, G.719, G.722.2 (AMR WB), G.723.1, G.726, G.729, G.729.1 и др.), кодеки GSM, SILC, iLBC и другие проприетарные кодеки. Коэффициент сжатия варьируется от 5 до 50 раз в зависимости от требуемой скорости речевого потока на выходе кодера, уровня заданного качества, допустимой задержки и специфики речевого сигнала (с учетом пауз в речи). Если же форма оригинального сигнала сохраняется на выходе кодека с контролируемой погрешностью, то такие кодеки называются кодеками речевой волны (waveform codecs). Для кодирования аудио-сигналов используются такие известные и широкоиспользуемые аудио-кодеки как МР3, ААС, ААС+, WMA и др. Практически все аудио-кодеки построены на основе метода waveform coding, но обработка сигнала производится, как правило, в частотной области. Коэффициент сжатия аудиопотока варьируется от 5 до 30 раз и зависит от полосы частот аудио-сигнала и требуемого качества воспроизведения аудио при декодировании. Несколько фактов о Spirit Компания Spirit - разработчик известного на рынке ВКС-решения Videomost - специализируется в области разработки и лицензирования программных движков для передачи голоса и видео по IP-сетям. Ее коммуникационная программная платформа операторского класса Spirit используется операторами связи, производителями оборудования, разработчиками программного обеспечения и веб-сервисов и обслуживает свыше миллиарда пользователей более чем в 100 странах мира - «больше чем Skype», как любят подчеркивать в компании. Программные продукты компании лицензированы и/или стоят внутри популярных потребительских продуктов Apple, Adobe, ARM, AT&T, Avaya, Blizzard, BroadSoft, BT, China Mobile, Dialogic, Ericsson, HP, HTC, Huawei, Korea Telecom, Kyocera, LG U+, Mitel, Microsoft, NEC, Oracle, Polycom, Reliance, Samsung, Skype, Texas Instruments, Toshiba, Viber, ZTE и более 250 других мировых технологических лидеров. Прямые клиенты Spirit сегодня являются производителями более 60% смартфонов в мире. Источник: www.cnews.ru Комментарии: |
|