Разделы

ПО Бизнес

Россияне получили миллионы на завоевание мирового рынка видеокодеков

Российские программисты намерены разрушить монополию США на рынке видеокодирования, реализовав до конца 2016 г. коммерческую версию отечественного кодека, имитирующего преобразование (сжатие) визуальной информации между человеческим глазом и мозгом.

Новый игрок на рынке кодеков

Российская компания «Лэсиф» привлекла 32 млн от компании «Лидер», управляющей средствами закрытого паевого фонда венчурных инвестиций «Лидер-инновации», созданного с участием капитала РВК. С помощью этих средств «Лэсиф» до конца 2016 г. планирует завершить разработку аппаратнонезависимого видеокодека нового поколения, который сможет превзойти по своим характеристикам существующие на сегодняшний день технологии видеокодирования, присутствующие на рынке.

Под видеокодеком подразумевается программное обеспечение для сжатия и восстановления ранее сжатого видео. Его потребителями являются вещательные компании (ТВ и интернет), создатели видеоконтента, производители видеокамер, вычислительных чипов, компьютеров, бытовой электроники и мобильных телефонов, а также создатели браузеров и операционных систем.

В основу нового продукта лягут собственные многолетние разработки программиста Всеволода Мокрушина, реализованные им в кодеке SIF-1, на который он в феврале 2013 г. получил соответствующий патент в США. Изначально этот кодек писался на языке программирования C++ с ассемблерными вставками, потом был переписан на С.

По словам Мокрушина, в середине 2000-х годов он получил на свои разработки грант от фонда Ивана Бортника (несколько тысяч долларов, которые полностью ушли на патентные процедуры). На протяжении нескольких лет работы над кодеком финансово поддерживал бизнес-ангел Вадим Асадов.

Субподрядчиком в проекте выступит российская компания «Элекард девайсез», позиционирующая себя как «одна из 5 компаний в мире, имеющих лучшую экспертизу и специалистов в этой области».


Российские программисты намерены разрушить монополию США на рынке видеокодирования

«Мы инвестируем на ранней стадии в компании там, где есть технологический риск, и где видим высокий потенциал, -  говорит Александр Антипов, заместитель директора по венчурным инвестициям УК «Лидер». - Перед тем, как принять решение мы проводим всю необходимую  экспертизу – патентную и техническую. Здесь нам удалось создать конструкцию, в рамках которой привлечены профессионалы высокого уровня - компания "Элекард девайсез". При этом мы осуществляем контроль качества и скорости работы субподрядчика».


Сейчас ведутся переговоры с потенциальными заказчиками. В России «Лэсиф» особенно рассчитывает на внимание предприятий оборонной отрасли, а в мире среди перспективных покупателей называет Google, Apple, Microsoft, Samsung, Qualcomm, Intel, AMD, nVidia.

Общий объем рынка видеокодеков в мире «Лэсиф» оценивает в $10 млрд в год. С точки зрения Мокрушина, распространенные на рынке кодеки близки к порогу развития заложенных в них алгоритмов, в то время как ограничения по сжатию в его кодеке пока не выявлены.

В настоящий момент «Лэсиф» прорабатывает вопросы привлечения к проекту ведущих исследовательских центров ряда стран Европы и Азии. Сейчас костяк программистов проекта работает в Томске.

История и технологическая суть проекта

В разговоре с CNews Всеволод Мокрушин сообщил, что занимается разработкой своего кодека с 2000 г. «Тогда стали появляться кодеки, передового на тот момент стандарта Н263, — говорит он. — В результате, полученного мной опыта в работе с этим стандартом, я пришел к выводу, что используемый в нем подход недостаточно гибок, чтобы реализовать эффективные психовизуальные модели сжатия. Уже тогда у меня было понимание, что возможность наращивать эффективность сжатия видеокодеков "грубой силой" в ближайшем будущем будет исчерпана, так как упрется в фундаментальный барьер, обойти который будет очень сложно».

По словам Мокрушина, общеизвестен факт того, что объем информации получаемый световыми рецепторами человеческого глаза существенно больше, чем теоретическая пропускная способность зрительного нерва, передающего полученную глазом информацию в зрительную кору мозга. «То есть уже на этом этапе происходит сжатие и отбрасывание части полученной информации», — заверяет он.

Мокрушин уверен, что данное сжатие не может базироваться на очень сложных алгоритмах, так как основная обработка производиться зрительной корой. «По сути, нейроны сетчатки должны локально решать, какая часть полученной зрительной информации важна и должна быть передана дальше, а какую можно отбросить. Вся обработка производится относительно локально и независимо для различных участков изображения, — поясняет он. — В результате на одних участках чувствительность глаза становится выше для одних признаков изображения, а на других для совсем иных».

Основная задача, решаемая нейронами зрительной коры, как заверяет Мокрушин, состоит в том, чтобы максимально сохранить те признаки, которые могут улучшить распознавание жизненно важной информации и огрубление неважных признаков. «Соответственно, если видеокодек точно также будет огрублять не важные для конкретного участка изображения признаки и точнее кодировать важные, то мы можем получить выигрыш в визуальном качестве сжатого видео, даже если в целом изображение будет передаваться менее точно», — отмечает он.

Но, так как подобная обработка в глазу осуществляется локально, то и видеокодек должен использовать чрезвычайно гибкий и локально адаптивный метод сжатия, чего распространенные на сегодня алгоритмы сжатия, по утверждению Мокрушина, обеспечить не могут.

В идеале наиболее подходящий для создания психовизуальной модели алгоритм должен быть максимально похож на тот, что используется при кодировании информации между глазом и зрительной корой, рассуждает разработчик. «И тут возникает сразу несколько проблем. Первая заключается в том, что нельзя просто копировать методы используемые мозгом, так как эффективно реализуемые нейронными сетями алгоритмы не могут быть с приемлемой вычислительной эффективностью повторены с помощью современных процессоров», — говорит Мокрушин.

Вторая проблема, по его словам, заключается в том, что глаз производит только анализ «картинки», и уже преобразованное изображение подвергается дальнейшей обработке в зрительной коре. «Нам же нужно создать эффективный алгоритм "сборки" исходного изображения после такого анализа, продолжает он. — Собственно это две ключевые проблемы, которые я начал решать в 2000 году».

Мокрушин указывает, что общие принципы кодирования изображения между глазом и зрительной корой хорошо известны и подробно изучены нейрофизиологами. Однако если с помощью нейронной сети легко можно создавать множество сложных двумерных фильтров, вычисляемых параллельно, то реализация такого подхода «в лоб» приводит к крайней вычислительной сложности, на порядки большей чем имеют современные кодеки. «Мне удалось, за счет использования опорной пирамиды Лапласа и ряда ухищрений создать относительно быстрый и простой алгоритм, работающий почти также, как сложные модели используемые нейрофизиологами», — уверяет разработчик.

Вторая задача оказалось для него более сложной. «Традиционно, задачу синтеза решают за счет согласованных друг с другом обратимых математических преобразований, например, Фурье или вейвлет-преобразований, когда синтезирующая часть математически согласована с анализирующей, — разъясняет Мокрушин. — Понятно, что в биологических системах никакого точного согласования быть не может. Но там это и не нужно, потому что анализ зрительной корой ведется по уже преобразованной картинке. Мне же нужно было создать вычислительно быстрый алгоритм, сборки изображения, разложенного с помощью разнородных и математически плохо согласованных друг с другом аналитических фильтров».

Суть полученного Мокрушиным патента, по его словам, состоит в описании согласованных друг с другом быстрых и эффективных методов анализа и синтеза изображения. «При этом метод анализа максимально похож на те, что применяются нейробиологами в моделях, описывающих кодирование информации между глазом и зрительной корой. Как и биологический прототип данный метод чрезвычайно гибок и позволяет независимо задавать правила кодирования для любого, произвольного участка изображения в зависимости от его локальных свойств, — отмечает разработчик. — Более того, так как данный метод анализа максимально похож не природный аналог, то можно результаты анализа использовать для вычисления маскирующих функций психовизуальноцй модели, что делает такую модель практически "бесплатной" с точки зрения требуемого объема вычислений».

Конкуренты и юридические особенности

В «Лэсиф» считают, что на сегодняшний день в мире видеокодеков доминируют стандарты H.265/HEVC консорциума MPEG LA и VP9 компании Google. Лицензионные отчисления с каждого произведенного продукта, связанного с видео, вынуждены платить как все производители электроники, так и компании, транслирующие и принимающие видео.

В разговоре с CNews Мокрушин особо подчеркнул важность наличия независимого  от  МPEG  LA  пула патентов, покрывающего  разработанную  технологию. По его словам, это позволяет не зависеть от держателей  патентов  на  существующие коммерческие кодеки и дает возможность потенциальному   покупателю    продукта   избежать   патентных отчислений  сторонним  компаниям.


По данным ЕГРЮЛ и «Контур.Фокус», Мокрушин вошел в состав учредителей «Лэсиф» в январе 2016 г. Вторым соучредителем и директором компании выступает Константин Беляков, ранее являвшийся соучредителем фирмы «Элекард-мед» — структуры, связанной с вышеупомянутой «Элекард девайсез».

В базе «Контур.Фокус» «Элекард девайсез» числится одним из бывших учредителей «Лэсиф». По словам представителей проекта, к нынешнему моменту свыше 50%  в ООО «Лэсиф» принадлежат фонду «Лидер-инновации», средствами которого управляет УК «Лидер», на сегодняшний день крупнейшая в России управляющая компания по сумме активов (более p391,4 млрд по данным на 30 сентября 2015 года).
Сергей Голицын, T1
Цифровизация

Денис Воейков