> Amlogic S905X VP9 Profile-2 up to 4Kx2K@60fps
> HiSilicon Hi3798MV200 - 4Kp60 10-bit H.265 and VP9 decoding И в каком месте там GPU или DSP? Это fixed function блок как правило. Он понимает полтора формата. И все дико глючит если данные вылезли за его constraints. Попытаться смотреть свою коллекцию мувиков на планшете, уповая на хардварный блок имеет тенденцию быть эпикфэйлом.
Откровенно софтварный разве что Zii был с массивом акселераторов. Недокументированный и нафиг никому не нужный уже сколько лет. В результате бобик сдох. Вместе с Ti OMAP и его суперценным DSP, который всегда был источником гимора.
Но вы подождите, сейчас вам промышленность даст мастер-класс по fixed-function HW и зачем это надо. Если вы не знали, в январе Open Media Alliance должен финализировать спеки своего AV1. Кодек у них уже есть. Браузеры уже взяли под козырек, даже MS. И вот тут вы быстренько ощутите все прелести GPU, DSP и FixedFunction - отправитесь как миленькие покупать новые чипы если захочется ютуб в нормальном качестве без дикого трафа (особенно мобильным юзерям).
> В добавок они еще и сжимать в H.264/H.265 в реальном времени могут
> с хорошим качеством.
Я рад за них. Но вот хорошее качество достигается исключительно использованием дьявольского битрейта, если вы не заметили. У реалтаймной железки нет времени на full motion estimation и прочие продвинутости типа оптимизации кодирования битов. Так то и MPEG2 дает нормальную картинку, если битрейта накинуть. Но такой подход всех достал еще в DVD.
> AFAIK там не все так уж прибито.
Порой такой блок синтезируют в RTL чуть ли не из обкоцаных сишных сорцов кодека. А после того как отлито в железе - изменению не подлежит совсем. И ща вы с AV1 это выкусите, в пределах полугода.
> В софте тоже больше маневра для рендера, чем GPU, однако польза GPU очевидна.
> Самая большая проблема - закрытые драйвера и отсутствие datasheet'ов.
Есть открытые драйверы на линухе и проч. Но gpu-based кодеков пока не видно. В основном видно opencl постпроцессинг. Тоже хорошо, т.к. ресурсоемкая операция а картинку улучшает, но все-таки не кодек.
> AFAIK там в ARM64 появились спец инструкции для крипто (читай аналог спец
> CPU), отсюда и прирост, а не от размера регистров.
Если вы почитаете криптографические тусовочки, заметите что все крипто откровенно оптимизируют на 64 бита. Так можно воротить меньше отдельных операций с тем же результатом. На 32 битных архитектурах современное крипто чувствует себя не в своей тарелке. Железо умело фичи. Многие годы. Програмеры ими стали пользоваться. По этому поводу на микроконтроллерах, даже 32-битных, приходится разборчивость проявлять в выборе алгоритмов.