The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

В Gstreamer добавлена возможность ускорения c задействованием OpenCL

02.02.2012 20:08

Для мультимедиа-фреймворка Gstreamer подготовлен плагин gst-plugins-cl, позволяющий задействовать OpenCL для ускорения обработки видеопотоков за счет выноса выполнения некоторых вычислительных операций на плечи GPU. В частности, подобная акселерация может быть полезна для применения фильтров к видеопотоку, которые могут быть полностью реализованы на стороне GPU.

  1. Главная ссылка к новости (http://www.phoronix.com/scan.p...)
  2. OpenNews: Увидела свет спецификация OpenCL 1.2
  3. OpenNews: Представлена открытая реализация OpenCL, базирующаяся на использовании LLVM
  4. OpenNews: Компания Intel выпустила OpenCL SDK для Linux
  5. OpenNews: Компания ST-Ericsson открыла код для поддержки GStreamer на платформе Android
  6. OpenNews: Релиз мультимедийного фреймворка GStreamer 0.11
Автор новости: Аноним
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/32973-gstreamer
Ключевые слова: gstreamer, opencl, gpu, video
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (29) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 21:12, 02/02/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • –3 +/
    Лучше бы они его научили метаданные/теги из потокового вещания вылавливать.
     
     
  • 2.2, Аноним (-), 21:21, 02/02/2012 [^] [^^] [^^^] [ответить]  
  • +10 +/
    Не знаю кому там лучше, но вычисления на GPU - это будущее. Глупо на него забивать.
     
     
  • 3.13, anonymous (??), 01:16, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Вообще то GPU не CPU, например они не могут вытеснять "задачи", проще говоря когда что-то будет задействовано на твоей единственной видеокарте, то ощутишь заметные тормоза интерфейса. Вплоть до полусекундных замираний курсора мыши. Можешь конечно прикупить еще одну дополнительную видеокарту специально для OpenCL, но не для всех это так просто.
     
     
  • 4.20, Карбофос (ok), 16:26, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    http://www.3dnews.ru/news/622822
     
  • 4.21, Аноним (-), 18:20, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Вообще то GPU не CPU, например они не могут вытеснять "задачи",

    Вообще-то GPU это такой очень специализированный вычислятор, способный воротить горы за короткое время. Иначе б оно не успевало обсчитывать картинку для 3D игр с внятным фпс-ом. То что эта силища наконец пущена и для более дельных применений - EPIC WIN! :)

    > то ощутишь заметные тормоза интерфейса.

    Только в случае если кернел займет gpu на значительное время.

    > Вплоть до полусекундных замираний курсора мыши.

    В клинических случаях - в принципе возможно, только вот если gstreamer рискнет это делать при просмотре видео - его засыпят багами. А в случае батч-обработки когда никто не смотрит на экран, факт что кино запроцессилось за 1 час вместо 20 может спокойно перевесить весь этот бухтеж.

    Тем не менее, насколько я знаю, амд что-то такое говорило о преемптивности недавно.

    > Можешь конечно прикупить еще одну дополнительную видеокарту специально для OpenCL,

    Ты будешь ржать аки конь, но именно это я и сделал ;]

     

  • 1.3, Atterratio (ok), 21:35, 02/02/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Неужели, наконец то!
     
  • 1.5, Аноним (-), 21:43, 02/02/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А vdpau/vaapi ? Вроде грозились сделать. Вообще позор, да. На дворе 2012 год, а фактически дефолтный медиадвижок не умеет аппаратно декодировать видео.
     
     
  • 2.6, Аноним (-), 21:48, 02/02/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > А vdpau/vaapi ?

    OpenCL - это _произвольные_ вычисления а не какое-то там галимое акселерирование предопределенных производиотелем форматов потоков. Так можно какой-то полностью кастомный эффект допустим обсчитывать. Например видится возможность допустим сделать деблокинг не надрывая на это проц а сбагрив сие на GPU. С его кучами SIMD он с удовольствием раскрушит сие по чуть ли не полкадра за такт, в отличие от проца, которому сие слабо за отсутствием сотен или даже тысяч параллельных элементов, которые однако ж за 1 такт применяют операции к сразу чуть более чем дофига данных за раз параллельно ;)

    > Вроде грозились сделать. Вообще позор, да. На дворе 2012 год, а фактически
    > дефолтный медиадвижок не умеет аппаратно декодировать видео.

    Плач по турбовинтовому самолету при конструировании суборбитального реактивного самолета выглядит довольно забавно, да :)

     
     
  • 3.7, Аноним (1), 21:54, 02/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Плач по турбовинтовому самолету при конструировании суборбитального реактивного самолета выглядит довольно забавно, да :)

    Суборбитальный реактивный самолет без шасси и иллюминаторов... Летает тоже, да.

     
     
  • 4.9, Аноним (-), 22:17, 02/02/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Суборбитальный реактивный самолет без шасси и иллюминаторов... Летает тоже, да.

    А турбовинтовой сколько ни твикай, на орбиту не взлетит :P

     
     
  • 5.18, Аноним (-), 08:06, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > А турбовинтовой сколько ни твикай, на орбиту не взлетит :P

    Но большинству не нужно на орбиту, а нужно из точки A в точку B и чтобы пешком выходить, а не с парашютом прыгать :-)

     
     
  • 6.30, Аноним (-), 16:26, 04/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Но большинству не нужно на орбиту, а нужно из точки A в
    > точку B и чтобы пешком выходить, а не с парашютом прыгать :-)

    Насчет не нyжно - хм... вообще, я встречал очень мало людей которые отказались бы от безопасного суборбитального полета за разумные бабки, если что :). И за прыжки с парашютом многие готовы еще и доплачивать почему-то, что дает почву для существования соотв. клубов по интересам :)

     
  • 3.11, Аноним (-), 23:15, 02/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    >OpenCL - это _произвольные_ вычисления а не какое-то там галимое акселерирование предопределенных производиотелем форматов потоков.

    Оно наверное не просто так предопределенное - там наверняка все оптимизированно.
    >Так можно какой-то полностью кастомный эффект допустим обсчитывать. Например видится возможность допустим сделать деблокинг не надрывая на это проц а сбагрив сие на GPU. С его кучами SIMD он с удовольствием раскрушит сие по чуть ли не полкадра за такт, в отличие от проца, которому сие слабо за отсутствием сотен или даже тысяч параллельных элементов, которые однако ж за 1 такт применяют операции к сразу чуть более чем дофига данных за раз параллельно ;)

    В отличии от opencl, vdpau/vaapi это не только декодирование, но еще и вывод видео(причем с деблокингом, деинтерлейсингом и прочей постобработкой силами видеокарты). А значит придется два раза гнать видео, один раз для декодирования, второй раз для вывода.
    Кроме того, у меня лично opencl/cuda приложения настолько грузят видео, что даже без композитного менеджера окон становится очень медленно. А тут еще надо вывести.
    И нормальный енкодер в h264 на cuda/opencl пока не написали почему-то.
    Ну и плюс ко всему, аппаратно декодировать могут не только видеокарты, есть еще всевозможные платы crystalhd броадкомовские, omx на армах...
    >Плач по турбовинтовому самолету при конструировании суборбитального реактивного самолета выглядит довольно забавно, да :)

    Только ЭТО прямо скажем так не суборбитальный реактивный самолёт, а прямо скажем велосипед.

     
     
  • 4.23, Аноним (-), 20:30, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    А у автомата оплаты предельно оптимизированный юзеринтерфейс для одной конкретно... большой текст свёрнут, показать
     
  • 3.12, Аноним (-), 23:19, 02/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Ах да, плюс нужные кодеки придется переписывать на opencl, что нифига не быстро и не просто.
     
     
  • 4.24, Аноним (-), 20:32, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Ах да, плюс нужные кодеки придется переписывать на opencl, что нифига не
    > быстро и не просто.

    Целиком - нахрен не надо. Самые тяжелые и ресурсожоркие куски, занимающие львиную долю времени CPU и параллелизуемые выпнуть в кернел, ну и хватит, имхо.

     
  • 3.14, anonymous (??), 01:20, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Для OpenCL GPU нужна отдельная видеокарта, они не умеют так быстро пререключаться по задачам как CPU. Иначе GUI будет подтормаживать. Даже самое последнее поколение AMD 7xxx этим страдает и никаких намеков на изменение ситуации в будущем.
     
     
  • 4.15, anonimous (?), 02:04, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Практически все новые ноутбуки(за исключением бюджетных на интеловских карточках) поставляются с двумя видео картами - одна интел, с эффективным энергосбережением подходит для повседневной работы, а вторая nvidia или amd для игр. И переключение на более производительную видеокарту происходит автоматически при запуске ресурсоёмких до GPU программ.
     
     
  • 5.16, 1 (??), 04:39, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    ну переключится бук на нвидию после запуска этого плагина, и начнет ею тормозить, в чем профит?
     
     
  • 6.17, mma (?), 07:07, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • –3 +/
    Да бесполезно спорить. ну не понимают люди что ничего кроме матриц на GPU не посчитать, и то только целочисленных, с плавающей вопрос в точности. Ну может есть узкий круг задачь где GPU есть смысл задействовать, на на десктопе рядового пользователя или инженера их не будет с вероятностью 99%

    А уж задействовать OpenCL как "фоновый ускоритель" это вообще глупость, видеокарта "считает" по принципу "получил-посчитал-показал(вернул) и пусть весь мир подождет"

     
     
  • 7.26, Аноним (-), 20:37, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > по принципу "получил-посчитал-показал(вернул) и пусть весь мир подождет"

    Отсюда вывод: фоновые вычисления должны быть кратковременными в пересчете на порцию данных. А у плеера они всяко должны уложиться в реалтайм. Если вы будете 5 секунд декодить даже 100500 кадров в параллель, то чего эти 5 секунд показывать юзеру, которого явно не пропрет заклинившая картнка?!

     
  • 7.29, Аноним (-), 01:56, 04/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Ерунду городите. Сжатие\декодинг видео, обраотка фото... - можно ускорить. Брутфорс опять же.
     
  • 7.31, Аноним (-), 16:32, 04/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Да бесполезно спорить. ну не понимают люди что ничего кроме матриц на
    > GPU не посчитать,

    Ага, то-то я полмиллиарда SHA1 в секунду могу скрушить на GPU, раз в 30 больше чем мой проц разопрется :)

    > и то только целочисленных,

    А вот фиг, крушить плавучку оптом видеокарты тоже умеют.

    > с плавающей вопрос в точности.

    Нужна двойная точность с большой скоростью? Вам на дорогие топовые GPU :P. Да, 10-баксовая затычка для слота урезана по всем параметрам.

    > Ну может есть узкий круг задачь где GPU есть смысл задействовать,

    Он узкий лишь потому что до недавних пор не было удобных стандартных механизмов. Как максимум народ изгалялся считая данные как графику, шейдерами, но это адов изврат и наконец то механизмы вычислений вывесили как нечто более удобоваримое и менее извращенское :)

    > на на десктопе рядового пользователя или инженера их не будет с вероятностью 99%

    3D играм это расскажете, ага. А то как раз одна из задач. Просто теперь эта механика стала видна не только для вычисления 3D сцен, только и всего :-)

    > А уж задействовать OpenCL как "фоновый ускоритель" это вообще глупость, видеокарта "считает"
    > по принципу "получил-посчитал-показал(вернул) и пусть весь мир подождет"

    Значит вычисления в реалтаймных приложениях типа плеера должны завершаться быстро. Они и на CPU по времени лимитированы: не успел декодировать кадр вовремя - дроп кадра или тормоза мувика, если кадр нужен дальше и потому не дропабелен.

     
  • 6.27, anonimous (?), 22:59, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Нет, это работает совсем не так. Механизм следующий: часть приложений могут использовать видео карту intel, а часть видеокарту nvidia/amd, таким образом, получается что рабочее окружение всё считает через intel, а игры считаются через nvidia/amd, но вывод на экран уже готовой картинки осуществляется всегда через видеокарту intel. Загруженность дискретной карты nvidia/amd никак не влияет на загруженность интегрированной видеокарты intel.
     
  • 6.28, anonimous (?), 23:03, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    короче говоря работают две видеокарты одновременно но вывод на экран общий через интеловскую карту.
     
     
  • 7.32, Аноним (-), 16:33, 04/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > короче говоря работают две видеокарты одновременно но вывод на экран общий через
    > интеловскую карту.

    А это было бы вообще довольно умно, но пока это первые эксперименты с технологиями, оно еще не устаканилось, но вероятно к чему-то более-менее устоявшемуся и в примерно такоа виде и придет.

     
  • 4.25, Аноним (-), 20:34, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Для OpenCL GPU нужна отдельная видеокарта, они не умеют так быстро пререключаться
    > по задачам как CPU.

    Отсюда вывод: opencl кернель для фильтра ориентированного на реалтайм должен завершаться за короткое время. Это так внезапно! Но почему-то это характерно для вообще всех операций  в видеоплеере, не обязательно вгружаемых в видеокарту :))

     
  • 2.19, Аноним (-), 11:08, 03/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    http://gitorious.org/vaapi/gstreamer-vaapi
    Это?
     
     
  • 3.33, Аноним (-), 14:27, 05/02/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Не знаю как вообще, но у меня на нвидии оно не заработало.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру