Группа исследователей из Технологического института Джорджии развивает исследовательский проект Vortex, предлагающий открытый GPGPU на базе архитектуры набора команд RISC-V, нацеленный на выполнение параллельных вычислений с использованием API OpenCL и модели выполнения SIMT (Single Instruction, Multiple Threads), а также на проведение исследований в области 3D-графики и разработки новых архитектур GPU. Проект пока находится на стадии прототипа, работающего при помощи FPGA. Схемы, описания аппаратных блоков на языке Verilog, симулятор, драйверы и сопутствующая проектная документация распространяются под лицензией BSD...Подробнее: https://www.opennet.ru/opennews/art.shtml?num=56253
кукурузис или гном будут на ней работать?
У Gnome системные требования гораздо выше, чем у всех Crysis, вместе взятых.
ну так и пользователи получают красоту неописуемую в итоге, всё по делу
"Неописуемая красота" - серо-коричневая гамма(с) эксперты опеннета
> "Неописуемая красота" - серо-коричневая гаммаНу так а Вы попробуйте описать ЭТО цензурными словами ;) Если "запикать", то только запятые и остаются, так что точно - неописуемая ;)
Если бы был геологом, то смог бы описать. А так в пролете.
Требование по графике, нарисовать одну кнопу на полэкрана "За-ись" ;)
Что есть кукурузис?
его Хрущёв продвигал как важную с/х культуру вроде
Эрратив слова Crysis (серии игр)
Раньше Кризис считалась самой требовательной по ресурсам видеоигрой и использовалась как бенчмарк.
Где-то в прошлом тысячелетии.
> Раньше Кризис считалась самой требовательной по ресурсам видеоигрой и использовалась как
> бенчмарк.Несмотря на то что крайзис и правда был графонистым и потому требовательный, но считалась такой потому что разработчики выставили ультра настройки просто циферками - даже лучшее железо по тем временам не могло его потянуть. О чем потом они же и жалели и говорили что нужно было не добавлять изначально ультра настройки, а внести их патчем, когда бы вышло подходящее железо.
Кукурузером обычно зовут Jeep Cruiser
> кукурузис ... будут на ней работать?Читаем внимательно:
> растеризатор отсутствует - все обработка ... на стороне системного CPU
Это так называемая софт-видюха, там, считай, ничего нет, кроме видеопамяти.
> Каждое ядро может ... работать с частотой 250 MHz.
Карл, даже самая первая PSP (17 лет назад), которая тоже MIPS, имела 333 МГц. Может, хватит насиловать MIPS в лице RISC-V? Ведь от перемены названия суть не изменилась...
> которая тоже MIPS
> MIPS в лице RISC-VУ тебя очень глубокие альтернативные познания.
> Карл, даже самая первая PSP (17 лет назад), которая тоже MIPS, имела 333 МГц.Сколько она параллельных потоков вычисления могла гнать? Эта штука до 64 ядер, каждый из которых 1024 потока, то есть выходит 65536 потоков. А в PSP сколько было?
Неправильные у тебя, дядя Фёдор, потоки. "Может" - не значит "одновременно". Делить-то хоть умеешь? Даже если взять мнимую производительность в 128 Gflops (в реале 25) и разделить на твои 65536 потоков, получается ... 2 мегафлопа на поток (в реале - 390 килофлопов)?! Тебе самому не смешно? Понял, где ты ошибся?
> Понял, где ты ошибся?Нет. Объясни. Я не понимаю что за числа тут ты используешь, "мнимая производительность" -- это что? Производительность ведь реальное число без мнимой части, не? Что за числа "в реале"? Это на fpga намеренные? Там в тестах что было "бутылочным горлышком"? Память? Производительность одного потока? Ядра? Короче, не стесняйся, расскажи подробно, я думаю тут многим будет интересно.
Но при этом, ты не ответил про PSP: сколько там было потоков? 1000? 10k? Миллион? Ты можешь не рассказывать про то, что и как ты считал, но на вопрос ответь, не надо так позорно соскакивать, попыткой сменить тему.
> Я не понимаю что за числа тут ты используешьТвои числа. Как тебе объяснить, если ты забываешь то, что сам написал сообщением выше?
Ты так и не ответил на вопрос про PSP. Я всё ещё жду ответа.Среди "моих" чисел не было ни одного про flops'ы, а мой вопрос, если ты вчитаешься, именно про них. То есть и с этого вопроса ты соскакиваешь?
Нет, ждём квантовый GPU.
https://www.youtube.com/watch?v=kcLjj_3jF9w
Когда на Дудя на опеннете ссылки начнут давать?
А, что с ним не так ?
Видео про Кремниевую Долину или интервью с Батыгиным можно всем рекомендовать.
Больший бред ты не найдёшь, аноним. Дудь -- главный эксперт опеннетика по вопросам ИТ, угу.
Название как "Вектор".
Название как "Вортекс".
Как Virtex (Xilinx)
Вообще идея с RISC-V архитектурой просто отличная, но как же оно всё медленно движется. Так и состариться можно, пока ждёшь. Напоминает "десктопный линукс".
Хуже придумать было нельзя прямой путь в фрагментации и вендорлоку, каждого производителя.
Лучшее описание для ARM.
И чем это таким RISC-V лучше ARM кроме того что они не будут платить фирме ARM?
RISC-V открытый, ARM проприетарный.
Возможно, вам будет полезно: https://ru.m.wikipedia.org/wiki/%D0%A1%D0...
о, так это про меня!
Про меня так вообще.
А я отношусь к жизни так, как будто каждый день последний. Чем дальше, тем больше жизнь напоминает толи антиутопию толи фильм катастрофу.
> А я отношусь к жизни так, как будто каждый день последний. Чем
> дальше, тем больше жизнь напоминает толи антиутопию толи фильм катастрофу.Да, похоже.
"Обращает на себя внимание, что популярные источники пытаются приписать этот синдром практически каждому человеку, в то время как в научной среде СОЖ обычно описывают для определенных, узко очерченных групп населения: вахтовиков, жителей северных городов и т.д."
А в чём достоинство то ? Входной порог высокий(+- толковые ядра то как бы нужно самому разрабатывать и верифицировать), выше даже чем у АРМ(там за лицензию заплатил и получаешь сразу готовые ядра, к которым остаётся контроллеры перифирии сделать), очень высокая возможность фрагментации и разброса сред. Поэтому ПМСМ не взлетит пока АРМ не купит какой-нибудь гигант типо нвидии и не начнёт задвигать условия остальным, в противном случае у риск-5 ниша ровно та же, что у мипса. А из академического интереса и для общего развития, я бы лучше советовал обратить внимание на архитектуру ForwardCom(разработал её никто иной как Агнер Фог, известный уверен многим компиляторостроителям, по набору руководств по оптимизации кода).
> Поэтому ПМСМ не взлетит пока АРМ не купит какой-нибудь гигант типо нвидиину, такое...
Достоинство в том, что любой гаражный стартап может выпустить свой процессор.
Куплю гараж.
Если кто-то имеет физическую возможность выпускать процы, ему не нужна чья-то кривая устаревшая архитектура, спёжженная от MIPS.
> любой гаражный стартап можетНет, не может.
>А в чём достоинство то ?Главное достоинство в открытости.
RISC-V в моде, на хайпе. Да и актуальных конкурентов нет.>Входной порог высокий(+- толковые ядра то как бы нужно самому разрабатывать и верифицировать), выше даже чем у АРМ
Есть разные лицензии, есть закрытые, есть открытые.
https://riscv.org/exchange/cores-socs/
Есть готовыве от китайских товарищей.
https://www.opennet.ru/opennews/art.shtml?num=56010>я бы лучше советовал обратить внимание на архитектуру ForwardCom(разработал её никто иной как Агнер Фог
Я специально искал открытое железо ещё до хайппа RISC-V, но про ForwardCom слышу впервые. Если не будет хайпа не взлетит.
>Поэтому ПМСМ не взлетит пока АРМ не купит какой-нибудь гигант типо нвидии и не начнёт задвигать условия остальным, в противном случае у риск-5 ниша ровно та же, что у мипсаНе понял смысла в большей части.
Что мешает делать смартфоны, планшеты, лаптопы, десктопы, серверы на RISC-V?
> Главное достоинство в открытости.Ты сейчас упадёшь со стула, но x86 - тоже открытая архитектура. Так что, прежде чем бросаться громкими терминами, наведи порядок в своём словаре.
Какая имено: Intel x86, AMDx64? Где можно ознакомиться с архитектурой набора команд? Я могу начать производство?
> Где можно ознакомиться с архитектурой набора команд?Господи... Откуда вы вылезли?! Холодильник разморозился случайно, что ли?
По сути ответить есть что?
Ознакомиться можешь (приознакомиться). Начать производство без нашего разрешения - нет.
>Ты сейчас упадёшь со стула, но x86 - тоже открытая архитектура. Так что, прежде чем бросаться громкими терминами, наведи порядок в своём словаре.Наврал то ,наврал.......X86 закрытая и запатентованная архитектура.Если ты выпустишь што-то сложнее Пентиума MMX без лицензии то тебя засудят.Есть 6% альтернативных производителей-у них специфический рынок-контроллеры,промышленное оборудование и внутренний Китайский госсектор.И все эти производители выплачивают лицензионные выплаты.Есть правда небольшой пробел позволяющий ускользнуть от выплат-сделать эмуляцию на уровне микрокода процессора (при этом архитектура процессора должна иметь свой набор команд-так решил суд по дело против DEC Alpha,признав эмуляцию законной-но с выплатами за набор команд),но на рынок где действуют софтовые патенты тебя не пустят и Госдеп наложит санкции на фабрику где эти процессоры выпускают чтобы запчасти тебе не поставляли.И также не забываем что до 2020 года действовало антимонопольное соглашение с Интел- о разумных патентных выплатах и равноценном доступе к технологиям.
>X86 закрытая и запатентованная архитектура.Если ты выпустишь што-то сложнее Пентиума MMX без лицензии то тебя засудят.Вам надо определится- закрытая или таки можно выпустить.
>Вам надо определится- закрытая или таки можно выпустить.Закрытая,но можно выпустить устаревшие процессоры из-за истечения срока действия патентов.Так понятнее? Я же прямо говорю-есть лазейки из за того что в некоторых странах чисто софтовые патенты не действуют.Есть прециндент в Сша против Des разрешив эмуляцию с уплатой рояльти за набор команд,вдобавок притив Интел действовало до 20 года интимонопольное соглашение.Что тут не ясно? Не будь антимонопольного соглашение Амд,Суrux,Via,Idt шли дружно сосать леденцы-могли только 8086 и до 286 выпускать по старой ЛИЦЕНЗИИ.
> Главное достоинство в открытостиКакой открытости ? Набора команд ? Ну тогда чем x86 и АРМ не устраивают ? Открытость набора команд полезно только тем, кто на спичках экономит, потому что вся выгода в том, что не нужно его лицензировать, но эта экономия сразу разбивается на тот важный факт, что вам нужно вложится в разработку ядер и верификацию, да так ещё вложится, что вы придёте к факту, что лицензия на АРМ, с готовыми ядрами - всё равно дешевле. Повторюсь, я уверен, что вся соль риск-5 заключается в том, чтобы в случае чего корпорации могли соскочить с АРМа, если его купит крупный конкурент. Вас ещё не удивило, что АРМ при всей своей сочности так никто и не купил ? Даже нвидия не спешит.
>Да и актуальных конкурентов нет.
Мипс напомню не так давно открылся, более того, вроде даже с графическим ядром.
Да его никто и не пиарит, просто обращаю внимание, может кому интересно, т.к. Агнер Фог - мужик известный, а архитектура будучи исследовательской ставит целью быть ни много, не мало - "идеальной".
> Если не будет хайпа не взлетит.
Хайп тут не при чём, всё упирается в экономическую целесообразность и уникальные качества, где "открытость" ничего на деле не даёт, весь смысл риск5 по-моему заключался в том, чтобы на всякий случай иметь альтернативу, если АРМ потеряет независимость и найдётся крупный игрок, способный диктовать условия.
> Не понял смысла в большей части.
> Что мешает делать смартфоны, планшеты, лаптопы, десктопы, серверы на RISC-V?Так делайте, кто вам запретит делать смартфоны без железа, ПО, да за копейки вложений.... Деньги мешают, да так, что с учётом требуемых средств потянет разработку такого процессора(ПО к нему и экосистемы) только крупная компания или корпорация, либо "стартап", в который будет вкладываться та же крупная корпорация, которая потом его выкупит. Стартапы - это лишь дешёвый способ поиска идей корпорациями, да полигон для испытаний.
>Мипс напомню не так давно открылся, более того, вроде даже с графическим ядром.Владелец поменялся-"слово" забрал.В общем Сша резко передумали отдавать технологию mips китайцам,выплыли сказочные долги,мутки из-за этого с акциями ,Китайское юридически независимое отделение Mips сейчас в подвешенном состоянии.
>Повторюсь, я уверен, что вся соль риск-5 заключается в том, чтобы в случае чего корпорации могли соскочить с АРМаПроизводить свои чипы и SoC-и независимо от Intel, AMD, ARM. Можно быть уверенным в отсутствии аппаратных закладок.
>Мипс напомню не так давно открылся, более того, вроде даже с графическим ядром.
Тоже несколько лет тому назад читал про OpenMIPS. Решили забить на мипс в пользу риск https://www.opennet.ru/opennews/art.shtml?num=54725
Про ForwardCom впервые услышал от тебя, хотя знаю про opensparc, openriscc, openpower, mips open. Пиар значит все. Есть пиар, развивает, нет пиара не развивается. ForwardCom может быть лучше чем RISC-V но SoC-и на его основе не производят.>Так делайте, кто вам запретит делать смартфоны без железа, ПО, да за копейки вложений
Железо есть. ПО и "экосистему" наваять на коленке тоже можно.
>либо "стартап", в который будет вкладываться та же крупная корпорация, которая потом его выкупит.
А вот это хорошоая идея, спасибо.
>как бы нужно самому разрабатывать и верифицировать)Нет, не надо, есть конторы которые за тебя это сделают. Yadro тоже самое.
> есть конторы которые за тебя это сделаютАга, я знаю такую, называется ARM :)
ARM продаёт лицензию на Архитектура набора команд. ARM не производит.
Перечитай внимательно: "разрабатывать и верифицировать". А ты что сказанул? "не производит"...
Ну я имел ввиду что они продают лицензию на ядра и не занимаются производством SoC-ов.
Нет, ARM в основном продаёт IP ядра с реализацией Арзитектуры набора команд. В мире RISC-V тем же самым занимаются например Syntacore и CloudBEAR - покупаете у них ядро, обвешиваете своей периферией и получаете то же самое, что получаете на ARM, только на открытой арзитектуре.Не, ну то есть "лицензию на Архитектура набора команд" АРМ тоже продаёт, но покупают её за бешенные деньги только такие монстры, как Apple, Samsung и Qualcomm. Это примерно то же, что в RISC-V раздают бесплатно.
Я это все имел ввиду, только сформулировал коряво.
У этих разработчиков есть ли графические ядра на risc-v, хотя бы для мобилок?
Открытого ГПУ нет, это факт. Но есть борда на RISC-V Alibaba XuanTie C910 и видео Vivante GC8000UL GPU. Вот только не купить.
во эта https://habr.com/ru/news/t/583804/
Купи Aries Embedded PolarFire SoC FPGA Module: https://shop.aries-embedded.de/system-on-module/m/m100pfs/44...
В смысле медленно? Ещё лет 6 назад про неё в принципе мало что было слышно, а пару лет назад уже можно было купить устройства или пройти курс в западных вузах.
Если ты про неё не слышал, это не значит, что она не существует уже 11 лет.
>Встроенный растеризатор отсутствует - все обработка геометрических операций выполняется на стороне системного CPUАн нет. Не крутые. Халтурщики. Димона на них нет.
Димон ничего не заметит. Ему фейковый (фанерный) футуристический трамвай показывали, проглотил.
Vortex - это такая звуковуха компании Aureal :) AU8820/AU8830.
Нет, Vortex это предпоследняя песня на второй стороне у Megadeth 97 года.
Vortex Estina II (FL-C) это самоходная рикша такая.
Это половина названия российской рок группы
Vortex - это заклинание хаоса из Master of Magic
Vortex86
Nyuzi интереснее
> gpgpu
> risc-vМаразм крепчал.
Сейчас бы общие (неспециализированные) вычисления выполнять на специализированном оборудовании.
Там, как раз, наоборот, специализированные вычисления на общем (неспециализированном) оборудовании.
Ты понял, что значит специализированные (не общие) вычисления, и чем они отличаются от неспециализированных (общих)? Можешь объяснить? Я вот совсем не понимаю, о чём речь.
GPGPU - общие вычисления на графическом (специализация) процессоре. Это уже оксюморон (давайте микроскопом делать повседневные задачи, например отбивать мясо). А еще давайте запихнем набор команд riscv. Вычислительный кластер на чипе.
Графические вычисления на общих ядрах (чуть подрихтованных).
>OpenCLЭто же старенький API. Думал, все новое теперь в делается через Compute shaders.
Я бы им посоветовал делать сразу Vulkan Compute без альтернатив. Пока они его доделают - все остальные либо отомрут, либо будут готовые обёртки поверх.
> Это же старенький API.Не мешай им эксплуатировать архитектуру MIPS 1985 года :)
В 1985-м был OpenCL?
GTX 1050 = 2.3 TFlops
New Vortex GPGPU = теоретически максимально 128 GflopsТ.е. в самом лучшем случае на максимальных ядрах будет в 18 раз медленнее чем обычная 1050.
А что ты хотел от рисквы? Сразу же говорили, что это тормоз. Видюхи строятся совсем по другой микроархитектуре.
и что такое "рисквы"? не RISC-5 же?
>добавить поддержку API CUDACUDA закрытая-прикрытая, патентованная перепатентованная, как они это собираются делать?
API открыт.
https://docs.nvidia.com/cuda/cuda-runtime-api/index.html
> API открытС таким же успехом можно сказать, что x86 открыт. И он на самом деле открыт: команды документированы даже лучше, чем у рисквы.
Только поробуй сделать независимую реализацию, сразу нарвёшься на юристов Невидии.
Вообще-то сделали и не наткнулись. Но оказалась на хрен никому не нужной, потому что работы ещё там много до нормального использования, а народу это на хрен не нужно, кому работать нужно "stack moar layers", тот покупает невидию и не выё*ивается. И проприетарный драйвер использует.
Так же, как AMD HIP, наверное.
Это не GPU. Просто ещё одна числодробилка, наподобие китайских серверных ускорителей.
Я не вижу, чтобы кто-нибудь говорил про GPU,
Прочитай хотя бы первый абзац.> RISC-V, нацеленный на ... проведение исследований в области 3D-графики и разработки новых архитектур GPU
Архитектура не равно видеокарта. Это как в своё время hardware tnl было довольно интересным решением, но бесполезно чуть более чем целиком само по себе.
> не равно видеокартаУ тебя то GPU, то видеокарта, ты уж определись.
Где у меня то видеокарта то видеокарта? У тебя всё хорошо? Видеокарт никто и не обещал, я об этом сказал. Да и смысла в них нет, какие ещё видеокарты на недоархитектуре.
> Я не вижу, чтобы кто-нибудь говорил про GPUПри этом про GPU сказано в первом абзаце. Если ты не видишь (или не умеешь читать?), попроси маму прочитать тебе статью.
P.S. Хотя, судя по ответам, действительно не читаешь то, на что отвечаешь.
Ты уверен, что проблемы с пониманием тут не у тебя? Напрасно.
дум потянет?Давеча китайцы пилили линуксовые мипсовые (все таки чуточку посвободнее чем арм будет) портативки с возможностью эмулировать вплоть до игр с пс1 включительно. Но потом уткнулись в потолок производительности и ушли в арм, тем самым потеряв в привлекательности (ибо, ну - теперь это просто мобилки с древним железом и встроенным джойстиком).
Как считаете, господа диванные эксперты - у рисков есть возможность влезть в эту нишу? Как по мне, open hardware ретро консоль в которую можно залипнуть в дороге - звучит вполне себе привлекательно
Рисква - это тот же MIPS. Результат будет, естественно, хуже.Карманная игрушка PSP (2004) - 333 МГц
Суперсовременный рисквовортекс (2021) - 250 MHz
250 МГц потому, что на FPGA. На FPGA вообще ничего более 300 МГц не получается. Запустите любой процессор с opencores.org на ней, получится ~100 МГц выжать.
Дядя Фёдор, этот Стратикс имеет частоту 1 ГГц на всё: и логика, и память, и DSP-блоки... Это как надо накуролесить, чтобы уронить её в 4 (!!!!) раза...
> получится ~100 МГц выжать.Сотка выжимается на самом дохлом первом циклоне, потому что даже у него память уже на 200 МГц работает. А тут - стратикс 10, гигагерцовик.
Так и FPGA бывают разные.
Что такое "рисква"? Речь же о RISC-5.
Ладно, этот вопрос задам я.
Майнить то на нём можно будет хотябы на уровне 1660 ?
Зачем вам прослойка в виде GPGPU между майнером и FPGA, на котором сделан сабж?
Я хотел спросить, но постеснялся. Вдруг тут кто-то в BOINC участвует или рассчитывает полёт на Луну.
Для Луны было достаточно калькулятора Б3-34. Сабж как раз где-то рядом.
> Для Луны было достаточно калькулятора Б3-34. Сабж как раз где-то рядом.а также куча монтажеров, склейка фотографий, спецэффекты и всё равно пришлось "потерять плёнки" в 2009м ибо слишком палевно было.
Можно сделать криптовалюту, которая будет майниться на этом. Чтобы стимулировать производство железа.
> нацеленный на выполнение параллельных вычислений с использованием API OpenCLА тем временем в "опенсорсном" блендере выпилили OpenCL в пользу проприетарного, vendor lock-in CUDA
Дак тут рисквоводы тянут архитектуру MIPS, которая с 1985 года... Про блендер они узнают лет через 10-15.
У меня с 2008 года операционная система Gentoo Linux я использую OpenCL для https://www.svp-team.com/ru/home/ Видеокарта https://www.sapphiretech.com/ru-ru/consumer/nitro-rx-570-8g-... с mpv и в качестве оболочки smplayer.Работает vaapi через libva и mesa на opengl.Но нативный opencl clover от mesa не катит поэтому gentoo предоставляет выдернутый opencl из amgpu-pro https://mirror.yandex.ru/gentoo-portage/dev-libs/amdgpu-pro-.../ Все не просто работает а работает очень хорошо.Нивидя таких плюшек не дает.Единственное расстройство что svp проприетарен а соответсвенно может сливать что не гуд.Я всетаки придерживаюсь заветов Ричарда.Еще надо mpv откомпилировать или в пакете установить vapoursynth без него уплавнялка видео работать не будет.Кстати данные уплавнялки аля 60fps имеются в некоторых телевизорах.У меня плазменная панель samsung там такого нет.Есть аналог под окна это https://mirillis.com/ru/free-hd-video-player У меня это работало на радиках просто великолепно но к сожалению и к счастю платно как кому на выбор.На современных процессорах не знаю у меня fx-9590 4.7 загрузка на ядре zen-sources-5.14.15 при воспроизведении 60 fps гдето 25%.[сообщение отредактировано модератором]
> Нивидя таких плюшек не даетТам тоже есть OpenCL
Имел ввиду 60fps при использовании svp и OpenCL от amd-gpu-pro
> FPGA Altera Stratix 10
> FPGA Intel Arria 10 и Intel Stratix 10Свободное железо со свободными тулчейнами или проприетарь?
И это учитывая, что оный стратикс - 1 ГГц (логика, память, DSP-блоки), а поделка рисковая на нём - всего 250 МГц... Т.е. в лучшем случае при выпуске этого недоGPU в железе получим от силы 500 МГц...
>в лучшем случае при выпуске этого недоGPU в железе получим от силы 500 МГц...Если объём адресуемой памяти будет нормальным то это будет не такая уж и плохая частота.
Все это болтовня и обсуждение иностранных технологий у меня есть знакомый который пытался развить FPGA в формате разработок и развития технологий в Росии он на все плюнул понял и ушел работать в банк на инженерные системы.Ни чего у него не получилось развить.Я работал в компании микроника-лисис и министр новак нам тоже много обещал а что в итоге мы разработали конкурентный продукт по программному управлению электроподстанциями.Который опережает на 30 лет текущие технологии а нам сказали все хватит такое не нужно слишком круто.Наш директор Давид Кишеневский сделал все что мог почет ему и уважение.В итоге ребята 40+ выпускники старой школы все за границей.
Очередные сказки неудачников :) Всё, что могут, только работать эникейщиками, в лучшем случае - за бугром, исполняя приказы индусов, которые идут выше по пищевой цепи.
Как Сергей Савельев, например.
Когда уже выпустят чип, жрущий напрямую биткод LLVM?
Чтобы повторить факап жабы в ARM?
кстати, а чем дело то закончилось? Так радовался народ когда появились процессоры с прямым исполнением байткода... и чем кончилось?
Я просто оставлю это здесь: https://en.wikipedia.org/wiki/Larrabee_(microarchitecture)
Я сам разрабатываю свой процессор, который может работать как CPU и как ядро GPU, поэтому полью это поделие говнецом.1. Я разрабатывал в первую очередь ALU на уровне транзисторов буквально чтобы минимизировать площадь и энергопотребление. У микросхем есть два важных параметра - non recurrent expences(NRE) и recurrent expences(RE). Оба эти параметра надо снижать уменьшая площадь изделия. А так же потому что а)патенты! патенты! патенты на всё, даже пернуть нельзя не нарушив патент. б)ALU должны быть многофункциональными, то есть подблоки должны уметь комбинироваться для выполнения разных операций и тем самым еще сильнее снижать площадь. Я не увидел этого в risc-v от слова совсем. Аналогично регистровый файл - это вторая критическая точка оптимизации, которую они скорее всего реализовали "стандартно-библиотечно", то есть через жопу. Для эльбруса например РФ свирепо оптимизировали, хотя там далеко не гигагерцы.
2. Он еще и греться будет, ибо стандартные ячейки 60% энергии сливают на сквозной ток при переключении(потому что SVT-транзисторы с 0.4v порогом при питании 1.2v дают зазор в 1.2-0.4-0.4=0.4 вольта на переключении когда ячейка открыта накоротко, и 20% на статическую утечку, потому что короткие затворы. 80% энергии в трубу. Самое эффективное - это домино-логика с мультиплексорами и LUT на n-транзисторах и в конце инвертор на HVT-транзах с порогом 0.7v и толстым затвором, который p-транзом сидит на питании, а нижним смотрит в выход мультиплексора/LUT, а тот на ноль. Дальше latch также на HVT. И быстро и холодно.
3. Система команд: это второе узкое место. Я её адаптировал к бинарной трансляции х86, т.е. команды по 13бит пакуются в 64битные пачки, с заголовком для синхронизации и управления в 12бит и достаточно точно отображаются на отдельные байты команд х86-64. При этом есть префиксы для векторных операций, которые используются для эмуляции AVX и для шейдерных операций, сам рендерер на llvm-pipe т.к. минимум изменений требуется. Выборка идёт по нескольким указателям инструкций, при этом есть команды fork и join. Это называется strand-level parallelism и позволяет быстро перестраивать "плотность" шейдеров на процессорный модуль. И это всё сделано чтоб обойти патенты.
В риске я вижу что-то между AMD GCN и мертворожденным Intel Larrabee, причем сильно ближе к последнему. Там просто чудовищное количество патентов от интела. Да и сам подход larrabee убог в принципе от чего и сдох. Сам набор команд(они не постеснялись опубликовать его) - днище. Возникло впечатление, что люди которые его придумывали, никакого отношения к процессорам не имеют, а просто взяли мануал по opengl1.4 и на каждую функцию сделали по "инструкции".
4. Кэш данных. Внезапно, Write-Back кэш для таких задач не подходит. Write-Thru с огромной ассоциативностью(буквально массивы компараторов адресов нужны) и при этом надо добавить регистр, блочащий часть кэша и не дающий её вытеснять. Вот эти моменты надо проверять на симуляторе, причем не обязательно через verilator гонять или симулировать. Можно примитивную модель на С++ написать, снять программой для трассировки вулкана или opengl лог с пары игр и попробовать прогнать через модель. Проблемы с обычным WB кэшем(а у них именно _обычный_ кэш) будут видны сразу потому что ему может влегкую не хватить ассоциативности, когда целый варп шейдеров постучит по кратным адресам, встанет в ожидание, за ним следующий вытеснит данные предыдущего и сам встанет, и так они начнут гонку вплоть до live lockа.
Это даже не мертворожденный проект, это глина номер 4 какая-то.
https://www.intel.com/content/dam/www/programmable/us/en/pdf...
даже ниже 500 мгц.если взлетит безмасочная литография, то это всё художество на плисинах станет ненужно.