Вообще любой процессор -- это интерпретатор. В простейшем варианте -- это декодер команд, который инициирует какие-то блоки, типа сумматоров, мультипликаторов, и прочих. Причём иногда это выливается в последовательности действий, типа загрузить значение из памяти на вход сумматора, после чего считать значение с выхода и записать в память. А, ещё флаги надо не забыть расставить в соответствии с.Но фишка ведь в том, что если есть последовательность действий, то можно организовать конвеер, то есть начинать выполнять следующую команду до того, как завершится предыдущая. Пока выполнение предыдущей команды возиться с сумматором, можно извлекать из памяти данные для следующей команды. И параллельно вычитывать из памяти третью команду, чтобы потом не тратить на это время. При этом, ведь, подчастую команда машинного кода в памяти, требует обширного препроцессинга, прежде чем её можно будет взять и выполнить. Скажем, команда которая добавляет к 64-битному регистру 8-битное значение -- это восьмибитное значение надо расширить до 64 бит, прежде чем загружать в сумматор. Это несложно -- надо же просто нулями забить 56 бит, но тем не менее это тоже требует времени, а процессорные такты не стоят на месте, убегают.
А некоторые команды можно выполнять параллельно, поэтому на один поток команд можно завести несколько конвееров.
И вот тут как раз, напрашивается появления всех этих микроопераций. Они простые, их не так много как в сложном CISC наборе команд x86, можно иметь много блоков для их выполняния и, скажем, выполнять параллельно сразу много сложений в рамках одновременно выполнения разных команд требующих сложения -- типа add, sub, inc, push, jmp... Не надо заводить отдельный сумматор на каждую возможную инструкцию CISC кода, в процессе выполнения которой надо складывать. Отдельных сумматоров, которые чаще будут простаивать, чем работать. Можно иметь один-два сумматора общего назначения на каждый конвеер, и этого вполне хватит.
Писать же в оперативку микрокод -- это себе дороже, потому что там запросто может выйти, что каждая инструкция будет занимать 128 бит или может в разы больше -- я не знаю, -- и код распухнет до невозможности. В процессоре и так кеш на кеше и кешом погоняет, но там будет ещё хуже.