Сравнение процессоров для ноутбуков apple

Содержание

Сравниваем Apple M1 с Intel, AMD и Nvidia
M1 в сравнении с процессорами Intel и AMD
M1 в сравнении с графикой Intel, Nvidia и AMD
Характеристики и факты о M1
Intel решила продемонстрировать, что ее процессоры лучше Apple M1
Почему процессоры Apple M1 для ноутбуков превосходят последние модели Intel Core и AMD Ryzen? Разбираемся в деталях.
Ударный старт
Продажи подскочили
В чем тайна?
Общие характеристики
RISC vs. CISC
RISC — Reduced Instruction Set Computer
CISC — Complex Instruction Set Compute
Декодер и буфер команд в Apple M1
GPU и UMA-архитектура памяти
SoC Intel и AMD и интегрированная графика
UMA от Apple
Ремарка. Деловые причины.

Сравниваем Apple M1 с Intel, AMD и Nvidia

На этой неделе компания Apple представила первый собственный процессор для компьютеров и ноутбуков Mac. Новинка получила название M1. Она приходит на смену прежним процессорам Intel, но так как имеет встроенный графический ускоритель, может выступать даже в роли альтернативы GPU AMD и Nvidia. Насколько хорош M1 в сравнении с ними?

На прошедшей презентации Apple анонсировала и три первых устройства на базе M1. Это новые поколения ноутбуков MacBook Air и MacBook Pro, а также новые неттопы Mac Mini. Скорее всего, в следующем году перечень Mac с процессорами M1 дополнят новые модели моноблоков iMac, но пока они доступны всё ещё только с CPU от Intel.

M1 в сравнении с процессорами Intel и AMD

В M1 8 ядер, четыре более мощных из них работают на частоте до 3.2 ГГц. Впрочем, сравнивать M1 с процессорами Intel и AMD напрямую – абсолютно неверно ввиду совершенно разных архитектур (M1 – ARM процессор). Поэтому обратимся к конкретным тестам. Начнём с официальный данных. Свои тесты Apple проводила в программе для обработки видео Final Cut Pro, а также в Xcode.

M1 в 3.5 раза быстрее Intel Core i7-1060NG7 (4 ядра, 1.2 ГГц с ускорением до 3.8 ГГц);
M1 в 2,8 раза быстрее Intel Core i7-8557U (4 ядра, 1.7 Гц с ускорением до 4.5 ГГц);
M1 в 3 раза быстрее Intel Core i3-8100B (4 ядра, 3.6 ГГц).

M1 включает в себя 8 ядер центрального процессора, 8 графически ядер (блоков), а также 16 ядер для ускорения операций, связанных с машинным обучением

Все перечисленные процессоры Intel использовались в базовых версиях MacBook Air, MacBook Pro и Mac Mini прошлого поколения.

Впрочем, выше были приведены данные самой от Apple. Куда интереснее взглянуть на альтернативные тесты. Одним из таких является бенчмарк Geekbench 5, специализирующийся на оценке производительности ядер CPU.

Geekbench проверяет сразу два ключевых сценария: однопоточная производительность, где берётся одно наиболее мощное ядро, а также многопоточная производительность, в измерении которой участвуют уже все ядра. Результаты процессора M1 на фоне решений Intel и AMD здесь весьма впечатляют. Причём на этот раз сравнении идёт с топовыми моделями Core-i7/i9 и новейшими Ryzen.

M1 набирает до 1700-1750 баллов в однопоточном и около 7400 баллов в многопоточном тесте;
1700 баллов однопоточной производительности – абсолютный рекорд теста как процессоров в компьютерах Mac, так и для любых процессоров в целом. Ближайшие преследователи из других Mac – мощнейшие модели Core i7 и Core i9 в топовых iMac и MacBook Pro. Они набирают около 1250 баллов, т.е. отстают примерно на 26%;

В ассортименте Apple сейчас остаются Mac на базе как нового M1, так и Intel. Причём с прежними процессорами оставлены более дорогие модели, отличающиеся использованием до 64 ГБ ОЗУ и, в случае наиболее дорогих решений, полноценной видеокартой AMD

В целом же среди процессоров лидерами GeekBench по однопоточной производительности до появления M1 были AMD Ryzen 9 5900X и 5950X, а также Ryzen 7 5800X, которые набирали примерно 1630 баллов;
7400 баллов в многопоточном тестировании – не рекордный, но все равно очень сильный результат для компьютеров Mac. Больше показывают только крайне мощные модели i7, i9 и Intel Xeon в составе стационарных iMac, iMac Pro и Mac Pro. В свою очередь, M1 способен выдать результат 7400 даже в ноутбуке;
Прежний максимум для ноутбуков Apple показывали Core i9-9980HK и Core i9-9880H, набирая в тесте 6500-6800 баллов (т.е. на 9-14% хуже).

Если сравнивать M1 не только с процессорами из других компьютеров Mac, а с любыми CPU в целом, то M1 в тесте Geekbench обходит подавляющее число современных процессоров. Впереди оказываются только актуальные модели Intel Xeon, а также новые решения Intel и AMD с 8 полноценными ядрами (с частотой не менее 3 ГГц) и более.

Apple рассказывает про M1 в описании к новым MacBook Air и прочим новинкам на официальном сайте

По сравнению AMD: M1 опережает Ryzen 5 2600, 2600X, 3600, 3600X, а также Ryzen 7 2700 и 2700X. В то же время M1 заметно уступает по производительности, к примеру, AMD Ryzen 5 5600X, Ryzen 7 3700X, 3800X, Ryzen 9 3990X, 3950X и актуальным Ryzen Threadripper;
По сравнению с Intel: M1 опережает Core i5-9400, i5-9600K, i5-10400, i5-10400F, i5-10600, i7-9700. Выступает примерно наравне с i7-9700K. Однако M1 существенно отстаёт от Core i7-9800X, Core i9-9900, i9-9900K, i7-10700 и Core i7-10700K, Core i9-10900/10910 и более мощных процессоров, включая актуальны Intel Xeon.

M1 в ноутбуке MacBook Air

M1 в сравнении с графикой Intel, Nvidia и AMD

M1 – это не только ядра центрального процессора, но и графические ядра (GPU). Тем самым он выступает конкурентом встроенной графике Intel, а также GPU Nvidia и AMD.

Безусловно, наиболее интересно посмотреть на сравнение производительности (FPS) в играх. Для этого сама Apple выбрала последнюю на данный момент часть приключений Лары Крофт – выпущенную в 2018 Shadow of the Tomb Raider. Итак, по официальным данным:

M1 в 3.1 раза быстрее Iris Plus Graphics G4 – встроенной GPU процессора i3-1000NG4 в базовых версиях MacBook Air прошлого поколения;
M1 в 2.9 раза быстрее Iris Plus Graphics 645 – встроенной GPU процессора Intel Core i5-8257U в базовых версиях MacBook Pro прошлого поколения;
M1 в 4 раза быстрее UHD Graphics 630 – встроенной GPU процессора Intel Core i3-8100B в базовых версиях предыдущего поколения Mac Mini.

Официальное сравнение GPU M1 со встроенной графикой Core i3-1000NG4

Впрочем, даже не смотря на столь существенное превосходство над предшественниками, называть M1 игровым решением нельзя. Новинка хорошо показывает себя на фоне крайне слабой интегрированной графики Intel, но с полноценными современными видеокартами Nvidia и AMD, оснащёнными гигабайтами видеопамяти, тягаться ей будет очень тяжело.

Далее мы предлагаем очень грубый и не претендующий на точность подсчёт. Зная теоретическую производительность названных выше GPU в процессорах Intel, можно рассчитать и примерные возможности графики в M1. Указанные модели Iris Plus имеют производительность на уровне 700 ГФлопс, а UHD Graphics 630 – 440 ГФлопс. Таким образом, показатели M1 могут находится в районе 1760-2100 ГФлопс, т.е. около 2 терафлопс.

Для Nvidia это уровень GeForce GTX 1050 и GTX 1050 Ti – решений уровня ниже среднего, выпущенных осенью 2016 года;
Для AMD это уровень Radeon RX 560, представленной в первой половине 2017.

Читайте также: Apple ipod nano 7ол для

MacBook Air, базовые версии MacBook Pro и Mac Mini – первые, н девайсы Apple с собственным процессором. ПК с видеокартами Nvidia и AMD они по части игр пока явно не конкуренты

Повторимся, примерное соответствие терафлопс отнюдь не означает, что M1 можно ставить вровень с перечисленным выше GPU. Скорее всего, реальные результаты M1 будут ещё хуже хотя бы по причине отсутствия полноценной видеопамяти.

Вывод: имея сильную «процессорную» часть, графические возможности M1 ещё очень ограничены и переоценивать их не стоит.

Характеристики и факты о M1

Напоследок несколько важных характеристик и дополнительная информация о процессоре Apple M1:

Apple не называла тактовые частоты M1, но тесты показывают значения до 3.2 ГГц. Это частота четырёх высокопроизводительных ядер. Энергоэффективные ядра должны работать на заметно меньших тактовых частотах;
У Apple M1 четыре мощных ядра и четыре энергоэффективных. Разница между ними очень существенна. Подобный подход сейчас повсеместно используется в мобильных ARM-процессорах. В то же время обычные процессоры Intel и AMD имеют равнозначные по мощности ядра;

Ключевые характеристики M1 включают в себя производство по 5 нм нормам, 16 миллиардов транзисторов, отдельной сопроцессор обработки изображений, встроенную память и рекордное для индустрии соотношение производительности на ватт

Использование ядер двух типов позволяет M1 расходовать ещё меньше энергии. Мощные ядра задействуются далеко не во всех задачах, а только тогда, когда она действительно нужны;
В отличии от процессоров Intel и AMD, что полагаются на внешнюю оперативную память, у M1 «оперативка» внутренняя. Она находится внутри самого чипа, что несёт ряд существенных преимуществ в скорости работы. Apple называет такую память объединённой;
Технически объединённая память в Apple M1 – это LPDDR4X, работающая на частоте 3733 МГц. При этом традиционная для любых процессоров кэш-память у M1, разумеется, тоже есть;

Помимо новой объединённой памяти M1 может удваивать скорость работы с SSD накопителем. Благодарить за это стоит отдельные контроллеры и подсистемы работы с памятью, существенно отличающиеся от тех, что использует в своих процессорах Intel

В M1 16 миллиардов транзисторов против 11.8 млрд. в Apple A14, применяемом в новейших iPhone 12 и iPad;
M1 производится по передовому 5 нм техпроцессу. Основная часть процессор Intel всё ещё основывается на почётном в плане возраста 14 нм техпроцессе, а наиболее актуальные процессоры AMD используют 7 нм технологии.

Источник

Intel решила продемонстрировать, что ее процессоры лучше Apple M1

Intel показала некоторым профильным СМИ презентацию, которая должна продемонстрировать превосходство процессоров Tiger Lake над новыми чипами Apple M1 с архитектурой ARM. Компания решила сравнить новые Apple MacBook Pro и MacBook Air с системами на процессорах Core i7-1185G7 и Core i7-1165G7. Презентацию подготовил отдел технического маркетинга Intel.

Компания начала с того, что сравнила производительность системы с процессором Core i7-1185G7 (4 ядра, до 4,8 ГГц, TDP 28 Вт) и MacBook Pro на Apple M1. Тесты включали интернет-сёрфинг, работу офисного пакета Microsoft Office 365, перекодирование и рендеринг видео в Adobe Premiere Pro, обработку фото в Adobe Photoshop, Adobe Lightroom и в Topaz Labs.

По данным Intel, система на Tiger Lake оказалась, в среднем, вдвое мощнее. Кстати, при сравнении для Apple M1 в тестах использовали нативные версии приложений.

А использование WebXPRT 3 дает Intel преимущество, поскольку разработчик тестов (Principled Technologies) и Intel давно поддерживают отношения.

Однако в тесте игровой производительности графика M1 оказалась достаточно мощной, чтобы противостоять Iris Xe, признали в Intel. При этом Intel ссылается на скорость работы приложений Topaz Lab. Но нужно напомнить, что это одни из немногих приложений, которые были разработаны для использования преимуществ аппаратного ускорения внутри процессоров Intel.

Но там указали на отсутствие поддержки многих популярных игр на MacBook Pro.

Говоря об автономности, Intel сравнивала MacBook Air с Acer Swift 5 на Core i7-1165G7 (4 ядра, до 4,7 ГГц, 28 Вт). Компания продемонстрировала, что при одинаковой настройке яркости экрана и с одинаковой нагрузкой оба ноутбука показывают примерно равные результаты по времени работы от аккумулятора.

Но Intel подчеркнула то, что MacBook Air не соответствует ряду параметров программы сертификации Intel Evo, например, по скорости отзывчивости системы. Нужно отметить, что эта программа сертификации создана самой компанией, и проходить ее необязательно. В PCWorld отметили, что не могут назвать ни одного ноутбука на базе AMD с сертификатом Evo.

В качестве плюсов своей продукции компания также привела тот факт, что ноутбуки на Tiger Lake могут оснащаться сенсорным экраном, а их ассортимент достаточно широк и предполагает разные форм-факторы.

Параллельно команда Intel заявила, что MacBook Pro и MacBook Air можно подключить только к одному внешнему дисплею, а еще к ним нельзя подключить внешние графические карты. Не забыли в Intel упомянуть и о проблемах совместимости с ПО, которые пока только решаются.

По итогам своей презентации компания приходит к выводу о том, что ноутбуки на Tiger Lake производительнее, схожи по автономности, но лучше совместимы с различным ПО и оборудованием и имеют более разнообразные конфигурации.

При этом Intel не упоминает в своей презентации об акустике. Одной из особенностей нового MacBook M1 является почти полное отсутствие шума вентилятора.

Презентацию Intel можно объяснить тем, что компания впервые за 15 лет увидела микропроцессор для потребительского рынка, который может конкурировать с чипами x86. Процессор Apple M1 создан по 5-нанометровому техпроцессу, его выпускают заводы TSMC. Семейство процессоров Tiger Lake же создано по 10-нм техпроцессу.

Ранние бенчмарки в Geekbench 5 показывали, что Apple M1 в MacBook Air обошел по производительности 8-ядерный Intel Core i9-9980HK в MacBook Pro.

В январе бывший инженер Intel Чжэн Ли, принимавший участие в разработке процессора для первого MacBook Air, рассказал, что Intel продавала конкурентам своего партнера, в том числе Dell и HP, технологии, реализованные на чипе. По его словам, именно после этого Apple задумалась о создании своего процессора.

Источник

Почему процессоры Apple M1 для ноутбуков превосходят последние модели Intel Core и AMD Ryzen? Разбираемся в деталях.

Ударный старт

Когда компания Apple летом 2020 года впервые анонсировала переход Mac-ов на собственные процессоры с архитектурой ARM многие отнеслись к этому скептически.

“Нельзя делать начинку для ПК из комплектующих для iPhone” — волновались профессиональные пользователи “тяжелых” приложений, любители ПК-игр и юзеры, привыкшие открывать в браузере одновременно по 50 вкладок.

И первые же тесты повергли индустрию в шок: ноутбуки не только не уступали мобильным собратьям на базе архитектуры # x86, но и превосходили их в одних тестах за другим. И по общей производительности на синтетических тестах и по реальной на широчайшем спектре приложений.

В некоторых результатах перфоманс достигал уровня среднего десктопа с внешней видеокартой младшего класса.

Причем это касалось как индивидуальных приложений, так и работы в мультизадачном режиме.

“. Одновременный запуск сразу 50 приложений прошёл на # MacBook Pro с процессором M1 без каких-либо заметных лагов, тогда как ноутбуку на Intel потребовалось куда больше времени… Кроме того, модель на M1 даже не включила активное охлаждение, в то время как вариант на Intel будто начал «готовиться ко взлёту. ”

“. Запуск приложений тоже происходит на новом MacBook Pro быстрее, чем на версии с процессором Intel. ”

“. Открытие большого числа вкладок в Safari никак не нагрузило ноутбук на M1, тогда как вариант на Intel изрядно начал “лагать” уже на 30-й вкладке. ”

“. Самым большим сюрпризом стала скорость работы в видеоредакторах. Обработка видео 1080р длительностью 30-40 минут в DaVinci Resolve на старом MacBook занимала около 40 минут. Модель на M1 справляется за 4 минуты — столько же требуется времени моему стационарному ПК с видеокартой GeForce GTX 1060. ”

Фактически, впервые в истории “маководы” заговорили об играх на MacBook — а эта сторона никогда не была козырем “фруктовых” компьютеров.

Удивительно, но даже MacOS-приложения скомпилированные под x86, исполняемые в режиме динамической перекомпиляции под специальным системным ПО Rosetta 2 — показывали недурные результаты. Дело в том, что само по себе исполнение не родных программ “на лету” очень серьезно отъедает ресурсы.

(Анекдот в том, что ПО Rosetta первой версии в далеком 2006 году было предназначено для перевода приложений под RISC-процессоры IBM PowerPC на CISC-архитектуру Intel x86. Сегодня, по прошествии неполных 15 лет, Rosetta 2 помогает вернуть экосистему Mac в обратном направлении: от x86 к RISC-процессорам ARM.)

Продажи подскочили

В результате пользователи совершенно забыли о былых опасениях.

Новые MacBook стали товаром “черной пятницы” 2020-го пандемийного года. Продажи MacBook достигли уровней, ранее этими дорогостоящими ноутбуками ни разу не достигнутых. В том числе и у нас в России.

Так, весной этого года MacBook Air Late 2020 на M1 впервые оказался в десятке самых продаваемых продуктов на отечественном рынке. И это при том, что средняя цена “яблочного” устройства превосходит большинство соседей по хит-параду раза этак в три.

В чем тайна?

Так в чем же великая тайна процессоров, изначально разрабатывавшихся для iPhone и iPad? Как так получилось, что гранды микропроцессорной индустрии эпохи ПК — Intel и AMD — проигрывают # ARM-чипу именно по скорости.

То что они проигрывают ему по энергоэффективности, времени автономной работы и т. п. — как бы понятно. В этом-то никто и не сомневался.

Но Photoshop и Premiere, Java и Python-разработка, Maya и 3ds Max. Это потрясающе!

Не будем томить читателя, не желающего погружаться в детали. По большому счету преимущества видны в следующих направлениях:

Особенностях RISC-архитектуры CPU и ее применения для оптимизации процесса выполнения кода; главным образом, по части внеочередного исполнения.
Относительно небольшие по общей площади занимаемой на кристалле ядра CPU ARM-архитектуры, плюс продвинутый технологический процесс 5-нанометров позволяют отдать больше места на кристалле дополнительным блокам, в особенности GPU — графической подсистеме.
Особенность работы с памятью — UMA,также важная для GPU и других периферийных процессов.

А теперь разберемся подробнее, что же имеется в виду.

Общие характеристики

Итак, с чем мы имеем дело по части базовых характеристик. (Сразу скажем: ничего поражающего воображение мы по ним не увидим.)

8-ми или 7-ми ядерный процессор M1 имеет на борту 4 высокопроизводительных ядра FireStorm и 4 энергосберегающих Icestorm.

Частоты меняются здесь в очень широких пределах, в зависимости от нагрузки: “старший” FireStorm имеет диапазон от 0,6 до 3,2 ГГц, частоты Icestorm – от 0,6 до 2,1 ГГц. (В пиковом режиме — не много, вообще-то, в сравнении с последними поколениями логики Intel/AMD, где в режиме турбо частоты могут составлять 4,5-5 ГГц.)

Однако при максимальных частотах четыре ядра Firestorm рассеивают, все вместе, до 14 Вт, а четыре ядра Icestorm – до 1,3 Вт. Будем считать, что общий TDP Apple M1 – в районе 15 Вт. У мобильных конкурентов x86, конечно, значительно выше — 35-45 Вт.

Плюс на кристалле здесь присутствует GPU, блок тензорики (нейропроцессоры), цифровой сигнальный процессор (ISP), блок аппаратной акселерации шифрования, ну и понятно, всяческие контроллеры периферийных систем.

Отдельно важно отметить, что микросхемы памяти ОЗУ конструктивно совмещены с интегральной схемой процессора. Они выполнены в едином физическом блоке. (system-n-package).

Максимальный размер ОЗУ при этом конечно фиксирован — 16 Гб. Но память реально быстрая: LPDDR4X SDRAM 4266 Mегатранзакций/с.

По всему вышесказанному — мы вроде бы имеем просто качественный энергосберегающий чип, чрезвычайно гибко обращающийся с энергопотреблением. Что абсолютно понятно для процессора из сферы гаджетов, в сравнении с процессором для ПК.

Но откуда же взялись победные реляции в плане скорости?

RISC vs. CISC

Традиционно выделяют два типа процессорной архитектуры, иначе говоря два типа системы команд (ISA- Instruction Set Architecture) — RISC и CISC.

Чтобы понять принципиальное различие между ними, освежим, как вообще работает компьютер. ЛЮБОЙ компьютер.

Есть команда в программе: “просуммировать два значения из ячеек M1 и M2, результат положить в M3”: SUM M1, M2, M3.

Команда поступает на декодер команд . Декодер расшифровывает что же, собственно, написано в команде и переводит это на язык микроинструкций. Они размещаются в буфере микроинструкций. Он же буфер исполнения или буфер переупорядочивания (ROB — Re-Order Buffer) .

(Оба этих блока будут крайне важны для нас для понимания преимуществ архитектуры RISC вообще и ARM-процессоров Apple Silicon в частности. Поэтому запомним эти слова: декодирование и переупорядочивание.)

Последовательность микроинструкций и указывает всем исполнительским блокам, что делать и в каком порядке.

В нашем случае нужно:

Достать из Памяти данные из ячеек M1 и M2 (GET M1; GET M2;); за это отвечает контроллер памяти (или контроллер шины памяти как это часто обозначают).
Разместить их во внутренних регистрах блока АЛУ R1 и R2 (PUT R1; GET R2;), соответственно; (АЛУ — Арифметико-Логическое Устройство).
Указать АЛУ что данные из нужных регистров надо сложить, а результат положить во внутренний регистр R3 (SUM R1, R2; PUT R3;).
Забрать результат из R3 и положить в ячейку памяти M3 (GET R3; PUT M3).

RISC — Reduced Instruction Set Computer

В прямом переводе “процессор с сокращенным набором команд”.

Но лучше сказать: “коротких”, “простых”, “фиксированных” команд. Именно это важно.

Что важно — длина команды здесь фиксирована. Число операндов — по сути ячеек памяти с которым идет обращение в процессе исполнения — постоянно.

Поэтому декодировать эту команду очень просто — блок декодера команд способен во-первых работать очень быстро, а во-вторых прост по своей внутренней конструкции.

А за счет простоты мы можем поставить параллельно большее число таких блоков — это даст возможность загружать все блоки АЛУ нашего процессора параллельно — чтобы они не ждали пока декодируются следующие команды.

Представим. Если у нас, например, 8 АЛУ, и все операции фиксированы по размеру и скорости исполнения, мы можем спокойно параллельно исполнить 8 операций, естественно, если они не перебивают друг друга — выполнение следующей не зависит от результатов предыдущей.

Кстати, чем быстрее мы декодируем команды, тем быстрее поймем — как можно их распараллелить: проанализировать алгоритм и разложить микроинструкции в буфере таким образом, чтобы логика вычислений не нарушалась, но при этом у всех иcполнительных блоков была работа. Поэтому его и называют буфером переупорядочивания (ROB).

Таким образом ISA типа RISC открывают более широкие возможности для так называемого внеочередного исполнения, следовательно распараллеливания кода.

Типичными представителями RISC-процессоров являются ARM (ныне принадл. Nvidia), IBM POWER, Oracle (Sun) SPARC, MIPS, RISC-V.

CISC — Complex Instruction Set Compute

Здесь длина инструкции, число операндов в ней, изменчиво.

Дешифрация таких команд — сложная задача. Таких блоков много в процессор не поставишь.

По сути в одну CISC команду “запихнуто” сразу несколько RISC-команд. И изначально, до декодирования, неизвестно сколько именно. CISC-команда может исполняться за несколько тактов, циклов обращения к памяти.

И пока конкретный блок АЛУ не выполнит всю эту последовательность, он не может перейти к выполнению другой команды. Это снижает возможности внеочередного исполнения и распараллеливания выполнения кода.

Есть еще одно важное отличие — регистры АЛУ в RISC неспециализированные, однотипные и их в АЛУ много. А вот в CISC они предназначены для хранения данных определенной длины. Они зависят от типа обрабатываемых данных, можно сказать. И регистров каждого из типов в АЛУ мало. (В определенных случаях данные могут вообще обходить регистры АЛУ и непосредственно поступать на вычислитель из кэш-памяти, но не будем углубляться в это.)

Классическим примером ISA типа CISC и является Intel x86, то есть классические процессоры для ПК от Intel и AMD.

Декодер и буфер команд в Apple M1

М1 — как RISC-процессор использует простые и эффективные блоки декодирования. И их здесь больше, чем у x86 процессоров — very wide instruction decoders. Существенно больше: 8 штук на ядро. И работают они быстрее.

В то время как в самых мощных чипах Intel — максимум по 4 декодера. Понятное дело: блок декодирования CISC — сложная штуковина, в отличии от простейшей конструкции в RISC.

Для Apple это открыло возможность для увеличения буфера внеочередного исполнения инструкций (ROB). Ведь со столь мощным блоком декодирования его есть чем загрузить.

Производители не указывают точный размер буфера, но по оценкам экспертов в старших ядрах Apple M1 Firestorm он составляет до 630 инструкций; и даже в младших Icestorm Icestorm оценивается до 560.

В то время как современные ядра процессоров Intel Willow Cove (для ноутбуков Core 11Gen Tiger Lake) глубина буфера достигает лишь 352. В AMD Zen 3 (Ryzen Cezanne-H) и вовсе 256.

То есть M1 тут обставляет конкурентов до 2 раз по размеру буфера. А это кратно увеличивает возможность внеочередного исполнения.

В конечном счете это мощно сказывается на итоговой производительности.

GPU и UMA-архитектура памяти

А теперь поднимемся на уровень выше — уйдем от внутреннего устройства CPU и рассмотрим чип M1 как SoC — систему на чипе включающую также интегрированные блоки GPU.

SoC Intel и AMD и интегрированная графика

Прежде чем понять в чем достижение Apple, надо понять суть опыта производителей x86-процессоров в направлении интегрированной графики.

Да, конечно, процессоры Intel и AMD для массовых устройств на сегодня — также вполне полноценные SoC. Они используют интегрированную графику. Причем в случае AMD Radeon она традиционно считается достаточно сильной. (В сопоставлении с Intel.) Да и Intel не стоит тут на месте, скажем начиная с последнего поколения Core компания предложила новый дизайн GPU Intel Xe; чипы этой архитектуры использованы и в фирменных дискретных адаптерах “синих”.

Но интегрированная графика Intel и AMD — все равно слишком слаба. В целом в архитектуре чипа она играет роль как бы “неродного ребенка”. Фактически оба производителя заявляют — хотите настоящей производительности на “тяжелых” графических приложениях и играх — берите дискретную видеокарту.

Все в системе рассчитано на то, чтобы обеспечить работу ядер CPU, а GPU здесь как бы на вторых ролях. И особенно это заметно по организации работы с ОЗУ.

Любая интегрированная графика использует область оперативной памяти для хранения данных графической подсистемы. Скажем, в обычном случае 1-2 Гб из объема ОЗУ выделяется под область GPU.

Но фактически за управление загрузкой этой области памяти отвечает CPU. Он перебрасывает нужные данные из области основной памяти (“своей”) в выделенную “графическую”. А GPU уже выбирает оттуда.

Естественно это замедляет процесс обработки видеопотока.

Дополнительно? есть такая общая установка, очень грубая, но тем не менее…

Ядра CPU обыкновенно пересылают из ОЗУ и обратно небольшие блоки данных, но часто. Назовем этот пункт, условно, “процессорным” типом работы с памятью. Видеопамять же дискретных адаптеров — “графический” тип — как правило забирает из памяти огромные куски едиными блоками.

Соответственно контроллеры памяти, скажем, чипов Nvidia GeForce и Intel Core имеют разную организацию, адаптированную к своему типу потребления данных — передача больших объемов по широкому каналу или более узкий, но высокочастотный канал. Под это заточена организация работы внутренних шин памяти и система управления ими.

Угадайте с одного раза, какой тип организации — “процессорный” или “графический” использован в SoC Core или Ryzen? Конечно “процессорный”. То есть вся общая работы внутренней шины памяти для встроенного GPU — она как бы “не родная”. То же касается и прочих периферийных устройств.

UMA от Apple

Apple меняет подход к UMA (Unified Memory Access). Здесь отдельной области ОЗУ для GPU не выделяется — графический чип может напрямую обращаться к ОЗУ и задействовать столько памяти, сколько ему реально нужно. (Вероятно, это касается прочих спецпроцессоров в составе чипа.)

Контроллер же памяти, шина, очевидно рассчитаны на этот момент и учитывают тип потребления данных, характерный именно для GPU.

Да и сами физические микросхемы памяти в целях снижения задержек и поддержки оптимальных частот, как мы помним, совмещены с SoC конструктивно. Все это дает возможность встроенному GPU проявить себя в полной мере, быть “на равных” с ядрами CPU в плане доступа к памяти.

Кроме того Apple и за счет использования 5-нанометровых ядер CPU, из каковых “больших” — максимум 4, и за счет относительно небольших областей кэш-памяти — элементарно получил возможность отдать на кристалле большую площадь под ядра GPU. В итоге, графика от Apple — это просто более продвинутый чип, чем Intel Xe и Radeon Vega.

Если же взглянуть на ситуацию с GPU в целом, можно заключить, что в сравнении с классической организацией интегрированных систем ПК, в Маках самому ресурсоемкому — графике — просто отдано больше места. И в физическом смысле — площади на кристалле, и в организационном — механизмы доступа к ОЗУ и проч.

Но за счет этого выигрывает не только сама графика, но и скорость работы компьютера в целом — ведь “тяжелая” часть имеет собственный канал доступа к системе. Следовательно, не отвлекает CPU от своих собственных задач.

Ремарка. Деловые причины.

В заключении хотелось бы напомнить о следующем. (Хотя это и банальность.)

Apple — производит чипы для себя. Он сам является единственным поставщиком конечных устройств Mac. Сам отвечает за, по простому говоря, разводку материнской платы. Сам решает сколько полосы пропускания отдавать на те или иные подсистемы.

Источник