- Apple анонсировала M1 Pro и M1 Max: гигантские новые SoC на архитектуре ARM с полной производительностью
- Что такое SoC? Все, что вам нужно знать о Чипсетах для Смартфонов
- Что такое SoC?
- Примеры SoC
- Все начинается с Процессора
- Интегрированная графика
- Хорошие камеры нуждаются в хороших процессорах
- Искусственный Интеллект Нового Поколения
- Модемы 4G и 5G для более быстрой передачи данных
- Подробнее о SoC для смартфонов
Apple анонсировала M1 Pro и M1 Max: гигантские новые SoC на архитектуре ARM с полной производительностью
Сегодняшний основной доклад Apple Mac был очень насыщенным — компания анонсировала новую линейку устройств MacBook Pro на базе двух различных новых SoC в линейке Apple Silicon: M1 Pro и M1 Max.
M1 Pro и Max представляют собой продолжение прошлогоднего M1, процессора Mac первого поколения Apple, который стал первым этапом для Apple в реализации планов по замене процессоров на архитектуре x86 чипами собственного дизайна. M1 был успешным для Apple, продемонстрировав фантастическую производительность при невиданной доселе энергоэффективности на рынке ноутбуков. Хотя M1 достаточно быстрый, это все еще был небольшой SoC. Он предназначался, в первую очередь, для таких устройств, как iPad Pro. Соответственно, у него более низкий TDP, уступающий более производительным и мощным чипам от конкурентов.
Сегодняшние два новых чипа стремятся изменить эту ситуацию. При этом Apple делает все возможное для повышения производительности, увеличивая количество ядер процессора и графического процессора, плюс инвестируя в разработку электронных компонентов. Компания вкладывает в это направление весьма немалые средства.
M1 Pro: 10-ядерный процессор, 16-ядерный графический процессор, 33,7 млрд транзисторов в 245 мм 2
Первым из двух чипов, которые были анонсированы, был M1 Pro. Он стал основой для того, что Apple называет бескомпромиссными SoC для ноутбуков.
Apple начала презентацию с показа корпусировки SoC, M1 Pro сохраняет собственный дизайн корпусировки. Apple корпусирует чип SoC вместе с чипами памяти на одной органической печатной плате, что контрастирует с другими традиционными чипами, такими как AMD или Intel, где используются отдельные модули для DRAM. Подход Apple, вероятно, значительно повышает энергоэффективность и компактность.
Компания рассказала о том, что она удвоила пропускную способность шины памяти для M1 Pro по сравнению с M1. Тем самым завершен переход от 128-битного интерфейса LPDDR4X к новому 256-битному интерфейсу LPDDR5, с заявленной пропускной способностью памяти до 200 ГБ/с. Мы не знаем, является ли эта цифра точной или приблизительной, но стандарт LPDDR5-6400 как раз соответствует 204,8 ГБ/с.
В презентации Apple продемонстрировала снимки как M1 Pro, так и M1 Max, чтобы мы увидели макет чипа и деление на блоки. Начнем с контроллеров памяти, которые теперь в углах SoC, а не по краям, как на M1. Из-за увеличенной ширины интерфейса контроллеры памяти стали занимать довольно большую часть SoC. Еще более интересным является тот факт, что Apple теперь, по-видимому, использует два блока кэша системного уровня (SLC) непосредственно за контроллерами памяти.
Блоки кэша на системном уровне Apple отличаются тем, что обслуживают весь SoC, и способны увеличить пропускную способность, уменьшить задержку или просто сэкономить электроэнергию, избегая транзакций с памятью вне кристалла, что значительно повышает общую энергоэффективность. Этот блок SLC нового поколения выглядит совсем иначе, чем у M1. Ячеек SRAM больше, чем в M1, поэтому, хотя мы не можем точно подтвердить это прямо сейчас, это может означать, что в каждом блоке SLC 16 МБ кэша — для M1 Pro это будет 32 МБ общего кэша SLC.
Что касается процессора, Apple сократила количество энергоэффективных ядер с 4 до 2. Мы не знаем, будут ли эти ядра похожи на ядра M1 по эффективности или Apple приняла IP нового поколения от A15 SoC — но ясно, что новый iPhone SoC имеет некоторые более крупные микроархитектурные изменения.
Что касается производительных ядер, Apple удвоила их количество до 8. Производительные ядра Apple были чрезвычайно впечатляющими на M1, однако отставали от других 8-ядерных SoC с точки зрения общей многопоточной производительности. Удвоение ядер должно продемонстрировать огромное повышение производительности в многопотоке.
На снимке мы видим, что Apple зеркалирует два 4-ядерных блока, кэши L2 также зеркалируются. Хотя Apple пишет 24 МБ L2, я думаю, что это скорее конфигурация 2×12 МБ аналогично конфигурациям AMD. В таком случае синхронизация двух кластеров производительных ядер будет проходить через внутреннюю шину и SLC. Здесь можно лишь предполагать, но это предположение имеет смысл, учитывая показанный макет.
Что касается производительности процессора, Apple провела некоторые сравнения с конкурентами. В частности, сравниваемые здесь SKU Core i7-1185G7 от Intel и Core i7-11800H, 4-ядерные и 8-ядерные варианты новейших процессоров Intel Tiger Lake по техпроцессу 10nm ‘SuperFin’.
Apple утверждает, что в многопоточной производительности новые чипы значительно превосходят любые конкурентные чипы от Intel, причем при более низком энергопотреблении. Представленные кривые производительности и мощности показывают: при равном энергопотреблении в 30 Вт новые M1 Pro и Max в 1,7 раза быстрее по пропускной способности процессора, чем 11800H, кривая мощности которого чрезвычайно крутая. В то же время при равных уровнях производительности — пиковой у 11800H — новый M1 Pro/Max достигает тех же показателей при энергопотреблении ниже на 70%. Эти результаты на голову выше того, что есть у Intel.
Наряду с мощными процессорными блоками Apple также радикально масштабирует свою кастомную архитектуру GPU. M1 Pro теперь оснащен 16-ядерным графическим процессором с заявленной вычислительной способностью 5,2 терафлопс. Он идет в паре с гораздо более широкой шиной памяти и, предположительно, 32 МБ SLC. Это аналогично подходу AMD с их GPU Infinite Cache.
Производительность графического процессора Apple, как утверждается, значительно превосходит производительность интегрированной графики конкурентов предыдущего поколения. По этой причине компания решила провести прямые сравнения с дискретной графикой ноутбуков среднего класса — GeForce RTX 3050 Ti 4 ГБ. По результатам тестов чип от Apple показал аналогичную производительность, используя на 70% меньшую мощность. Правда, неясно что такое 30 Вт — является ли это общей мощностью SoC или системы. Возможно, Apple просто сравнивает сам блок графического процессора.
Наряду с GPU и CPU, Apple также отметила значительно улучшенный медиадвижок, который теперь может аппаратно ускорять декодирование и кодирование ProRes и ProRes RAW, что пригодится создателям контента и профессиональным видеографам. Apple Mac традиционно хороши для работы с видео, но аппаратно ускоренные движки для форматов RAW были бы киллер-фичей, которая станет решающей для этой аудитории.
M1 Max: 32-ядерное GPU чудовище на 57 миллиардов транзисторов и 432 мм 2 .
Кроме M1 Pro, Apple также рассказала о «большем брате» — M1 Max. В то время как M1 Pro догоняет и опережает конкурентные ноутбуки с точки зрения производительности, M1 Max предоставляет то, чего раньше еще не было: графический процессор «с турбонаддувом» на 32 ядра. По сути, это больше не SoC со встроенным графическим процессором, а GPU с встроенным SoC.
Корпусировка для M1 Max тоже отличается — чипы DRAM увеличились с 2 до 4, что соответствует увеличению ширины интерфейса памяти с 256-бит до 512-бит. Apple рассказывает о впечатляющей пропускной способности в 400 ГБ/с. Если это LPDDR5-6400, было бы более точным указать 409,6 ГБ/с. Такая пропускная способность неслыханна в SoC, но является нормой для производительных графических чипов.
M1 Max выглядит довольно своеобразно — во-первых, вся верхняя часть чипа над графическим процессором очень похожа на M1 Pro, указывая на то, что Apple повторно используют большую часть дизайна, и что вариант Max просто растет вниз.
Добавлены два 128-битных блока LPDDR5, причем количество блоков SLC растет вместе с ними. Если бы было 16 МБ на блок, то это представляло бы собой 64 МБ общего кэша для всего SoC. Помимо очевидного использования в GPU, мне интересно, чего могут достичь процессоры с помощью такой гигантской пропускной способности памяти.
M1 Max впечатляет количеством транзисторов. Так, Apple сообщила, что у M1 Pro их количество достигает 33,7 млрд, в то время как M1 Max включает уже около 57 млрд транзисторов. AMD, в то же время, с гордостью рассказывает о 26,8 млрд транзисторов в 7-нм графическом чипе Navi 21 на 520 мм 2 . У Apple здесь в два раза больше транзисторов при меньшем размере чипа благодаря использованию передового 5-нм техпроцесса от TSMC. Даже по сравнению с самым большим 7-нанометровым чипом NVIDIA с 54 млрд транзисторов в серверных GA100 — M1 Max имеет большее количество транзисторов.
Что касается размеров чипов, Apple разместила на одном из слайдов M1, M1 Pro и M1 Max рядом друг с другом, и они, похоже, имеют масштаб 1:1. В этом случае M1, который мы уже знаем, составляет 120 мм 2 , соответственно M1 Pro 245 мм 2 , а M1 Max около 432 мм 2 .
Большая часть чипа занята 32-ядерным графическим процессором, для которого Apple заявляет производительность в 10,4 терафлопс. Похоже, что Apple зеркалировала их 16-ядерный GPU. Первое, что приходит на ум — это 2 графических процессора, работающих в унисон, и какая-то общая логика между двумя половинами графического процессора. Мы сможем рассказать больше, как только проверим поведение системы на программном уровне.
С точки зрения производительности Apple успешно может конкурировать с лучшими предложениями на рынке, сравнивая производительность M1 Max с производительностью мобильного GeForce RTX 3080 при меньшей мощности на 100 Вт (60 Вт против 160 Вт). M1 Max и тут превосходит дискретный GPU NVIDIA, при этом потребляя на 40% меньше энергии.
Презентация нового поколения Apple Silicon стала тем, чего мы ждали больше года. Я думаю, что Apple удалось не только оправдать ожидания, но и значительно превзойти их. Как M1 Pro, так и M1 Max кардинально отличаются от всего, что мы когда-либо видели в области ноутбуков. Если M1 был неким признаком успеха Apple в их кремниевых начинаниях, то два новых чипа превосходят любые варианты, что мы видели у конкурирующих компаний.
Источник
Что такое SoC? Все, что вам нужно знать о Чипсетах для Смартфонов
Технические энтузиасты любят говорить о вычислительной мощности и микросхемах, будь то ПК и игровые консоли или новейшие смартфоны. Для непосвященных эти темы изобилуют жаргоном и абстрактно звучащими идеями, которые могут показаться трудными для понимания даже базовых вопросов, таких как «что такое SoC?»
Могут потребоваться годы изучения, чтобы разобраться в тонкостях конструкции микросхемы, что не имеет смысла, если вы просто пытаетесь изучить потенциальную покупку. Сегодня мы собираемся сделать что-то более удобное для начинающих и объяснить все тонкости современных чипов для смартфонов с минимальным техническим углублением, насколько это возможно.
Что такое SoC?
SoC расшифровывается как «система на кристалле» (system-on-a-chip). Как следует из названия, SoC — это полная система обработки, содержащаяся в одном пакете. Это не комплекс из одного процессора, с которым вы могли быть знакомы, если когда-либо собирали ПК. Вместо этого SoC содержит несколько обрабатывающих частей, памяти, модемов и других важных компонентов, изготовленных вместе в одном чипе, который припаян к печатной плате.
SoC (cистема на кристалле) — это мозг вашего смартфона
Объединение нескольких компонентов в одну микросхему позволяет сэкономить место, затраты и энергопотребление. По сути, SoC — это мозг вашего смартфона, который обрабатывает все, начиная от операционной системы Android и заканчивая распознаванием, когда вы нажимаете кнопку выключения. SoC также подключаются к другим компонентам, таким как камеры, дисплей, оперативная память, флэш-память и многое другое.
В приведенном ниже списке представлены наиболее распространенные компоненты, которые вы найдете внутри системы на кристалле смартфона. Позже в этой статье мы рассмотрим несколько наиболее важных из них.
- Центральный процессор (CPU) — «мозг» SoC. Выполняет большую часть кода для ОС Android и большинства ваших приложений.
- Графический процессор (GPU) — обрабатывает задачи, связанные с графикой, такие как визуализация пользовательского интерфейса приложения и 2D/3D игры.
- Блок обработки изображений (ISP) — преобразует данные с камеры телефона в файлы изображений и видео.
- Цифровой сигнальный процессор (DSP) — выполняет более сложные математические функции, чем CPU. Включает распаковку музыкальных файлов и анализ данных датчика гироскопа.
- Блок нейронной обработки (NPU), также называется нейропроцессором — используется в смартфонах высокого класса для ускорения задач машинного обучения (AI). К ним относятся распознавание голоса и сегментация объектов камеры.
- Видеокодер/декодер — обеспечивает энергоэффективное преобразование видеофайлов и форматов.
- Модемы — преобразует беспроводные сигналы в данные, которые понимает телефон. Компоненты включают модемы 4G LTE, 5G, WiFi и Bluetooth.
Наконец, в разговоре о SoC часто упоминается так называемый производственный процесс. Он указан как число в нанометрах (нм). Вообще говоря, чем меньше размер нм, тем меньше размер внутренней проводки SoC. Это лучше с точки зрения энергоэффективности и размера микросхемы. Хотя существуют разные методы изготовления, которые могут затруднить прямое сравнение. На момент написания статьи 5-нанометровая технология — это наименьший из доступных производственных процессов, используемых в смартфонах SOC.
Примеры SoC
Теперь, когда у нас есть краткий обзор того, что такое SoC, приведём нескольких примеров. В области смартфонов Qualcomm, Samsung Semiconductor, Huawei HiSilicon и MediaTek — четыре крупнейших имени в этом бизнесе. Скорее всего, в вашем смартфоне установлен чип одной из этих компаний.
Структура SoC Qualcomm Snapdragon 845
Qualcomm является крупнейшим поставщиком SOC для смартфонов, поставляющий чипы для большинства флагманских, средних и даже бюджетных смартфонов, выпускаемых для любого бюджета. SoC Qualcomm подпадают под бренд Snapdragon. Чипы премиум-класса, обладающие лучшими технологиями этой компании, выпускаются под маркой Snapdragon 800 серии, например, новейший Snapdragon 888. Продукты среднего и супер-среднего уровня имеют названия серий Snapdragon 600 и 700 соответственно. Например, Snapdragon 765 — это относительно новый чип среднего уровня, поддерживающий подключение 5G. Продукты начального уровня названы серией 400.
SoC Exynos от Samsung работают в аналогичном масштабе премиум, среднего и начального уровня. Ранее они были указаны как серии Exynos 9900, 9800 и 9600, при этом продукты серии Exynos 7000 поддерживали бюджетную часть устройств. Тем не менее, новейший высокопроизводительный чип Samsung — это Exynos 2100, а Exynos 1080 — это чипсет 5G среднего уровня.
Схема именования Samsung Exynos очень похожа на схему Huawei, но теперь она изменилось. Kirin 9000 является последним флагманским чипом компании Huawei, который поставляется в вариантах 4G и 5G. Серия Kirin 600 во многом похожа на линейку Snapdragon 600, предлагая спецификации среднего уровня для более доступных смартфонов.
Наконец, линейка Helio от MediaTek охватывает доступные продукты серии P вплоть до серии G, ориентированной на игры. Последняя флагманская серия производителя — это Dimensity 1200 , за которой следует Dimensity 1100.
Все начинается с Процессора
Возможно, вы знакомы с термином процессор, поскольку в этой области он часто используется как синоним CPU. CPU — это наиболее часто упоминаемый тип процессора. Он разработан таким образом, чтобы быть очень гибким и подходящим для широкого спектра задач. Таким образом, процессор запускает операционную систему Android и ваши приложения. Он также частично отвечает за синхронизацию данных между другими процессорами внутри SoC.
SoC Snapdragon 888 имеет техпроцесс 5-нм Samsung 5LPE
Если кратко, CPU работают с использованием блоков прогнозирования, регистров и исполнительных блоков. Это называется архитектурой CPU. Регистры содержат биты данных или указатели на память, часто в 64-разрядных форматах данных. Исполнительные устройства выполняют что-то с одним или несколькими регистрами, например, чтение и запись в память или выполнение математических операций. Несколько исполнительных блоков могут использоваться одновременно с процессором, каждому из которых требуется один или два такта для выполнения своей функции.
Процессоры достаточно гибкие, чтобы решать широкий круг задач. Производительность можно увеличивать и уменьшать, изменяя тактовую частоту (в ГГц), количество ядер или изменяя базовую архитектуру, чтобы делать больше с каждым тактовым циклом. Этот последний момент часто называют созданием «более широкого» или «большего» процессора, поэтому телефонные чипы Apple настолько мощны . Однако в этих более широких конструкциях есть компромиссы между мощностью и эффективностью.
Процессоры внутри SoC смартфонов бывают разных видов, и все они основаны на архитектуре процессора Arm. Последними процессорными ядрами Arm являются большие Cortex-X2 и Cortex-A710, а также маленькие Cortex-A510. Все эти три устройства основаны на новейшей архитектуре Armv9. Процессоры смартфонов часто представлены в восьмиъядерных конфигурациях с большими мощными ядрами для более требовательных приложений и меньшими энергоэффективными ядрами для обеспечения длительного времени автономной работы.
Интегрированная графика
Помимо CPU, графический процессор (GPU) — это еще одна часть традиционного оборудования для обработки чисел, упакованного в телефонную SoC. Графические процессоры гораздо менее универсальны, чем CPU, и в результате они спроектированы по-другому. Они созданы для многократного параллельного выполнения математических функций, что они могут делать намного быстрее, чем обычный CPU. Помните, что на вашем дисплее 1080p нужно заполнить миллионы пикселей, каждый из которых должен быть рассчитан, когда вы запускаете приложение или любимую игру.
SoC Exynos 2200 с графическим процессором AMD
Большинство графических операций повторяются снова и снова, чтобы заполнить все пиксели на экране. Таким образом, графические процессоры предназначены для одновременного выполнения большого количества математических операций над большими пакетами данных. В отличие от CPU, которые выполняют одну или две операции в каждом цикле, графические процессоры выполняют десятки, сотни и даже тысячи параллельных операций в каждом цикле. Это зависит от размера и производительности графического процессора.
Двумя основными графическими процессорами в области Android SoC являются Arm Mali и Qualcomm Adreno. Оба предлагают большие и меньшие версии технологии GPU, а флагманские чипы упакованы в самое мощное оборудование для 3D-игр. Qualcomm мало говорит о внутренней работе Adreno, тогда как об архитектуре Mali известно почти всё. У Apple также есть собственный графический процессор для своих SoC iPhone, и AMD скоро вступит в бой с графической SoC Exynos по соглашению с Samsung.
Хорошие камеры нуждаются в хороших процессорах
Смартфоны все чаще оценивают по их фотографическим возможностям. В то время как высококачественные сенсоры и объективы имеют важное значение, мощные возможности обработки изображений не менее важны. Достаточно взглянуть на впечатляющие результаты простой аппаратной настройки камеры Google Pixel 4.
В то время как редактирование и настройка изображений часто выполняются на CPU и GPU, прежде чем изображение будет сохранено на вашем телефоне, выполняется масса обработок данных с датчиков камеры.
ISP (Image Signal Processor, переводится как «Процессор Обработки Изображений») — это специализированный DSP (Digital Signal Processing, переводится как «Цифровая Обработка Сигналов»), который выполняет общие задачи обработки изображений, такие как преобразование Байера, фокусировка, демозаизация, повышение резкости и шумоподавление. Другими словами, он превращает цифровую информацию с сенсора камеры в красивую картинку.
Kirin 990 от Huawei
Последние две задачи особенно важны для смартфонов, где более дешевые телефоны имеют тенденцию к чрезмерной резкости и создают размытые детали.
Высококачественные чипсеты все чаще предлагают высококлассные функции. Например, Kirin 990 от Huawei был первым SoC с согласованием блоков DSLR и 3D фильтрацией (BM3D) снижения шума, а новейшие ISP от Qualcomm и Samsung обеспечивают программное размытие боке видео в реальном времени.
Суть в том, что для красивых изображений требуется мощный процессор обработки изображений.
Искусственный Интеллект Нового Поколения
Такие термины, как нейронные процессоры, процессоры ИИ (искусственного интеллекта) или ядра машинного обучения, часто используются взаимозаменяемо, но все они, как правило, означают одно и то же в современных смартфонах: процессор, специально оптимизированный для математики и алгоритмов, обычно используемых нейронными сетями.
Точно так же, как графические процессоры являются процессорами, оптимизированными для графической математики, а ISP оптимизированы для задач с изображениями, процессоры NPU (Neural Processing Unit, переводится как «нейронный процессор») специально разработаны для более быстрого и эффективного выполнения задач нейронных сетей и машинного обучения, чем CPU. NPU также имеют собственные кэши локальной памяти, чтобы ускорить выполнение без необходимости использования более медленной оперативной памяти.
Нейронные сети часто используют операции, которые требуют нескольких фрагментов входных данных для создания только одного выходного. Особенно популярна операция совмещённого умножения-сложения, которая часто работает с данными различных размеров-от 16 до 8 бит и даже 4 бит данных. Это сильно отличается от математических вычислений и типов данных, используемых центральными процессорами, хотя некоторые операции могут быть ускорены на гибких графических процессорах.
NPU — это новейший специализированный процессор, который находит свое применение в телефонных SoC. Хотя эта технология в основном предназначена для флагманских чипов, она быстро распространяется на более доступные чипсеты и телефоны.
Модемы 4G и 5G для более быстрой передачи данных
Последней частью SoC современного смартфона является модем для передачи данных, который позволяет вам получать доступ к сетям передачи данных от вашего оператора связи. Различные модемы также определяют скорость и качество вашего подключения к передачи данных. Самые мощные модемы достигают скорости загрузки выше 1 Гбит/с. Существуют также модемы для передачи данных Wi-Fi и Bluetooth, но сегодня мы фокусируемся на модемах 4G и 5G.
В предыдущие годы SoC для смартфонов имели встроенные модемы 4G. Это означает, что 4G-модем находится внутри SoC. Первые модемы 5G для смартфонов были внешними, поэтому их нужно было подключать к основному SoC. Это менее энергоэффективно, но упрощает реализацию высокопроизводительных функций и обеспечивает производителю гибкость при развертывании сетей 5G для большего числа потребителей.
Интегрированные модемы и возможности 5G теперь уже здесь. Все флагманские процессоры Qualcomm, Samsung и Huawei оснащены встроенными модемами, которые поддерживают возможности подключения как ниже 6 ГГц, так и mmWave 5G. Все флагманские телефоны 5G 2021 года оснащены встроенными модемами, что позволяет повысить энергоэффективность при достижении пиковых скоростей передачи данных.
Подробнее о SoC для смартфонов
Энтузиасты телефонов любят сравнивать характеристики CPU и GPU, но это становится менее актуальным, поскольку производительность растет и требуются новые возможности. В SoC для смартфонов все меньше внимания уделяется какой-либо отдельной возможности, а больше — гетерогенному вычислительному подходу к решению проблем обработки. Другими словами, использование наиболее эффективного типа процессора для данной задачи.
Современные телефоны справляются с более широким спектром рабочих нагрузок, чем когда-либо прежде. В результате количество выделенных процессоров внутри каждого чипа продолжает расти. От базовых компонентов CPU и GPU несколько лет назад до DSP, продвинутых ISP и NPU сегодня. Эти менее обсуждаемые детали становятся только более важными с достижениями в области безопасности, машинного обучения и 5G.
Источник