Новая технология Neural Engine и Apple GPU — Apple A11 Bionic
Было опубликовано 25 июля 2019 года
Обновлено 5 ноября 2020 года
Apple A11 Bionic – ARM-система на кристалле (SoC), разработан Apple и изготовлен TSMC. Cочетает в себе процессоры Monsoon и Mistral с графическим процессором Apple GPU.
Впервые появился в iPhone 8, iPhone 8 Plus и iPhone X.
Согласно Apple, Apple A11 Bionic имеет два высокопроизводительных ядра, которые на 25% быстрее, чем в Apple A10 Fusion, и четыре высокопроизводительных ядра, которые на 70% быстрее, чем энергоэффективные ядра в A10.
О процессоре
A11 оснащен разработанным Apple 6-ти ядерным процессором с двумя высокопроизводительными ядрами на частоте 2,39 ГГц, называемыми Monsoon, и четырьмя энергоэффективными ядрами, называемыми Mistral. Ядра Mistral основаны на ядрах Apple Swift от Apple A6. A11 использует новый контроллер производительности второго поколения, который позволяет A11 использовать все шесть ядер одновременно, в отличие от своего предшественника A10.
Чип также интегрирует разработанный Apple трехъядерный графический процессор (GPU) с 30% более высокой графической производительностью, чем A10. В A11 встроен сопроцессор движения M11. Apple A11 Bionic включает в себя новый процессор обработки изображений, который поддерживает вычислительные функции фотографии, такие как оценка освещения, широкий захват цвета и расширенная обработка пикселей.
Рейтинг Antutu
Apple A11 Bionic в рейтинге Antutu набирает около 290.000 баллов. Для сравнения A10 Fusion набирает примерно в среднем 225.000 условных единиц.
Neural Engine
A11 включает в себя выделенное нейронное сетевое оборудование, которое Apple называет «Neural Engine«.
Это оборудование нейронной сети может выполнять до 600 миллиардов операций в секунду и используется для Face ID, Animoji и других задач машинного обучения. Neural Engine позволяет Apple реализовать нейронную сеть и машинное обучение более энергоэффективным способом, чем использование основного процессора или графического процессора.
Однако сторонние приложения не могут использовать нейронный движок данного поколения, что приводит к аналогичной производительности нейронной сети для старых iPhone.
Поддержка
Начало поддержки iOS — iOS 11. Обновления программного обеспечения для систем, использующих этот чип продолжается до сих пор. Производство продолжалось с 2017 года по 2020 год.
Технические характеристики
Базовая частота – 2x 2,39 ГГц ( Monsoon ) + 4x 1,42 ГГц ( Mistral )
Количество ядер – 6
Модель ускорителя – Apple GPU
Количество ядер – 3
Тип оперативной памяти – LP-DDR4X 2133 МГц
Количество оперативной памяти – 3 ГБ
Прочее
Технологический процесс – 10 нм
Количество транзисторов – 4,3 млрд
Набор инструкций – ARMv8.2-A
Площадь кристалла – 87.66 мм^2
Версия Bluetooth – 5.0
Версия Wi-Fi – 5
Поддержка 5G – нет
Источник
Apple A11 Bionic: Это магия?
В сентябре 2017 года, как обычно, Apple представила публике очередную систему-на-чипе, безнадежно проигрывающую в войне спецификаций, непостижимым образом приходящую первой к финишу, оставляя позади победителей в этой войне. Интересный стиль. Слово “Bionic” в названии SoC появилось неспроста. На кристалле теперь размещался еще один процессор, который маркетинг Apple назвала “нейронным движком” (Neural Engine), основан на нейронных сетях, которым еще лет 20 назад пророчили лидирующую роль в вычислительной технике, и освобождает центральный процессор от забот о машинном обучении и прочих проявлениях искусственного интеллекта в нескольких предметных областях. Для сторонних разработчиков NPU был недоступен.
Группу машинного обучения и искусственного интеллекта в Apple с 2016 года возглавляет Руслан Салахутдинов, выходец из Российской Федерации. Один из ведущих ученых в этой непростой и перспективной области. Разработка NPU (Neural Processing Unit, нейронный процессор) в Apple началась еще в 2014 или 2015 году. Это совместная разработка группы машинного обучения и искусственного интеллекта и группы микроэлектроники. В секунду NPU выполняет 600 миллиардов операций, и это было только начало.
Площадь кристалла Apple A11 Bionic (87,7 мм2) почти в полтора раза меньше чем площадь Apple A10 Fusion (125,0 мм2). NPU занимает на кристалле всего 1,83 мм2. Меньше чем ядро “с высокой производительностью” (2,68 мм2) и больше чем энергосберегающее ядро (0,53 мм2). И на этих 1,83 мм2 выполняется до 600 миллиардов операций в секунду?
Это продолжение серии про чипы разработанные Apple. Предыдущие части здесь.
Apple A11 Bionic и PoP
Apple A11 Bionic производился TSMC по технологии 10 нм FinFET (процесс CLN10FF), всего на чипе было 4,3 миллиарда транзисторов. На кристалле размещались 6-ядерный CPU, 3-ядерный GPU собственной “яблочной” разработки, уже упоминавшийся NPU, процессор обработки изображений (ISP) нового поколения, сопроцессор M11 и много разных других интересных вещей. Тот самый “Секретный Анклав”, обеспечивающий безопасность данных и целостность устройства. Он же превращает телефон в кирпич, при неудачном взломе.
SoC, вместе с оперативной памятью (2 или 3 Гигабайта LPDDR4X, в разных устройствах), объединялся в одном корпусе (PoP), по технологии TSMC InFO. Технология InFO для TSMC была предметом заслуженной гордости. Apple очень повезло с партнерами. LPDDR4X – это вариант LPDDR4 с уменьшенным раза в два энергопотреблением. Apple использовала чипы памяти от Samsung и Micron. В приобретенном iPhone с Apple A11 Bionic могли оказаться любые из них. Лотерея, на этот раз беспроигрышная. Проблем с чипами памяти не было.
CPU состоял из двух силовых ядер Monsoon (“муссон”) и четырех экономичных Mistral. Все ядра могли работать одновременно. Apple реализовала это далеко не первой в индустрии, более того, в 2017 технологию Fusion уже считали устаревшей, во всех её формах, и ей на смену уже шла новая технология, DynamicIQ, вот только в отделении микроэлектроники Apple спешить не любили, тщательно все обдумывая и просчитывая, в итоге применяя козырные приемы самыми последними, но вдумчиво и с поразительными результатами. Так было и на этот раз.
Тактовую частоту удалось достоверно определить только для ядер Monsoon. До 2,39 ГГц, в нормальных условиях. В неблагоприятных (при нагревании до температуры близкой к опасной) тактовая частота снижалась. Рабочая тактовая частота ядер Mistral достоверно неизвестна. Встречающиеся упоминания про 1,39 и про 1,57 ГГц почти наверняка не имеют отношения к действительности. Официально Apple сообщала о росте производительности, по сравнению с A10, на 25% (Monsoon), на 70% (Mistral). На 70% выросла эффективность контроллера производительности второго поколения. Этот контроллер оптимизировал взаимодействие ядер между собой, судя по результатам смартфонов использующих этот SoC в бенчмарках и в тестах из реальной жизни, у него это получалось неплохо.
Графический процессор в Apple A11 Bionic был свой, “яблочной” разработки. 3-ядерный, на 30% более производительный чем GPU в Apple A10 Fusion. В A9 и A10, отделение микроэлектроники все активнее вносило свои изменения в графические процессоры от PowerVR. В Apple A10 Fusion изменения были уже очень серьезными. И вот – свершилось. Внешне, под электронным микроскопом, “яблочный” GPU почти не отличался от прежнего. Эксперты даже насчитали в нем 6 ядер (кластеров, как их назвали в PowerVR), но едва ли Apple стала выдавать чужое за своё. И хозяин – барин. Если разработчик GPU заявляет о трех ядрах, значит их три. Шесть ядер было бы солиднее, но это не важно.
Достоинства собственного GPU очевидны: графический процессор был оптимизирован для работы с Metal 2. OpenCL и OpenGL поддерживались на приличном уровне, хоть и не самые свежие их версии. Радостные публикации в СМИ о том, что в Apple A11 Bionic все же нашлись недостатки Apple проигнорировала. У них были, как мы теперь знаем, совсем другие планы. 3-мерная производительность, игровые способности и все прочие важные для умного телефона элитного класса, естественно, поддерживались.
Гонки и выводы
В одной из статей, сравнивавших Apple A11 Bionic с Qualcomm Snapdragon 845, сначала сравнивались спецификации участников поединка. По всем сравниваемым параметрам Snapdragon или превосходил Bionic’а, или они были равны. Ядер больше (8 против 6), оперативная память у обоих противников LPDDR4X, но у Snapdragon её контроллер 2-канальный, более передовой DynamicIQ у Snapdragon вместо ассиметричного Fusion у A11, а результат – победил Apple A11 Bionic, с приличным отрывом. Вопреки всему.
Авторы пришли к выводу что гонки были нечестными: ядра ARM Corteх A75, используемый в Snapdragon 845 – универсальные, их эффективность зависит от особенностей смартфона в котором они применяются. А Apple A11 Bionic разработан специально для iPhone 8/8 Plus/X, и тщательно оптимизирован именно для них. Ну и – больше транзисторов на SoC, я бы к этим рассуждениям добавил яблочко на крышке SoC. Потому что именно так все и было задумано.
А эксперты, оценивая положение дел в процессорной индустрии, пришли к выводу что в победах Apple ничего удивительного нет. Отдел микроэлектроники Apple опережает всех конкурентов компании, как минимум, на два года. Только и всего. Ну не жулики?
Продолжение следует, а пока обсудить историю Apple вы можете в нашем Telegram-чате.
Источник
Подробности о сердце iPhone X — чипе A11 Bionic
Одним из самых важных новшеств двухчасовой презентации iPhone X была не столько говорящая какашка, сколько однокристальная система нового поколения с 4,3 млрд транзисторов — A11 Bionic, — с помощью которой такая передовая технология стала возможной. Ну а если серьёзно, то в беседе с журналистами Mashable главный маркетолог Apple Фил Шиллер (Phil Schiller) отметил, что в настоящее время основным новшеством каждого нового поколения продуктов компании являются чипы.
A11 Bionic стал следующим важным шагом Apple по пути вертикальной интеграции продуктов для полного контроля над всеми аспектами своих устройств. Старший вице-президент подразделения аппаратных технологий Apple Джони Сруджи (Johny Srouji) отметил: «Проектирование наших собственных кристаллов началось примерно десять лет назад, потому что это наилучший способ создать по-настоящему оптимизированные с аппаратной и программной сторон продукты Apple».
Он также подчеркнул, что на разработку новых чипов у Apple уходит порядка трёх лет, так что A11 Bionic начал создаваться ещё во времена выхода на рынок смартфона iPhone 6 и чипа A8. Во время этого цикла планы могут несколько корректироваться в соответствии с запросами команды разработчиков продуктов под руководством Джонатана Айва (Jonathan Ive). Но именно три года назад было сделано решение о добавлении на кристалл нейронного движка для ускорения вычислений в области искусственного интеллекта.
Обновлённые ядра CPU на общей площади кристалла A11: 2 высокопроизводительных и 4 энергоэффективных
Разумеется, каждое поколение чипов Apple разрабатывается на основе предыдущих наработок, но некоторые блоки перерабатываются полностью. Например, два высокопроизводительных ядра CPU от A10 Fusion получили небольшое обновление, а количество энергоэффективных ядер было удвоено (в A11 их стало четыре), появилась возможность задействовать от одного до всех шести ядер одновременно. Благодаря этим оптимизациям и новому 10-нм техпроцессу блок CPU в A11 Bionic стал потреблять меньше энергии, чем аналогичный в A10, несмотря на то, что высокопроизводительные ядра теперь на 25 % мощнее, а энергоэффективные — на 70 %.
Как можно видеть, немалую площадь A11 Bionic занимает процессор обработки изображений
Другим важным новшеством стал существенно более мощный специализированный процессор обработки изображений, который позволяет добиться более качественной цветопередачи камеры, улучшенного шумоподавления при недостатке света, а также ускорить различные эффекты вроде студийного освещения в новом портретном режиме. Благодаря этому новому блоку ISP впервые на рынке смартфонов стала возможна запись видео в разрешении 4K при 60 кадрах/с или 1080p при 240 кадрах/с.
Многие годы Apple использовала в своих однокристальных системах графику Imagination Tecnologies — последним примером стал 6-ядерный ускоритель PowerVR GT7600. Но в A11 компания приняла решение интегрировать спроектированный собственными силами блок GPU. Этот трёхъядерный GPU, по словам Apple, на 30 % мощнее использовавшегося в A10 Fusion блока от Imagination, а при прежней производительности потребляет вдвое меньше энергии. Ускоритель оптимизирован для наилучшей работы с низкоуровневым графическим API Metal 2 и, по словам Apple, позволяет создавать игры консольного класса.
Джони Сруджи отметил, что компания уже 30 лет придерживается принципа, согласно которому в тех областях, где она считает возможным внедрить новации, она старается создавать собственные решения: однокристальная система, CPU, ISP, дисплей и так далее. Следующим шагом в этом направлении стал GPU, благодаря чему Apple теперь может полностью контролировать графику на своих iOS-платформах: начиная от аппаратной части до компиляторов, языков программирования, библиотек и операционной системы. Всё это создаётся, чтобы работать в единой оптимальной связке.
Новый разработанный в недрах Apple графический ускоритель на фоне общей площади кристалла A11
Совершенно новым блоком для ускорения специфических задач стал двухъядерный нейронный движок с производительностью 600 млрд операций в секунду. Он эффективно справляется с задачами матричного умножения и вычислений с плавающей запятой и используется для ускорения специфических алгоритмов, связанных с машинным обучением, вроде Face ID, Animoji, дополненной реальности, студийного освещения при портретной съёмке и многого другого. Создан он для эффективной работы с ИИ-библиотекой Apple Core ML.
Такие ускорители — относительное новшество индустрии. Например, Google лишь в прошлом году представила специальные аппаратные серверные ускорители TPU (Tensor Processor Unit) для вычислений, использующих её ИИ-библиотеку TensorFlow. В этом году она выпустила второе поколение TPU, а также оптимизированную для мобильных устройств версию библиотеки машинного обучения TensorFlowLite. Другие компании тоже двигаются в аналогичном направлении. Например, у Facebook подобная технология называется Caffe2Go — она была представлена в ноябре прошлого года и позволила создать фильтры для фото и видео на основе нейронных сетей, работающих прямо на устройстве пользователя в реальном времени.
Google наверняка планирует реализовать и аппаратные блоки TPU для мобильных устройств, но Apple на этом фронте оказалась впереди и первой интегрировала такой ускоритель в свой чип для смартфонов. До сих пор большинство ИИ-расчётов производились в облаке, но исполнение таких алгоритмов прямо на устройстве позволяет сократить задержки, не требует интернет-соединения и обеспечивает более высокий уровень приватности (ведь данные не покидают устройство).
A11 Bionic включает и массу других блоков вроде цифрового сигнального процессора для качественной обработки звука, различных контроллеров ввода-вывода, специализированных алгоритмов корректирующего кода (ECC) и других блоков, повышающих безопасность и надёжность устройства. За 10 лет команда Apple проделала впечатляющую работу в полупроводниковой области, пройдя путь от 65-нм чипов со 100 млн транзисторов до 10-нм с 4,31 млрд.
Источник