- Практическое руководство по оптимизации для мобильных
- Мобильные устройства не созданы одинаковыми
- Оптимизацию не следует считать последней стадией разработки проекта
- Оптимизация: Не только для программистов
- Планируйте игру так, чтобы во время исполнения она работала “плавно”.
- Профилируйте на ранней стадии и почаще
- Внутренний Профайлер
- Внутренний Профайлер
- Practical guide to optimization for mobiles
- Мобильные устройства не созданы одинаковыми
- Оптимизацию не следует считать последней стадией разработки проекта
- Optimization: not just for programmers
- Design your game for a smooth runtime
- Профилируйте на ранней стадии и почаще
- Unity Profiler
- Internal profilers
- Оптимизации
- Фокус на GPU
- Хорошая практика
- Shader optimizations
- Фокус на CPU
- Хорошая практика
- Физика
- Android
- Что еще почитать
- Разрешение экрана
- Версия android
- Что еще почитать
- Разрешение экрана
- iOS версия
- Динамические объекты
- Asset Бандлы
- Если предел на количество одновременно загружаемых ассет бандлов на iOS? (т.е. можем ли мы безопасно загрузить более 10 ассет бандлов одновременно (или каждый кадр)?)
- Ресурсы
- Список глупых проблем
Практическое руководство по оптимизации для мобильных
Это руководство предназначено для новичков в мобильном геймдеве. Для тех, кто испытывает трудности при планировании и прототипировании новой мобильной игры (или портировании уже существующего проекта). Также этот раздел будет полезен в качестве справки для каждого, кто делает мобильные или браузерные игры (с целевой платформой — старые ПК или нетбуки).
Оптимизация вообще широкая тема, и то как вы ее сделаете, целиком зависит от вашей игры, поэтому данное руководство следует рассматривать как некое введение или ссылку, а не пошаговое руководство.
Мобильные устройства не созданы одинаковыми
Информация здесь предполагает аппаратное обеспечение на уровне чипсета Apple A4, который используется в оригинальных iPad, iPhone 3GS и третьем поколении iPod Touch. Из Android предполагается устройство подобное Nexus One, или большинства устройств, работающих на Android 2.3 Gingerbread. В основном, эти устройства были выпущены в начале 2010 года. Эти устройства старее, медленнее современных, но так как они составляют большую часть рынка, их также следует поддерживать.
Есть очень быстрые и очень медленные телефоны. Вычислительные мощности мобильных устройств растут с потрясающей скоростью. Для нового поколения мобильной GPU, быть в 5 раз быстрее своего предшественника — обычное дело. Скорость мобильных устройств уже сравнима со скоростью ПК.
Для обзора технических характеристик мобильных устройств от Apple, см. Hardware.
Если вы хотите разрабатывать под мобильные устройсва, которые станут известными в будущем, или эксклюзивные high end устройства прямо сейчас, вы можете это сделать. См. Мобильные устройства будущего.
Очень низкая производительность (например, iPhone 3G или первое и второе поколение iPod touches) требует особого внимания к оптимизации. В противном случае могут возникнуть проблемы когда покупатели, не обновившие устройства, будут покупать ваши приложения. Если же вы делаете бесплатное приложение, можно не беспокоится о поддержке старых устройств.
Оптимизацию не следует считать последней стадией разработки проекта
Британский ученый Майкл А. Джексон часто цитируется своими Правилами оптимизации программ:
_Первое правило оптимизации программы: не делаете ее. Второе правило оптимизации программы (только для экспертов!): не делайте ее пока что.
Он обосновал это тем, что учитывая рост скорости компьютеров, ваша программа будет достаточно быстрой. Кроме того, если вы попытаетесь слишком много оптимизировать, то сильно усложните код, ограничите себя и создадите много ошибок.
Однако, если вы разрабатываете мобильные игры, есть еще одно мнение: аппаратное обеспечение, представленное сейчас на рынке, сильно ограничено по сравнению с компьютерами, которые мы используем для работы. Поэтому высок риск того, что ваша ваша игра не будет работать на большинстве устройств и оптимизацию рекомендуют делать с самого начала разработки.
В данном руководстве мы постараемся указать ситуации, когда оптимизация сыграет большую роль в производительности, по сравнению с обратными ситуациями, когда оптимизация большого значения не имеет.
Оптимизация: Не только для программистов
Художникам тоже полезно знать ограничения платформы и методы, которые используются для того, чтобы их обойти. Зная это, они могут принимать креативные решения, которые в итоге сэкономят их труд.
- На художника ложится большая ответственность. Если дизайн игры предполагает атмосферность и освещение, их можно нарисовать в текстурах вместо запекания.
- Каждый раз, когда что-либо может быть запечено, художники могут готовить контент для выпекания, вместо рендеринга в реальном времени. Это позволяет им игнорировать технические ограничения и работать свободно.
Планируйте игру так, чтобы во время исполнения она работала “плавно”.
Эти две страницы детально описывают основные тенденции в игровой производительности и объясняют, как лучше спланировать оптимизацию своей игры или как интуитивно выявить места, нуждающиеся в оптимизации (в случае, если игра уже вышла в продакшн).
Профилируйте на ранней стадии и почаще
Профилирование важно, потому что оно поможет выяснить, какие оптимизации действительно приведут к большому приросту производительности, а какие являются пустой тратой вашего времени. Благодаря тому, что рендеринг обрабатывается на отдельном чипе (GPU), отрисовка одного кадра занимает в два раза меньше времени (только GPU, а не CPU + GPU). Это означает, что если CPU замедляет работу, оптимизация ваших шейдеров вообще не повысит частоту кадров, и если GPU замедляет работу, не помогут оптимизация физики и скриптов.
Часто бывает так, что разные части игры и разные ситуации работают по разному, так что одна часть игры может привести к 100 миллисекундным кадрам полностью из скрипта, а другая может привести в замедлению игры, потому что в данный момент что нибудь рендерится. Поэтому, если вы собираетесь оптимизировать свою игру, нужно по крайней мере выявить узкие места.
Внутренний Профайлер
Профайлер в Unity в основном используется при ориентации на iOS и Android. См. Руководство по профайлеру для основных инструкций по его использованию.
Внутренний Профайлер
Внутренний профайлер выкидывает текст каждые 30 кадров. Это поможет вам выяснить, какие аспекты вашей игры замедляют ее, будь то физика, скрипты, визуализация, но без множества деталей (например, только название скрипта или визуализации).
См. Встроенный Профайлер для подробной информации о том, как это работает и включается.
Источник
Practical guide to optimization for mobiles
This guide is for developers new to mobile game development, who are probably feeling overwhelmed and are either planning and prototyping a new mobile game or porting an existing project to run smoothly on a mobile device. This guide should also be useful as a reference for anyone making mobile games or browser games that target old PCs and netbooks.
Optimization is a broad topic, and how you do it depends a lot on your game. Because of this, this guide is best read as an introduction or reference rather than a step-by-step guide that guarantees a smooth product.
Мобильные устройства не созданы одинаковыми
The information here assumes hardware around the level of the Apple A4 chipset, which is used on the original iPad, the iPhone 3GS, and the third generation iPod Touch. On the Android side, that would mean an Android phone such as the Nexus One, or most phones that run Android 2.3 Gingerbread. Most of these devices were released around early 2010. Out of the app-hungry market, these devices are the older, slower portion, but they should be supported because they represent a large portion of the market.
For an overview of Apple mobile device tech specs, see documentation on iPhone hardware. The very low-end Apple mobile devices (such as the iPhone 3G) and the first and second generation iPod Touches are extremely limited, and even more care must be taken to optimize for them. However, there is some question as to whether consumers who have not upgraded their device will be buying apps at all. So, unless you are making a free app, it might not be worthwhile to support the old hardware.
There are much slower and much faster phones out there, and the computational capability of mobile devices is increasing at an extraordinary rate. It’s not unheard of for a new generation of a mobile GPU to be five times faster than its predecessor. That’s incredibly fast when compared to the PC industry.
Оптимизацию не следует считать последней стадией разработки проекта
British computer scientist Michael A. Jackson is often quoted for his rules of program optimization:
“The first rule of program optimization: don’t do it. The second rule of program optimization (for experts only!): don’t do it yet.”
His rationale was that, considering how fast computers are and how quickly their speed is increasing, there is a good chance that, if you program something, it will run fast enough. Additionally, if you try to optimize too heavily, you might over-complicate things, limit yourself, or create bugs.
Однако, если вы разрабатываете мобильные игры, есть еще одно мнение: аппаратное обеспечение, представленное сейчас на рынке, сильно ограничено по сравнению с компьютерами, которые мы используем для работы. Поэтому высок риск того, что ваша ваша игра не будет работать на большинстве устройств и оптимизацию рекомендуют делать с самого начала разработки.
Throughout this guide, we will try to point out situations where an optimization would help a lot, versus situations where it would just be frivolous.
Optimization: not just for programmers
Artists also need to know the limitations of the platform, and the methods that are used to get around them, so they can make creative choices that pay off without having to re-produce work.
- More responsibility can fall on the artist if the game design calls for atmosphere and lighting to be drawn into Textures instead of being baked.
- Whenever anything can be baked, artists can produce content for baking instead of real-time rendering. This allows them to ignore technical limitations and work freely.
Design your game for a smooth runtime
These two pages detail general trends in game performance, and explain how you can best design your game to be optimized or how you can intuitively figure out which things need to be optimized if you’ve already gone into production.
Профилируйте на ранней стадии и почаще
Profiling is important because it helps you discern which optimizations will pay off with big performance increases and which ones are a waste of your time. Because of the way that rendering is handled on a separate chip (GPU), the time it takes to render a frame is not the time that the CPU takes plus the time that the GPU takes. Instead, it is the longer of the two.
That means that if the CPU is slowing things down, optimizing your Shaders won’t increase the frame rate at all, and if the GPU is slowing things down, optimizing physics and scripts won’t help at all.
Often, different parts of the game and different situations perform differently as well. This means one part of the game might cause 100 millisecond frames entirely due to a script, and another part of the game might cause the same slowdown but because of something that is being rendered. At the very least, you need to know where all the bottlenecks are if you’re going to optimize your game.
Unity Profiler
You can use the main Profiler in Unity when targeting iOS, Android or Tizen. See documentation on the Profiler for basic instructions on how to use it.
Internal profilers
Andriod and iOS both have a built-in internal profiler, which spews out text every 30 frames. It can help you figure out which aspects of your game are slowing things down (such as physics, scripts, or rendering), but it doesn’t go into much detail (for example, it can’t tell you which script or renderer is the culprit).
- If the profiler indicates that most of your processing time is spent in rendering, see documentation on Rendering Optimizations
- If the profiler indicates that most of your processing time is spent outside of rendering, see documentation on Scripting Optimizations
See documentation on Internal profilers for information on how they work and how to turn them on.
Источник
Оптимизации
Так же как и ПК, мобильные платформы iOS и Android имеют множество девайсов с различными уровнями производительности. Вы можете найти телефон, в 10 раз превосходящий по мощности рендеринга другой телефон. Быстрый, легкий путь для измерения:
- Убедитесь, что он хорошо работает на базовой конфигурации
- Используйте больше “красивостей” для высокопроизводительных устройств:
- Разрешение
- Пост-обработка
- MSAA
- Анизотропия
- Шейдеры
- Плотность, включение и отключение fx/частиц
Фокус на GPU
Графическая производительность связана с филлрейтом, пиксельной и геометрической сложностью (количеством вершин). Их можно уменьшить. Здесь может помочь Occlusion culling, т.к. Unity не будет отображать объекты, не входящие в область обзора.
На мобильных, по сути, связь скорости заполнения (скорость заполнения = пиксели экрана * сложность шейдера * овердрафт) и более сложных шейдеров является наиболее распространенной причиной проблем. Поэтому рекомендуется использовать мобильные шейдеры, поставляемые с Unity или писать свои, как можно более простые. Если это возможно, заменяйте пиксельные шейдеры на вершинные.
Если уменьшение качества текстур в настройках качества сделает игру быстрее, то у вас, возможно, ограничена пропускная способность памяти. Поэтому используйте компрессию текстур, мипмапы, уменьшайте размер текстуры и т.д.
LOD (Level of Detail) — make objects simpler or eliminate them completely as they move further away.
Хорошая практика
Мобильные графические процессоры имеют огромные трудности в том, как много тепла они производят, сколько энергии они потребляют, насколько большие или шумные они могут быть. Так, по сравнению с настольными, мобильные графические процессоры имеют меньшую пропускную способность, низкую ALU производительность и производительность текстур. Архитектуры графических процессоров также настроены под использование низкой пропускной способности и производительности.
Unity оптимизирован под OpenGL ES 2.0, используется шейдерный язык GLSL ES(схожий с HLSL). Чаще всего шейдеры пишутся в HLSL (известен также как Cg). Это перекрестие, сделанное в GLSL ES для мобильных платформ. Также вы можете писать на GLSL, если хотите, но при этом придерживайтесь OpenGL платформ (mobile + Mac). При использовании float/half/fixed типов в HLSL, они в конечном итоге будут highp/mediump/lowp точными определителями в GLSL ES.
Вот контрольный список для хороший практики:
- Количество материалов должно быть как можно более низким. Это делает батчинг для Unity более легким.
- Используйте атласы текстур (большие изображения, содержащие более маленькие) вместо большого количества отдельных текстур. Это сделает загрузку более быстрой.
- Используйте Renderer.sharedMaterial вместо Renderer.material если используете атласы текстур и общие материалы.
- Рендер пиксельного освещения дорог.
- Используйте карты освещения вместо освещения в реальном времени там, где это возможно.
- Отрегулируйте пиксельное освещение в настройках качества. В сущности, на пикселе должен быть направленный свет, все остальное — на вертексе. Конечно, это зависит от игры.
- Экспериментируйте с Render Mode Освещения в настройках качества, для получения правильного приоритета.
- Избегайте cutout шейдеров (альфа тест), если это действительно необходимо.
- Сведите к минимуму прозрачную (альфа смешивание) часть экрана.
- Постарайтесь избежать ситуаций, когда несколько источников света освещают какой либо объект.
- Попробуйте уменьшить общее количество шейдерных проходов (тени, пиксельное освещение, отражения).
- Критический порядок визуализации. В общем случае:
- полностью непрозрачные объекты примерно спереди-сзади.
- альфа тестируемые объекты примерно спереди-сзади.
- скайбокс
- объекты со смешенной альфой (если это необходимо, задом наперед).
- Пост обработка дорога для мобильных, используйте аккуратно.
- Партиклы: уменьшите овердрафт, используйте как можно более простые шейдеры.
- Двойной буфер для мешей, умножаемый каждый кадр:
Shader optimizations
Проверка границ филлрейта (fillrate) проста: если вы уменьшите разрешение, игра будет идти быстрее? Если да, то ваш филлрейт ограничен.
Попробуйте уменьшить сложность шейдеров с помощью следующих методов:
- Избегайте шейдеров с альфа-тестом, вместо этого используйте альфа-смешанные версии.
- Используйте простой, оптимизированный код шейдеров (например, как у шейдеров “Mobile”, которые поставляются с Unity).
- Избегайте дорогих математических функций в коде шейдеров (pow, exp, log, cos, sin, tan и т.д.). Вместо этого постарайтесь использовать заранее вычисленные текстуры.
- Для лучшей производительности, сделайте количество точных рассчетов (float, half, fixedin Cg) как можно более низким.
Фокус на CPU
Часто бывает, что обработка пикселей в игре ограничивается процессором. Таким образом, в конечном итоге остаются неиспользуемые мощности, особенно на многоядерных процессорах. Таким образом, часто целесообразно перекладывать следующие функции с GPU на CPU (Unity их поддерживает): mesh skinning, батчинг маленьких объектов, обновления геометрии частиц.
Это следует делать с осторожностью. Если вы не связаны по графическим вызовам (draw calls), то батчинг на самом деле помешает производительности. Он сделает culling менее эффективным и сделает многие объекты зависимыми от освещения.
Хорошая практика
- FindObjectsOfType (и вцелом геттерные функции Unity) очень медленные, поэтому используйте их с умом.
- У неподвижных объектов активируйте свойство Static. Это позволит им участвовать во внутренних оптимизациях (таких как статический батчинг).
- Произведите множество циклов процессора для обеспечения лучшей сортировки occlusion culling (отсечение невидимых поверхностей).
Физика
Физика может сильно нагрузить процессор. Можно проследить это с помощью профайлера редактора. Если физика сильно нагружает процессор:
- Настройте Time.fixedDeltaTime (в Project settings -> Time) так, чтобы он был как можно более высоким. Если ваша игра с медленным движением, то, вероятно, вам понадобится меньше фиксированных обновлений, чем игре с быстрым движением. Быстрый темп игры нуждается в более частых расчетах, поэтому, чтобы не было сбоев с коллизиями, fixedDeltaTime должен быть ниже.
- Physics.solverIterationCount (Physics Manager).
- Используйте как можно меньше объектов типа Cloth.
- Rigidbodies используйте только там, где это необходимо.
- Вместо меш коллайдеров старайтесь использовать примитивные коллайдеры.
- Никогда не двигайте статический коллайдер (т.е. коллайдер без Rigidbody), так как это сильно скажется на производительности. В профайлере это отобразится как “Static Collider.Move”, но на самом деле будет обрабатываться в Physics.Simulate. Если понадобится, добавьте RigidBody и установите isKinematic в true.
- В Windows вы можете использовать NVidia’s AgPerfMon набор инструментов для профилирования, чтобы получить больше необходимых деталей.
Android
Это популярная мобильная архитектура. У нее отличные от ПК/Консоли поставщики программного обеспечения и архитектура GPU сильно отлична от “обычной”.
- ImgTec PowerVR SGX — основанный на тайлах: визуализирует все в маленьких тайлах (16×16), тени только на видимых пикселях
- NVIDIA Tegra — классический: визуализирует все
- Qualcomm Adreno — тайловый: визуализирует все в тайле, поддерживает большие тайлы (256к). Adreno 3xx может быть переключен в традиционный.
- ARM Mali — тайловый: визуализирует все в тайле, поддерживает маленькие тайлы(16×16)
Потратьте некоторое время на рассмотрение различных подходов к рендерингу и спроектируйте свою игру соответственно. Заострите внимание на сортировке. Определите самые низкие из поддерживаемых девайсов в начале разработки. Протестируйте на них с профайлером свою игру.
Используйте специфичное для платформы сжатие текстур.
Что еще почитать
- Руководство по архитектуре PowerVR SGX http://imgtec.com/powervr/insider/powervr-sdk-docs.asp
- Tegra GLES2 feature guide http://developer.download.nvidia.com/assets/mobile/files/tegra_gles2_development.pdf
- Руководство по производительности Qualcomm Adreno GLES http://developer.qualcomm.com/file/607/adreno200performanceoptimizationopenglestipsandtricksmarch10.pdf
- Engel, Rible http://altdevblogaday.com/2011/08/04/programming-the-xperia-play-gpu-by-wolfgang-engel-and-maurice-ribble/
- Руководство по оптимизации ARM Mali GPU http://www.malideveloper.com/developer-resources/documentation/index.php
Разрешение экрана
Версия android
Пострадает только PowerVR архитектура (основанная на тайлах).
- ImgTec PowerVR SGX. Tile based, deferred: render everything in tiles, shade only visible pixels.
- Карты освещения уже не так необходимы.
- Antialiasing and aniso are cheap enough, not needed on iPad 3 in some cases.
- Если вершинные данные каждого кадра (количество вершин * хранение требуется после вершинных шейдеров) превышает внутренние буферы, выделенные драйвером, то для лучшей производительности сцена должна быть разделена. После этого драйвер должен выделить буфер большего размера, или же вам нужно будет снизить количество вершин. Это становится видно на iPad2 (iOS 4.3) на отметке 100 000 вершин с довольно сложными шейдерами.
- TBDR нуждается в большем количестве транзисторов, выделяемых на тайлинг и отложенные части, оставляя концептуально меньше транзисторов для “чистой производительности”. Очень трудно (практически невозможно) выделить в GPU время на отрисовку вызова в TBDR, что делает профилирование сложным.
Что еще почитать
- Руководство по архитектуре PowerVR SGX http://imgtec.com/powervr/insider/powervr-sdk-docs.asp
Разрешение экрана
iOS версия
Динамические объекты
Asset Бандлы
- Asset Бандлы кешируются на устройстве до определенного предела
- создаем используя Editor API
- Загружаем используя WWW API: WWW.LoadFromCacheOrDownload или как ресурс: AssetBundle.CreateFromMemory или AssetBundle.CreateFromFile
- Выгружаем используя AssetBundle.Unload. Там есть опция для выгрузки бандла, но перед этим сохраните загруженный ассет. Также можно удалить все загруженные ассеты, даже если на них есть ссылки в сцене
- Resources.UnloadUnusedAssets выгружает все ассеты, на которые больше нет ссылок в сцене. Не забывайте убивать ссылки на ассеты, если они вам не нужны. Публичные и статические переменные не убираются сборщиком мусора.
- Resources.UnloadAsset выгружают специфические ассеты из памяти. Если нужно, они могут быть повторно загружены с диска.
Если предел на количество одновременно загружаемых ассет бандлов на iOS? (т.е. можем ли мы безопасно загрузить более 10 ассет бандлов одновременно (или каждый кадр)?)
Загрузки реализованы через асинхронный API, представленный ОС, потому что ОС решает как много потоков нужно для создания загрузки. При одновременном запуске нескольких загрузок, нужно учесть общую пропускную способность устройства, которую он может поддерживать и объем свободной памяти. Каждая параллельная загрузка выделяет отдельный временный буфер, поэтому нужно убедится что хватит оперативной памяти.
Ресурсы
- Ассеты должны быть признаны Unity, быть размещенными в билде.
- Добавьте к файлу .bytes если вам нужно чтобы Unity распознавал его как файл с двоичными данными.
- К текстовым файлам добавьте .txt, в этом случае Unity будет его распознавать как текстовый ассет
- Ресурсы преобразуются в формат платформы во время сборки.
- Resources.Load()
Список глупых проблем
- Текстуры без надлежащего сжатия
- Разные решения для различных случаев, не забудьте сжать текстуры если вам это нужно.
- ETC/RGBA16 — по умолчанию для android, но вы можете настроить его в зависимости от GPU. Лучший подход — использовать ETC везде, где это возможно. Альфа текстуры могут использовать два ETC файла с одним каналом для альфы.
- PVRTC — по умолчанию для iOS, хорош в большинстве случаев
- Текстуры, имеющие включенные Get/Set пиксели удваивают размер, деактивируйте Get/Set, если вам это нужно
- Текстуры, загруженные в JPEG/PNG во время исполнения будут несжаты
- Большие mp3 файлы помечайте как decompress on load
- Добавьте загрузку сцены
- Неиспользуемые ассеты остаются неочищенными в памяти.
- Если есть случайные сбои, попробуйте запустить на devkit или на устройстве с 2 GB памяти (например, на Ipad 3).
Иногда ничего нет в консоли, просто случайный сбой
- Fast script call и stripping могут привести к случайным сбоям на iOS. Попробуйте без них.
Источник