Дневник разработчиков
Выпуск 78
Приветствуем, товарищи.

Сегодня очень чувствительная тема.

Чувствительная не просто в симуляторах или даже игровой индустрии в целом, а чувствительная для всего мира.

Люди иногда только за одно упоминание этого термина могут, не разобравшись в сути, и как в стародавние времена, поднять на вилы того, кто осмелился заикнуться об этом.

Но мы решили, что оставить этот вопрос без разбора не имеем права.
Генеративные технологии в разработке проекта
Вообще, искусственный интеллект и игры — это неразрывно связанная вещь. В том или ином виде ИИ присутствует в играх чуть ли не с самого их зарождения.

Но сейчас эта сущность начинает применяться во всё больших отраслях и принимать те виды, которые представляли только самые смелые фантасты.

Одной из самых спорных областей применения искусственного интеллекта является область применения его в областях создания творческих вещей.

Вот сегодня поделимся нашим отношением к этому и тому, как мы используем новые технологии.
Как и в случае с Корейской войной, временем, когда менялись не только авиационные эпохи, но ещё человечество стояло на пути изучения ядерной энергии, сейчас также формируются новые технологические рубежи, вырабатываются новые принципы взаимодействия с новыми возможностями.

Ядерная энергия может быть как чем-то ужасным, стирающим города с лица земли, так и быть невероятным благом, позволяющим этим городам разрастаться как никогда ранее. Важно только использовать технологию для созидания, а не разрушения. С искусственным интеллектом схожая ситуация. В первую очередь это нечто, что может дать невероятные возможности тем, кто её использует, но важно использовать этот инструмент с умом и с пониманием специфики области, в которой он применяется.

В данном случае на ум приходит очень древняя, но невероятно подходящая фраза, которую популяризировал в наше время бесспорно отличный комикс:
«Великая сила, великая и ответственность».
Сейчас к инструментам генеративных технологий достаточно просто получить доступ кому угодно. Из-за этого мы видим большое количество очень специфического контента.

Этот контент обладает свойствами, которые характерны произведениям, в которых затрачено безумное количество человеческого времени на проработку, и при этом это качество соседствует с полнейшей безвкусицей и, казалось бы, детскими ошибками. Такими ошибками, которые бы себе никогда не позволил художник, знающий, как своими руками создать высокодетализированное и сложное произведение.

Этот диссонанс зачастую и пугает. Человек, который не проходил путь создания таких работ, за большим количеством сложных деталей, сделанных на основе статистики, просто не видит каких-то простых ошибок, но чувствует, что что-то не так. Из-за этого формируется ощущение зловещей долины. На начальных этапах развития технологий найти эти ошибки было просто, например, посчитав количество пальцев. Сейчас же таких заметных ошибок всё меньше, но они есть, они спрятаны всё глубже, но подсознательно безусловно чувствуются. И вот для того, чтобы произведение было хорошим, без мастера, знающего своё дело, знающего, как добиться качественного результата своими руками, не обойтись.

Данные технологии хорошо подходят для того, чтобы сократить рутинные задачи хорошему художнику. Они позволяют высвободить время для создания большего количества мощных произведений. Но они не подходят для создания хорошего произведения целиком, без творца.

Ещё одним нюансом данной технологии, который важно учитывать, является то, что она базируется на данных, которые в неё загрузили. Эти данные перемалываются, и выдаётся некий результат. С одной стороны, это чем-то схоже с тем, как и человек что-либо производит. Мы также получаем некий жизненный опыт, вдохновляемся увиденным, который впоследствии применяем. За одним очень важным исключением: технология выдаёт некий усреднённый вариант на основе статистики и сформированного запроса, а человек в свою работу вкладывает определённые цели, и в его решения вмешивается гораздо большее число специфических факторов, влияющих на результат.

У любого здравомыслящего человека возникает некоторая ненависть к этой технологии в тех случаях, когда она применяется на основе чужого труда для получения очень посредственного и пустого собственного результата. В таких ситуациях теряется некоторая надежда вообще на всё человечество. Но эту надежду важно не терять.

И вот с этими мыслями, с пониманием этих моментов, мы и подходим к этим технологиям.

Мы не отрицаем преимуществ и силы данного инструментария, но считаем, что им стоит пользоваться только при условии большого понимания сферы, в которой эта технология применяется, и важно, чтобы она применялась на основе собственных идей, собственных наработок и материалов.

Разбор применения технологии начнём с той области, в которой её использование наиболее очевидно, и она уже есть в схожем виде и в других симуляторах достаточно давно.
Озвучание игрового радиообмена
Ранее формирование реплик в играх осуществлялось за счёт заранее предзаписанных конкретных фраз. Эти фразы хоть и могут быть записаны весьма хорошо, но имеют существенные ограничения в том, как они могут быть использованы. Они подходят только для одной конкретной ситуации.

Для каждой игровой ситуации фразу не запишешь, на это может и жизни человека не хватить. А это ещё и не учитывая, что в процессе существования проекта могут создаваться новые технологии, новые игровые ситуации и новые сюжетные кампании.

Даже простая, казалось бы, вещь: упоминание определённого номерного числа в радиообмене, не записывается актёрами целиком. Это можно сделать, если мы говорим про какую-то сюжетную законченную игру, когда, как в фильме, все события предопределены, тогда качества можно добиться неимоверного. Но как только мы пытаемся сделать именно игру, где важна вариативность ваших действий, где сам игрок создаёт сюжеты и погружается в мир, где мы непосредственно с игроком создаём впечатления, тогда такая предзаписанная реплика не работает.
Приходится искать какие-то ухищрения, делить реплики на части, делать какие-то составные фразы, в которых рушатся интонации, всё звучит прерывисто. Эти моменты рушат погружение и опыт игроков. И при формировании бесчисленного множества вариантов реплик под всевозможные ситуации, без генеративных технологий никуда. Не хватит и нескольких человеческих жизней на то, чтобы сделать то, что уже сейчас мы можем позволить себе при использовании ИИ.

Для обхода выше озвученных ограничений и для создания более гибкой системы радиообмена мы решили применить технологию Text-To-Speech генерации.

В компании-разработчике этой технологии работают не только программисты и специалисты по ИИ-технологиям, но и профессиональные лингвисты, что позволило создать модели озвучивания текста на 11 языках, 4 из которых будут применены в «Корее», а еще 5 — в будущих проектах «Серии игр Ил-2». Важно отметить, что создаваемые модели озвучания работают на основе специальным образом записанных нами голосов, с каждым из тех, кого мы записывали, у нас заключены соответствующие соглашения. Вообще, как было и раньше при записи голосовых реплик, большинство из тех, кого мы записывали — наши сотрудники. Можно сказать, это уже традиция, когда игра говорит голосами тех, кто её создаёт. Однако теперь с этими технологиями у нас значительно больше возможностей.
Причём этих возможностей больше не только у нас как у разработчиков, но и у тех, кто создаёт сторонние миссии. Создателям миссий больше не нужно ограничиваться только теми фразами, что записаны в проекте.

Применение такого подхода позволяет нам в дальнейшем бесконечно развивать и расширять набор фраз радиообмена на 11 языках, что полностью снимает проблему ограничения на развитие ИИ самолётов. Кроме того, это позволяет делать эти фразы намного менее «шаблонными», более разнообразными, что значительно улучшает качество звучания радиоэфира в игре. В итоге мы планируем создать радиообмен не только между самолетами, но и с радиолокационными станциями управления авиацией, с диспетчером аэродрома, сделать варианты озвучивания одних и тех же сообщений и многое другое. Да, это всё ещё не живая речь, всё ещё есть некоторые неточности в интонациях, но в целом радиообмен стал намного «богаче» и интереснее. Мало того, радиообмен ещё и продолжает развиваться.

Без применения таких технологий и подходов это было бы просто невозможно.

Следующее место применения данных технологий, которое мы рассмотрим, будут портреты.

Мы поставили себе амбициозную задачу по формированию игрового опыта, в котором игрок чувствует, что управляет большим количеством пилотов. Что игрок может почувствовать, каково быть тем, кто руководит людьми со своими характерами, уникальным жизненным опытом. Игрок должен видеть не просто некие цифры, имена и фамилии пилотов, он должен их знать в лицо.
В «Великих сражениях» для создания образов лётчиков из эскадрильи игрока применялся конструктор лица, работающий на принципах из игр 90-х. Когда портрет собирался из набора элементов, таких как овал лица, уши, нос, глаза, прическа и т. п. Некоторые варианты комбинаций получались неплохими, некоторые довольно «криповыми», а отладить все комбинации элементов в полной их суперпозиции не представлялось возможным.

Для поставленных задач в «Корее» нам не хватало ни этого качества, ни количества, которое даёт данный метод. И тогда мы решили изучить возможность применения генеративных технологий. Понять, что мы можем в них использовать, что нет, как сделать так, чтобы портреты не выглядели как нечто неживое, однообразное, бесхарактерное. Цель была не просто создать множество лиц, а сделать эти лица по определённым историческим данным, да ещё и чтобы игрок к ним как-то привязывался.

При генерации, помимо отсутствия каких-то характерных элементов в полученном результате, как и говорилось выше, присутствует множество простых ошибок, которые может поправить только хороший художник. Из самых банальных и простых проблем — это разные размеры и формы зрачков, кошачьи зрачки или вообще их отсутствие. Так и чуть менее очевидные, в виде некорректных пропорций и анатомии. Поэтому каждый полученный портрет наши художники превращали в нечто живое, со своими эмоциями и с отсутствием «детских» проблем.
В итоге весь процесс выглядел так, что мы вначале формировали некую основу, так называемые «кирпичики» нужных нам образов, загружали их в нейросеть и к полученному результату вручную добавляли жизнь, характерные черты и эмоции.

Для формирования ощущения полноценной ротации подразделений, их жизни, за разные страны конфликта, в «Корее» будет более 400 портретов.
И в каждый без исключения портрет мы вручную добавили жизнь и эмоции.

На отрисовку целиком каждого из этих 400 портретов понадобилось бы безумное количество времени. Причём это количество не предполагало бы никакой творческой работы. Это было бы постоянное воспроизведение однотипных деталей в огромных количествах.
Иными словами, технологии нам помогли просто реплицировать наш труд, позволив сосредоточиться на интересных задачах, связанных с эмоциями, уникальностью образов и реализацией творческого потенциала наших художников.

Технологии помогли создать те ощущения от управления подразделениями, которого мы бы не смогли добиться никакими другими разумными средствами.

На протяжении всей кампании вы будете видеть совершенно разных пилотов, каждый со своим образом и своей историей.

К кому-то вы будете привязываться сильнее, а к кому-то в меньшей степени.

Но самое важное, что они будут разные, каждый по-своему индивидуален.
Также с помощью внутриигровых скриншотов, созданных нами моделей и ИИ был создан набор «псевдо-исторических» фотографий, оформляющих сообщения о различных событиях в «Карьере командира». Тут генеративные технологии были просто незаменимы, т. к. подобрать соответствующие контексту событий реальные исторические фото Корейской войны не представлялось возможным, их просто нет в нужном нам количестве и качестве. А добавление таких «фотографий» в оформление мы считаем совершенно необходимым для создания соответствующего настроения и погружения игрока. Конечно, полученные изображения тоже потребовали довольно большой ручной художественной доработки. В итоге визуальное оформление графического интерфейса «Карьеры» получило ту глубину и насыщенность, которая была бы недоступна без применения такого подхода.

Нейронные сети плохо работают как что-то, что создаёт идеи, создаёт эмоции, но они незаменимы там, где нужно обработать огромный пласт информации. В тех областях, где человеку просто неестественно быть. В своё время вычислительные машины были чем-то недостойным, но без них никто не летает в космос. 3D считалось чем-то безжизненным, но без 3D мы бы не смогли насладиться теми виртуальными мирами, которые отражают души многих художников. Так и нейросети.
Всё перечисленное — это всего лишь инструменты, которые дают новые возможности, важно только грамотно ими пользоваться.

Мы обязательно продолжим раскрывать для вас самые разные детали и особенности разработки «Кореи. Серии игр Ил-2».

Чтобы не пропустить новости о предпринимаемых нами усилиях по развитию жанра, подписывайтесь на наши каналы и социальные медиа ВК, Телеграм и Телеграм чат, следите за новостями.

На связи!