Teoria: podem os jogos multi na Xbox One competir com os da PlayStation 4?
O Digital Foundry sobre a realidade dos teraflops vs. experiência de jogo.
As comparações de especificações Xbox One vs. PlayStation 4 são fortes no mínimo. Deixando de lado outras diferenças no sistema, a tecnologia de renderização da Sony tem mais 50% de poder computacional em bruto que a equivalente Xbox One - ambos os sistemas utilizam a arquitetura GCN (Graphics Core Next) da AMD. A questão é, qual o impacto concreto nas condições de jogo?
Nos bastidores, os programadores sugeriram que não devemos tirar conclusões sobre a extensão da superioridade PS4, e que o aumento de 50% no poder da GPU não irá resultar enfaticamente num aumento na performance in-game. É um tópico do qual falamos brevemente com Mark Cerny, o arquiteto chave da PS4, quando nos encontramos com ele há um par de semanas:
"A questão é que intencionalmente o hardware não é 100 por cento circular. Tem um pouco mais de ALU nele do que teria se estivesses a pensar estritamente em gráficos. Como resultado disso tens uma oportunidade, quase como um incentivo, para usar essa ALU para GPGPU."
Uma interpretação dos comentários de Cerny - que nos foi apresentada por entendidos dentro da Microsoft - é que baseado na forma como a tecnologia gráfica AMD está a ser utilizada atualmente em jogos, surge uma lei de retornos diminutivos.
Decidimos testar os problemas principais ao utilizar equipamento PC equivalente baseado na mesma arquitetura das consolas de próxima geração. Por um lado, tem as suas desvantagens - o ambiente de caixa fechada das consolas promete significantes melhorias sobre o PC, apesar de ambas as máquinas usarem cada uma as suas próprias APIs gráficas introduzir outro diferencial na performance. Pelo outro, sabemos que os jogos de lançamento de nova geração são desenvolvidos inicialmente no PC, com conversões atualmente em progresso para as novas consolas. E, a semelhança pelo menos na API significa que a tecnologia gráfica para ambas as plataformas de teste está a ser testada numa base lado a lado - e acima de tudo, isto é equipamento experimental.
"Deixando de lado outras diferenças no sistema, a tecnologia de renderização da Sony tem mais 50% poder computacional em bruto que a equivalente Xbox One. A questão é, qual o impacto em condições de gameplay?"
Existe outra razão convincente para este teste: quando chegou a hora de desenhar as novas consolas, a maioria dos dados de performance disponíveis para a Microsoft, Sony e AMD teriam derivado de como o equipamento GCN é utilizado em motores de jogo a correr no PC. A forma da arquitetura GCN e dos seus predecessores teria sido altamente influenciada pela sua performance a correr em jogos atuais. Suspeitamos que os resultados seriam decisões com influência noutros pontos do design das consolas - por exemplo, o ênfase da Sony na computação GPU.
Para começar, vamos olhar para as escolhas que fizemos para as nossas plataformas alvo. Vamos ser claros - o nosso objetivo não é criar réplicas PC completas das consolas - simplesmente não é possível. O nosso foco é a diferencial na performance gráfica. Para alcançar isto, queríamos assegurar (tanto quanto possível) que a renderização não estaria limitada pela CPU ou memória, portanto usamos o nosso existente PC de teste, com um Core i7 3770K overclocked para 4.3GHz e 16GB de memória DDR3 a correr a 1600MHz.
Escolher o equipamento gráfico adequado seria um pouco mais desafiante. A GPU Microsoft parece espantosamente similar ao design Bonaire da AMD, como vimos na Radeon HD 7790, enquanto o produto Sony é surpreendentemente igual ao produto Pitcairn, o equivalente mais próximo do chip gráfico PS4 é a Radeon HD 7870 desktop, ou ainda mais aproximada, a Radeon HD 7970M para portáteis. Em todos os casos, os produtos de consola correm com uma velocidade de relógio menor, e também tem menos duas unidades computacionais - suspeitamos que estas unidades estão mesmo presentes nos processadores das consolas mas desativadas para aumentar o número de chips que as fabricante das consolas podem usar na linha de produção - uma abdicação. Se um chip foi fabricado com um defeito na área gráfica, a fornalha pode simplesmente desativar as unidades computacionais afetadas e ainda usar o processador. Para assegurar paridade entre todas as consolas, duas unidades devem ser desativadas em todos os chips - similar à forma como um dos SPUs do Cell da PS3 está inativo.
"Os chips gráficos da One e PS4 tem muito em comum com dois existentes designs PC da AMD - nomes de código Bonaire e Pitcairn."
Desativar unidades computacionais seria útil para as versões de produção da Microsoft e Sony, mas não para o nosso equipamento alvo que não tem equivalentes diretos no espaço PC como consequência. Portanto, escolhemos a Radeon HD 7850 como a nossa "Xbox One alvo" (16 unidades computacionais vs. 12 na XO) e a Radeon HD 7870 XT como a nossa PS4 substituta (24 unidades computacionais vs. 18 na consola Sony). Desta forma mantemos o relativo diferencial de performance entre as duas consolas - tal como a PS4, a nossa versão alvo tem mais 50% poder GPU em bruto. No entanto é claro que o nosso kit é na mesma mais poderoso que as consolas, portanto para igualizar isso, descemos a velocidade do relógio nas duas para 600MHz. Agora, alguns jogos conseguem melhor performance com maiores velocidades de memória, enquanto outros beneficiam com mais núcleos, mas pelo menos com este compromisso temos os níveis certos de poder computacional, sem mencionar o rácio correto de largura de banda por flop para providenciar paridade com a PS4.
A escolha da velocidade da memória é a próxima grande questão. Igualizamos a velocidade de RAM a 1375MHz nas duas plataformas, para igualar a PS4 (isto envolve um downclock à 7870 XT, upclock na 7850). Potencialmente dá à nossa XO substituta uma vantagem que a consola em si pode não ter devido à sua memória DDR3 mais lenta e rápida cache ESRAM. Pelo outro lado significa que podemos abordar o equipamento gráfico em si em terreno igual - e a largura de banda é algo que vamos aprofundar mais tarde.
Testes ao equipamento alvo
Então a questão é, como cria a AMD o perfil do seu próprio equipamento e ajusta os seus designs de acordo? Claramente parte do processo envolve usar existentes motores de jogo, portanto é essa a abordagem que tomamos, começando com os nossos habituais testes. Para ficarmos o mais perto possível de cargas de trabalho de próxima geração, fomos mais seletivos nas nossas escolhas de definições. Claro que a resolução alvo é 1080p para as consolas de próxima geração, portanto é o foco singular nos nossos testes. Multi-sampling anti-aliasing (MSAA) fica de fora pois o seu uso em títulos de próxima geração até agora está perto de não existente.
"Os resultados praticamente confirmam a teoria que mais núcleos computacionais não resultam num crescimento linear da performance. A nossa PS4 alvo obviamente tem uma vantagem - 24% em média."
HD 7850 (600MHz), Xbox One Alvo | HD 7870 XT (600MHz), PS4 Alvo | Diferencial de performance em motor de jogo | |
---|---|---|---|
BioShock Infinite, DX11 Ultra DDOF | 31.8fps | 38.2fps | 20.4% |
BioShock Infinite, DX11 | 40.5fps | 49.5fps | 22.7% |
Tomb Raider, Ultimate (TressFX) | 22.4fps | 29.8fps | 33% |
Tomb Raider, Ultra | 39.5fps | 50.3fps | 27.3% |
Tomb Raider, High | 56.8fps | 69.6fps | 22.5% |
Hitman Absolution, Ultra | 37.2fps | 45.2fps | 21.7% |
Hitman Absolution, High | 44.1fps | 52.6fps | 19.3% |
Sleeping Dogs, Extreme | 20.3fps | 26.2fps | 29% |
Sleeping Dogs, High | 40.2fps | 50.9fps | 26.6% |
Metro: Last Light, High | 25.5fps | 30.0fps | 17.6% |
Os resultados confirmam praticamente a teoria que mais núcleos computacionais na arquitetura GCN não resultam num crescimento linear na performance. É por isso que a AMD tem a tendência a aumentar o relógio principal e a velocidade da memória nas suas gráficas de topo, porque a constituição da arquitetura não o consegue por si só. Olhando para os resultados, Metro: Last Light é quem mostra menos diferença - os 50% extra em poder computacional produzem apenas 17.6% mais performance. Pelo outro lado, Tomb Raider oferece os ganhos mais perceptíveis - até 33% assim que a insana simulação de cabelo TressFX é ativada, mas tem um belo aumento na performance ao longo de um conjunto de adicionais definições de qualidade mesmo sem ela.
Jogo em destaque: Crysis 3
Então a próxima questão é até que ponto os programadores multi podem precisar comprometer as suas versões One para acompanharem a PS4. Existem vários caminhos aqui. Virtualmente todos os jogos multi de próxima geração terão versões PC, então os motores já foram construídos com uma capacidade de conversão em mente - ao ponto do denominador menos comum não se comparar à performance da One, quanto mais à da PS4. As equipas de tecnologia podem facilmente baixar as definições de qualidade para ganhar performance - seja na consola Microsoft ou num PC menos poderoso - ou podem manter a paridade entre a XO e a PS4 em termos de funcionalidades e simplesmente baixar a resolução. Decidimos testar isto usando o mais perto que temos de um jogo de próxima geração - vanguardista e tecnologicamente brilhante, usamos Crysis 3.
Neste vídeo comparamos performance dos nossos equipamentos "alvo" a correr a 1080p, depois baixamos o equivalente XO para 1776x1000 (uma descida de 17.2% na resolução). Após isso, baixamos novamente para 1600x900 - uma descida de 33.3%, e uma inferiorização linear em linha com o défice em poder GPU que a XO tem em comparação com a PS4. Portanto, em teoria, devemos ver o primeiro situar-se entre as duas plataformas alvo, e o segundo a colocar a nossa XO alvo em linha com a nossa PS4 substituta. No entanto, se olhares para o vídeo, não é isto que acontece.
"Crysis 3 é o mais perto que temos de um jogo de próxima geração e ambas as nossas plataformas alvo são capazes de o correr a 1080p nas definições mais altas, com texturas de qualidade very high presentes."
Baixar para 1600x900 na verdade faz com que a XO alvo se adiante significativamente à equivalente PS4 a correr a 1080p, enquanto a 1776x1000 fica apenas um pouco atrás - vejam mais em baixo na página o impacto que este downscale tem na qualidade de imagem. Também descobrimos que apesar de ter um aumento de 50% em poder computacional, a média de rácios de fotogramas na equivalente PS4 estão apenas XX% à frente da nossa "XO". Pode muito bem ser o caso que os recursos de sistema consumidos pelo avançado trabalho de shaders não se converta de forma linear de acordo com a resolução, significando que menos pixeis libertam mais recursos de sistema do que poderias pensar. Não temos a certeza, e este é claramente apenas um jogo - como os testes em cima demonstram, diferentes jogos em definições de qualidade diferentes dão resultados diferentes. Outro fator a ter em conta é o bloqueio a 30fps nos rácios de fotogramas na maioria dos jogos de consola - é um bom nivelador de performance e em termos gerais, tende a favorecer a plataforma mais fraca, que é apenas afetada nas cenas tecnologicamente mais exigentes.
Mas claro, as forças da PS4 não estão apenas limitadas ao seu excesso em poder de processamento gráfico - existe também uma vantagem na largura de banda. Tem uma entrada de memória 256-bit que permite um pico de passagem de 176GB/s da sua GDDR5. Em contraste, a memória DDR3 da XO está limitada a 68GB/s, aumentada pelos seus 32MB de embedded static RAM (ESRAM) inseridos no processador para uma largura de banda com um pico teórico de 192GB/s.
A questão da largura de banda
Mesmo se o poder de processamento adicional do chip gráfico PS4 não ser tão pronunciado quanto os números em bruto sugerem, a falta de largura de banda pode ser desastrosa para a performance - e essa é a grande preocupação na arquitetura Xbox One. Podem ver isto verificando o vídeo que se segue, onde comparamos a Radeon HD 7790 com a Radeon HD 7850. O que é interessante nesta comparação é que apesar da HD 7790 ter menos unidades computacionais que a HD 7850 (14 vs. 16), tem maior velocidade de relógio, ao ponto do potencial computacional em bruto das duas ser virtualmente idêntico, perto dos 1.8 teraflops - território PS4. A diferença está na largura de banda. A entrada de memória 256-bit da 7850 oferece uma massiva vantagem de 60% sobre a interface 128-bit da 7790.
Cobrimos três jogos aqui: Crysis 3, Skyrim e Battlefield 3. Os dois primeiros revelam tudo até um aumento de 20% na performance devido à adicional largura de banda disponível, mas BF3 do DICE reflete a paridade em poder computacional, oferecendo uma performance virtualmente idêntica. Transplantando essas descobertas para as consolas de próxima geração, os programadores para a consola Microsoft tem o seu trabalho delineado ao utilizar efetivamente a DDR3 e ESRAM para igualar a passagem da entrada de memória PS4. Ter uma boa performance da ESRAM é a chave para assegurar que a XO é competitiva com a PS4.
"Uma comparação da Radeon HD 7790 com a HD 7850 é fascinante. Aqui temos duas gráficas com o mesmo poder computacional, mas níveis muitos diferentes na largura de banda disponível - com resultados profundos nos rácios de fotogramas."
Conclusão: a vantagem PS4 e o desafio Xbox One
Resumindo, a PS4 desfruta de duas vantagens chave sobre a XO em termos da sua proeza de renderização: poder GPU em bruto e muita largura de banda. Perante isto, as especificações parecem uma conformidade, mas parece claro que uma dessas vantagens - o aumento de 50% em poder computacional - não resulta no aumento estratosférico de performance que poderiam imaginar. Claro que a PS4 é mais poderosa, mas as evidências sugerem que ajustes na qualidade e/ou mudanças na resolução podem ajudar a nivelar os rácios de fotogramas em ambas as plataformas a correr os mesmos jogos. A largura de banda continua a ser o principal problema - a entrada de 256-bit da PS4 é tecnologia estabelecida, e fácil de usar. A ESRAM da XO é um grande mistério, especificamente em termos do quão rápida realmente é e a velocidade à qual os programadores são capazes de tirar o máximo dela. Nos nossos testes demos à XO alvo o benefício da dúvida ao igualar os níveis da largura de banda, mas é claro que isto não está de forma alguma garantido.
Claro, a batalha da próxima geração está a moldar-se para ser um concurso fascinante. Estamos a olhar para duas consolas desenhadas dos mesmos blocos de construção mas com duas abordagens completamente diferentes. Segundo fontes dentro da Microsoft, o foco na XO foi extrair tanta performance quanto possível das ALUs do chip gráfico. Pode ser o caso que as 12 unidades computacionais foram escolhidas como o esquema mais equilibrado para igualar a arquitetura CPU Jaguar. A nossa fonte diz que a constituição da tecnologia personalizada de áudio e "motor de movimento de dados" da XO deriva da criação de perfil dos jogos Xbox 360 mais avançados, os seus designs foram implementados para corrigir os engarrafamentos mais comuns. Em contraste, apesar das suas indiscutíveis vantagens - especialmente em termos de poder computacional, a PS4 parece em comparação um pouco desequilibrada. E talvez seja por isso que a equipa Sony liderada por Mark Cerny esteja pronta para redesenhar e melhorar o canal computacional GPU - viram os recursos ALU não utilizados e compreenderam que havia uma oportunidade aqui para transformar isso numa oportunidade para os programadores fazerem algo diferente com o equipamento gráfico.
O próprio Cerny admite que a utilização da computação GPU provavelmente não surgirá até três a quatro anos depois da PS4 chegar. Uma fonte no desenvolvimento que trabalhara diretamente com o equipamento disse-nos que a "computação GPU é a nova SPU" referindo-se à dificuldade que os codificadores tiveram para aceder ao poder do processador Cell da PS3, mas também em termos do potencial do equipamento. Existe uma sensação que é território por explorar, que é um aspeto da tecnologia gráfica que dará ao sistema uma grande extensão em termos do extrair do seu potencial total. Mas isto não acontecerá da noite para o dia e quase certamente não no período de lançamento. Sendo esse o caso, por muito improvável que pareça tendo em conta o défice computacional no seu equipamento gráfico, em teoria os jogos XO multi tem uma boa oportunidade para ficarem perto dos seus equivalentes PS4, apenas com pequenos compromissos. Mais tarde no ciclo de vida surge a questão se a computação GPU da PS4 se tornará num fator significativo no desenvolvimento quando o esforço adicional não iria ostentar muito em termos de dividendos para a versão XO do jogo.
Para concluir, pelo menos em termos da tecnologia gráfica, existem poucas dúvidas que a PS4 é aquela capaz de melhor prestação entre as duas próximas consolas. No entanto, a curto prazo, caso a Microsoft consiga as prometidas melhorias na performance às suas librarias gráficas, e que a ESRAM seja fácil de usar, existem todas as razões para acreditar que o forte défice computacional possa não ser tão pronunciado em gameplay quanto as especificações sugerem no papel. A Gamescom deverá ser uma experiência fantástica, e uma oportunidade para avaliar o progresso após a E3 onde os jogos nas duas consolas se sentiram pouco otimizados.
Longe das comparações centrais, o que achamos bem reconfortante desta experiência é que o equipamento gráfico alvo que criamos provou estar razoavelmente apto para gerir alguns dos mais difíceis testes em jogos PC disponíveis, sem mencionar o providenciar de uma experiência Crysis 3 altamente jogável nas definições high com as texturas de melhor qualidade. Tendo em conta que as definições de topo desafiam tecnologia de topo como a GTX Titan, baixar um ponto na escala de qualidade e ainda ter rácios de fotogramas decentes a full HD não de menosprezar.
A obra-prima tecnológica da Crytek procura converter-se até às resoluções maiores através do seu avançado trabalho de efeitos e arte de resolução ultra high. No padrão 1080p das próximas consolas, esse nível de qualidade de texturas tem um aspeto simplesmente fenomenal e a experiência geral é transformada completamente sobre as edições comprometidas da atual geração. Presumindo que o poder CPU está lá, o equipamento gráfico de ambas as consolas deve ser capaz de sustentar um nível de performance 1080p30 neste jogo exigente com apenas flutuações menores, e isso antes de pesarmos os benefícios de APIs de plataforma fechada e otimização específica de consola. E como ponto de arranque para a próxima geração, isso não é nada mau.