Passar para o conteúdo principal

Reação à PS5 Pro: Melhorias na GPU e RT, PSSR e a nova parceria da Sony com a AMD Amethyst

O que isto significa para o futuro hardware da PlayStation.

Crédito da imagem: Digital Foundry

Quando a Sony revelou a PlayStation 5 Pro, fê-lo de uma forma muito diferente da revelação da PlayStation 4 Pro e da PlayStation 5. Embora Mark Cerny, arquiteto principal do sistema, tenha sido o “mestre de cerimónias” da revelação da Pro, a estreia teve uma duração curta de nove minutos - e uma boa parte desse tempo celebrou os feitos da consola PlayStation 5 normal. Foi uma apresentação muito distante da apresentação detalhada feita para a revelação da primeira consola “Pro” da Sony e algo desprovida de detalhes em comparação com a agora lendária apresentação “Road to PS5” feita por Cerny em março de 2020. Ficámos com fome de mais detalhes - e agora, finalmente, eles chegaram.

Uns bons três meses após a revelação, a Sony fez uma nova apresentação aprofundada sobre o design do hardware e, na verdade, sobre a visão subjacente à PlayStation 5 Pro - e são coisas importantes. A filosofia subjacente à consola marca uma mudança radical na forma como as consolas serão fabricadas. Embora a tecnologia central de renderização gráfica da PlayStation 5 Pro tenha sido melhorada em relação à máquina normal, Cerny vê um futuro em que a aprendizagem automática desempenha um papel fundamental na conceção da consola e, embora a rasterização esteja a aproximar-se dos seus limites, prevê um grande aumento das capacidades de ray tracing no futuro.

É uma visão que partilha pontos comuns com a estratégia da Nvidia nos últimos seis anos, mas a impressão com que ficamos é que a AMD continuará a ser o parceiro de eleição da Sony para concretizar esta nova visão. Para esse efeito, foi anunciada uma nova colaboração “Ametista” entre a Sony e a AMD.

Oliver Mackenzie, da Digital Foundry, teve a oportunidade de ver a nova apresentação de Cerny há várias semanas e de entrevistar o próprio Mark Cerny, juntamente com Mike Fitzgerald - diretor de tecnologia de base da Insomniac. No entanto, a apresentação em si é algo que todos os membros da equipa da Digital Foundry estavam ansiosos por discutir, por isso aqui está a nossa reação à palestra - e, claro, uma visão geral de tudo o que aprendemos.

Aqui está o resumo completo sobre a PS5 Pro, com a participação de Oliver Mackenzie, Rich Leadbetter e Alex Battaglia. Ver no Youtube

Visão geral da GPU: RDNA 2.x, 16.7TF

A evolução mais óbvia da PS5 de base para a PS5 Pro verifica-se em termos da sua capacidade de processamento gráfico. Em vez de aumentar o desempenho da CPU, melhorar as velocidades de armazenamento ou visar ecrãs de maior resolução, como seria de esperar de uma nova consola, o foco principal da PS5 Pro é reforçar o desempenho e a qualidade de imagem com uma GPU mais capaz. Curiosamente, a GPU da PS5 Pro continua a basear-se na arquitetura RDNA 2 (série RX 6000) da AMD, mas com algumas funcionalidades transferidas da RDNA 3 (série RX 7000) - e também da RDNA 4 (série RX 8000, prevista para 2025).

A uma velocidade de relógio típica de 2,17 GHz, a PS5 Pro é capaz de um desempenho de 16,7TF - metade dos 33,5TF erradamente citados antes do lançamento. Este valor é mais diretamente comparável ao número de cerca de 10TF associado à PS5 de base, em comparação com as contagens inflacionadas (ou “flop-flated”, como diz Mark Cerny) do RDNA 3 teraflop. Outras especificações estão de acordo com as primeiras fugas de informação sobre a PS5 Pro, incluindo 30 WGPs, 60 unidades de computação e um aumento máximo de 2,35 GHz - embora não seja provável que esta frequência seja vista em condições normais de funcionamento, talvez devido a restrições de energia. A velocidade de relógio máxima da PS5 standard é de 2,23 GHz, mas a apresentação sugere que a velocidade de funcionamento típica é a mesma de 2,17 GHz da PS5 Pro, pelo que os TFLOPs típicos são cerca de 10TF, raramente atingindo os 10,23TF referidos nas especificações originais. No entanto, como esta geração já provou, os TFLOPs estão a revelar-se uma métrica cada vez menos significativa - uma situação reconhecida por Mark Cerny na nova apresentação.

Quanto ao motivo pelo qual a PlayStation 5 Pro não está a adotar totalmente as arquiteturas gráficas posteriores da AMD, a razão é muito simples: o código de shader para a GPU da PS5 não funcionaria no hardware posterior da AMD e não há forma de recompilar esses shaders nos jogos existentes. Compilação de shaders em tempo real? Não é viável para a PS5 e - acredite em nós - também não o quereria. Por isso, a PS5 Pro tem de utilizar a mesma base RDNA 2.x, com extensões adicionadas para novas funcionalidades - como o ray tracing melhorado.

Em termos de outras funcionalidades, sabemos também, através de divulgações separadas a produtoras, que a PS5 Pro tem o conjunto completo de funcionalidades RDNA 2, incluindo shaders de malha e VRS de hardware, e tem mais 2 GB de memória DDR5 (mais lenta) a bordo. Deste valor, há mais de um gigabyte de memória extra disponível para as produtoras. A memória GDDR6 utilizada aqui é também cerca de 28% mais rápida do que na PS5 de base - 576GB/s contra 448GB/s - apesar de estar ligada a um barramento de 256 bits semelhante.

Melhorias no ray tracing

Parte do atrativo da PS5 Pro é a sua melhoria significativa em termos de desempenho de RT, permitindo que as produtoras utilizem estas funcionalidades de forma mais desbloqueada em títulos melhorados na PS5 Pro sem sacrificar a qualidade de imagem ou as taxas de fotogramas na mesma medida que na PS5 de base. Isto é conseguido através da arquitetura RDNA 2.x da PS5 de base, com novas extensões adicionadas a partir de tecnologia RDNA posterior.

A PS5 reutiliza as unidades de mapeamento de texturas para efetuar testes de intersecção de caixas e triângulos para ray tracing, com a PS5 Pro a acelerar esta parte do processo em duas ou três vezes. A PS5 Pro também suporta BVH8 em vez de BVH4, o que também oferece um aumento de velocidade. A PS5 Pro também adiciona gestão de pilha em hardware, o que mais uma vez ajuda a fase de travessia no ray tracing e anteriormente só era visto em hardware Intel e Nvidia, não AMD.

Finalmente, a RT mais divergente regista um maior aumento de desempenho do que a RT mais coerente na PS5 Pro. Este espetro divergente/coerente descreve essencialmente a complexidade dos cálculos de RT, com sombras e reflexos em superfícies planas a serem mais coerentes e reflexos em superfícies curvas ou irregulares a serem mais divergentes. Mais uma vez, a Nvidia e a Intel criaram boas formas de lidar com a RT mais divergente, como as unidades de classificação de hardware e a reordenação da execução de sombreadores, e embora não vejamos aqui réplicas exatas dessas ideias, as atualizações transversais e a mudança para o BVH8 devem significar que a PS5 Pro está muito mais bem equipada do que a sua antecessora para lidar com estes cálculos de RT mais dispendiosos do ponto de vista computacional. Isto abre a porta a que as produtoras utilizem mais facilmente uma gama mais alargada de rugosidade de materiais para reflexos, por exemplo, em vez de se limitarem a reflexos tipo espelho ou quase espelho.

Mark Cerny postula que há um limite para o alcance da rasterização. Uma forma de ultrapassar essas limitações é através da RT, que tem um grande potencial de expansão com mais investigação. As melhorias introduzidas pela Sony sugerem que o RDNA 4 está a avançar nessa direção, o que é empolgante.

É claro que ainda não sabemos ao certo como será o desempenho da RT do RDNA 4 - parece um avanço significativo, mas ainda não há equivalente ao núcleo RT apresentado na arquitetura RTX da série 20 da Nvidia em diante, que permite mais cargas de trabalho simultâneas. A AMD discutiu em apresentações a forma como está a utilizar maiores quantidades de cache nas suas GPUs para PC para caber mais no BVH, por isso será fascinante ver o desempenho dos chips RDNA 4 para desktop com essa melhoria adicional.

O ray tracing melhorado é uma caraterística chave da PS5 Pro - e a Polyphony Digital põe a tecnologia à prova na versão melhorada para a Pro de Gran Turismo 7.Ver no Youtube

Machine learning e o PSSR

Para além de o RDNA 2.x de base da PS5 Pro ter sido atualizado com o que a Sony chama de “RDNA do futuro” para ray tracing, também vem com “RDNA personalizado” para aprendizagem automática, especificamente upscaling PSSR. Em vez de utilizar um upscaler existente, Mark Cerny disse-nos que a Sony se concentrou na velocidade e em minimizar a quantidade de tempo por fotograma que o seu upscaler exigia. Para o efeito, podiam escolher entre hardware NPU e GPU e acabaram por optar pela GPU.

A implementação atual é bastante interessante, uma vez que a Sony descobriu que mesmo o processamento de uma única camada de uma imagem 4K de 16 canais a 128 MB era limitado pela largura de banda da memória, utilizando apenas três por cento dos cerca de 300 TOPS disponíveis. A solução ingénua consistia em passar uma parte mais pequena da imagem através do chip de uma só vez, mas acabamos por ter problemas em que as extremidades não têm as informações necessárias sobre os azulejos circundantes, pelo que esses dados têm de ser eliminados.

No final, a Sony optou por combinar os seus registos vetoriais nos WGPs, dando-lhes um total de 15MB de memória e 200TB/s de largura de banda de memória. É uma abordagem semelhante à forma como a AMD lidou com a RT, em que se continua a utilizar hardware generalizado para atingir um objetivo específico. É provável que a reorientação seja eficiente em termos de área em termos da pegada global de silício, não requer alterações maciças ao RDNA e parece ter permitido à Sony atingir os seus objetivos de velocidade para o PSSR.

No entanto, o PSSR ainda não é uma rede neural convolucional (CNN) “totalmente fundida”, algo que a Intel conseguiu nomeadamente com a sua primeira versão do XeSS. O facto de ser totalmente fundida confere uma vantagem em termos de velocidade, uma vez que não se toca na memória do sistema a meio do aumento de escala de um único fotograma. Com base nos nossos cálculos aproximados, o DLSS demora menos de 1 ms e o PSSR cerca de 2 ms, o que significa que há potencial para os jogos correrem mais depressa se isto for conseguido no futuro. Poderá também abrir a porta à utilização do upscaling a taxas de fotogramas mais elevadas (por exemplo, 120 fps), em que um tempo de execução de cerca de 2 ms de upscale é uma percentagem significativa dos 8,3 ms disponíveis para a renderização de um fotograma inteiro. Existe a possibilidade de a AMD adotar uma abordagem semelhante com a RDNA 4, fazendo modificações nas CUs principais para tornar possível a execução de redes neurais convergentes localmente na GPU.

O upscaler PSSR da Sony é de primeira geração e a qualidade das implementações pode variar significativamente - mas no seu melhor, como aqui em Stellar Blade, a melhoria da qualidade de imagem é fenomenal.Ver no Youtube

O futuro: Amethyst, exploração de ML e próxima geração

A Sony também anunciou uma colaboração com a AMD chamada Amethyst - ela própria um nome de código de GPU da AMD reaproveitado de 2014, com a sua cor púrpura proveniente da combinação da Sony (a equipa Azul) e da AMD (a equipa Vermelha). A ideia é criar arquiteturas de hardware que funcionem bem para CNNs leves e úteis para gráficos de jogos em tempo real, bem como CNNs de alta qualidade para gráficos de jogos. Haverá também colaboração nas arquiteturas de rede dessas CNNs. Ambas as partes poderão aceder a todas estas arquiteturas para os seus produtos.

Parece que a AMD está a liderar o caminho nos principais designs de GPU, mas a Sony e a AMD têm esta colaboração de aprendizagem automática que deverá fazer avançar as coisas para ambas as empresas em termos de aprendizagem automática e ray tracing. A Sony beneficia da iteração do PSSR numa escala maior e a AMD minimiza o fosso entre si e a Nvidia em termos de R&D. Não é claro se haverá alguma polinização cruzada entre o PSSR e o FSR nas GPUs RDNA 4, e será interessante ver onde se enquadram os esforços de aumento de escala da Microsoft, dado que também se centram no PC, mas competem com a PlayStation com a Xbox.

Não se trata apenas de aumento de escala, mas também de computação gráfica em geral. Há muito potencial de aprendizagem automática com que Mark Cerny pareceu bastante entusiasmado na nossa conversa, incluindo a eliminação de ruído, a melhoria da qualidade das texturas e do fluxo de texturas, talvez até a qualidade geométrica, tudo isto dentro da largura de banda e do espaço de memória limitados disponíveis nas consolas. É este o tipo de coisas que a Sony deveria estar a avaliar para a PS6 e uma iniciativa como a Amethyst garante que é possível alcançar algumas destas coisas nesse período de tempo. Da mesma forma, o anúncio de uma parceria desta natureza sugere que a Sony vai manter a AMD para a sua consola de próxima geração, uma vez que as suas principais vantagens não estarão disponíveis nos próximos anos.

Para além da PlayStation 6, existem muitas possibilidades interessantes para a PS5 Pro, à medida que as produtoras se familiarizam com as capacidades das novas consolas. Há certamente potencial para implementações de RT mais avançadas, bem como para iterações melhoradas de PSSR que obtenham resultados uniformemente bons. Há também a possibilidade de mais melhorias na execução de jogos em back-compat, se a Sony quiser utilizar o ML para melhorar a biblioteca de jogos existente.

No geral, tem sido fascinante aprender mais sobre a PS5 Pro, e encorajamo-lo a ler a nossa entrevista com Mark Cerny e Mike Fitzgerald para mais detalhes sobre a PS5 Pro, a sua produção e potencial para melhorias futuras.

Lê também