Passar para o conteúdo principal

Análise Tecnológica: Kinect

Digital Foundry sobre a latência, sobrecarga do CPU e como funciona.

É o dia depois da noite anterior, e uma oportunidade para reflectir no nosso hands-on demonstrativo do novo Kinect para a Xbox 360, contactar as nossas fontes e tentar juntar algumas das semelhanças do quadro técnico por detrás do dispositivo anteriormente conhecido como Projecto Natal.

É difícil não gostar do que a Microsoft fez, apesar do facto de nenhum dos jogos oferecidos ter sido concebido para apelar ao grosso da audiência que se colou de forma leal à plataforma nestes últimos cinco anos. Para lá da criação de Avatar, jogos em estilo cartoon constituem uma peça central tecnológica que é simplesmente um objectivo espectacular: total captura de movimentos de vários jogadores, simultaneamente combinados com excelente reconhecimento de voz, tudo num pacote de entrega ao consumidor.

Portanto, quais são os principais componentes do Kinect para a Xbox 360 e como os vimos implementados nos títulos que jogámos segunda-feira à noite?

Kinect tem uma tradicional câmara RGB embutida, tal como as que existem nas webcams e telemóveis, e é capaz de emitir a uma resolução normal de 640x480, operando a 30 imagens por segundo. Juntamente com isto estão os sensores de profundidade. Estes cobrem a área numa lavagem de infra-vermelhos, colorindo a cena consoante a distância a que estão dos objectos. Esta é a chave para as capacidades únicas do Kinect. Não só isso permite aos jogos descobrir todos e tudo o que há num espaço em 3D, mas também significa que mesmo sem os dados RGB pode operar perfeitamente diante de qualquer luminosidade, mesmo num espaço preto.

O mapa de profundidade é a arma crucial do Kinect, e também pode ser integrada com a tradicional imagem RGB num processo conhecido como acção de registo, embora a integração dos dois planos juntamente incorra num carregamento adicional do CPU. Contudo, mesmo sem a acção de registo, nós podemos ver que os produtores estão a fazer uso dele nos títulos de lançamento, visualizando-o directamente no jogo.

Talvez o exemplo mais dramático disto seja no jogo da Ubisoft Your Shape: Fitness Evolved. Aqui a tua personagem no ecrã é efectivamente uma reprodução pós processada da profundidade do mapa, com a figura central (isto é, o jogador) cortada, com adicionais efeitos de partículas com informações adicionais para gerar um aspecto mais polido.

Também observámos o mapa de profundidade no jogo Dance Central da Harmonix. Ocasionalmente os dançarinos no ecrã desvanecem-se, para serem substituídos por outra reprodução altamente pós-processada pelo mapa de profundidade, completa com uma variedade de efeitos psicadélicos. Dance Central é na verdade um interessante caso em discussão, porque ao contrário de Your Shape, o mapa não é tão claramente: objectos de fundo e jogadores irão "verter" sobre a imagem.

Kinect Joy Ride (esquerda) não estava a jogar à bola com Johnny Minckley, o chefe da EGTV, conduzindo o jogador que manipula o jogo para iniciar a ferramenta de depuração, à direita. Aí fica uma ideia sobre quão profundo é o mapa de profundidade e como o esqueleto é criado e transposto para os Avatares situados no canto superior direito da imagem.

A questão é, questões manhosas à parte, funciona de verdade? Lá na luxuosa suite que a Microsoft reservou para o evento, as coisas já estavam concorridas quando lá chegámos. Enquanto que as áreas envolventes de cada ponto de jogo estavam cobertas, havia ainda imenso potencial de interferência proveniente das pessoas que se indagavam pelo campo de acção da câmara e do ângulo de visão e também pelas fotografias com flash potencialmente aborrecendo os raios infra-vermelhos das câmaras de profundidade.

Contudo, em todas, excepto numa ocasião, o Kinect funcionou maravilhosamente, num único local - a correr o jogo cartoon de corridas Joy Ride - demonstrou algum tipo de problema. Mas mesmo isto demonstrou ser uma bênção disfarçada. Procurando resolver o problema, o guardião do jogo veio novamente, e fez o loading da ferramenta de debug "NUI". Consegui tirar uma foto à ferramenta em acção - essencialmente mostra as pessoas a serem reconhecidas pela câmara de profundidade, e depois atribui a eles pontos de movimento do esqueleto.

Portanto, tendo-se determinado que o actual sistema funciona, foi tempo para revisitar os nossos pensamentos sobre a lag. Se lembram, a latência inerente dentro do novo esquema de controlo foi uma das nossas maiores reservas sobre o Kinect quando o vimos no ano passado na pré-produção disfarçado de Project Natal. Para dar uma pequena ideia da comparação, escolhemos correr o nosso teste patenteado "wavy-arm" no mesmo jogo, embora numa reprodução melhorada.

Uma nova análise à última demonstração Kinect Adventures revela que as alterações ao nível do desempenho em comparação com as demos técnicas do ano passado são mínimas.

Portanto, não mudou grande coisa em termos de nível de desempenho comparado com aquilo que havíamos jogado há um ano. Ainda precisam de pensar com antecedência e reagir com vantagem de modo a teres a certeza que acertas naquelas bolas, com lag em 200ms de distância (incluindo a latência do televisor, claro). É o tipo de mudança que provavelmente irás fazer de forma natural assim que tomarem as rédeas com a forma como o sistema funciona.