Passar para o conteúdo principal

Visionário do Kinect sobre a tecnologia

"Decidimos ter o nosso bolo e também comer."

Alex Kipman – director de incubação na Xbox, e mentor por detrás do projecto Natal – deu uma entrevista espantosa ao nosso site irmão GamesIndustry.biz, entrando em considerável profundidade em alguns dos mais cruciais e controversos elementos do sensor de movimentos. É a entrevista pela qual a Digital Foundry teria matado, mas felizmente fomos capaz de esgueirar algumas questões à equipa GI.biz que revelaram novas informações sobre como o Kinect funciona e as formas pelas quais os seus sistemas estão integrados na Xbox 360.

Um das maiores e mais controversas histórias em redor do sistema tem sido a remoção do processador de movimentos embutido. Ao invés de dados processados serem transferidos por USB, ao invés os streams crus da câmara, sensor de profundidade e microfone são emitidos para a Xbox 360, na qual o processador e placa gráfica trabalham em conjunto para descodificar e processar os dados. Kipman aclama que a consola tem o poder de sobra, dizendo que nenhum jogo Xbox 360 – nem mesmo o mais recente título de topo – usa todo o poder do processador e gráfica disponível.

"Por muito que gostássemos de falar sobre bits e percentagens, pegas num jogo como, sei lá, Call of Duty: Black Ops – existe uma quantidade significativa de processamento, seja no processador ou na gráfica, que ainda permanece na mesa," diz Kipman.

"Portanto depois disso, quando chegamos a esta revelação sobre jogos e futuros jogos a caminho da Xbox, olhamos para isso e dissemos – 'vale a pena a troca para colocar processamento embutido no aparelho quando pensamos que podemos criar experiências magicas, únicas e profundas sem ele?'

"Essa troca é fácil, resume-se à sustentabilidade do aparelho. Da perspectiva de trazer para o mercado este fantástico negócio, 149.99€ com o Kinect Adventures, mais sensor – compra um e põe toda a tua família a jogar, é uma proposta de valor muito interessante para o consumidor. Podemos criar jogos que são ricos e completos e profundos quanto os jogos que temos na nossa plataforma hoje e que vamos ter amanhã.

"Então a conversa torna-se simples: começas a mover-te num mundo que diz, porquê manter algo complicado quando podes torná-lo simples? Decidimos ter o nosso bolo e comer também."

Existe muito mérito no que Kipman diz aqui para além da conversa típica de Relações Pública. Teoricamente, não existe nada que impeça os estúdios de criarem títulos Kinect que pareçam e se sintam exactamente como um título premium para os jogadores dedicados, porque a sobrecarga sobre o sistema é mínima – uma baixa quantidade de tempo de processador espalhada ao longo de duas linhas de execução num único núcleo do processador Xenos mais uma ainda mais pequena quantidade de recurso da gráfica. Olhem para Kinect Adventures e vêem um título Unreal Engine 3 completo, e essa é exactamente o tipo de tecnologia que não lidaria bem ao lhe serem roubadas quantidades significativas de recursos do sistema.

O 'cérebro' do sistema foi removido das entranhas do Kinect, estando o processador e gráfica Xbox 360 encarregues das tarefas de processamento.

Kipman também confirma que a gráfica Xenos é usada para processar informação de profundidade e ajudar a construir os dados esqueleto dos quais muitos grandes títulos Kinect dependem.

"Um dos ingredientes chave da experiência é a aprendizagem da máquina. A aprendizagem da máquina no nosso mundo está a definir um mundo de probabilidades. A aprendizagem da máquina, particularmente do nosso tipo, que é probabilística, não é realmente sobre o que sabes, é sobre o que não sabes," explica ele.

"É sobre ser capaz de olhar para o mundo e não ver a dualidade, zeros e uns, mas ver infinitas camadas de cinzento. Ver o que é provável. Devias imaginar que, no pedaço da nossa máquina de aprendizagem do cérebro, que é apenas um dos componentes do cérebro, pixeis entram e o que tiras disso é uma distribuição probabilística de parecença.

"Por isso um pixel pode entrar e o que sai pode ser – hey, este pixel? 80 por cento de probabilidade de esse pixel pertencer a um pé. Sessenta por cento de probabilidade de pertencer a uma cabeça, 20 por cento de probabilidade de pertencer ao peito. Agora é aqui que cortamos o corpo humano em 48 articulações que expomos aos nossos designers de jogos. O que vês são níveis infinitos de probabilidades para cada pixel e se pertencem a uma parte diferente do corpo.

"Essa operação é, como podem imaginar, uma operação altamente possível de ser feita em paralelo. É o equivalente a dizer, pixel entra, resolve esta complicada equação matemática e imagina que tens um número positivo, uma resposta positiva, viras à direita, tens uma resposta negativa viras à esquerda. Imagina fazer isto numa floresta de probabilidades. Isto são coisas nas quais vais ter centenas de vezes uma melhoria na performance se o colocares na gráfica ao invés do processador.

Unidades de processamento gráfico são máquinas desenhadas para este tipo de operações. O núcleo do algoritmo da nossa máquina de aprendizagem, a coisa que realmente compreende o significado, e traduz um mundo de barulho ao mundo de probabilidades de partes humanas, corre na unidade de processamento gráfico."