jeudi 4 juin 2009

Avec Natal : You are NOT the controller


Cette année, c'est Microsoft qui fait du buzz au salon E3 (Electronic Entertainment Expo) à Los Angeles avec la présentation du projet Natal.
A mon avis, ce qu'il faut retenir, c'est que ce n'est qu'un projet.
Natal a déjà trouvé son slogan "you are the controller", pour faire simple, oublier la souris, la manette de jeu et même la wiimote, c'est vous qui contrôler le jeu.
Pour François Ruault, directeur de la division "Entertainment & Devices" chez Microsoft France (voir article du Monde), Natal "résout la quadrature du cercle en offrant à la fois la simplicité et l'immersion du joueur. Industriellement tout est prêt".
Comme je reste persuadé que le plus difficile en matière d'interaction homme-machine est d'atteindre la simplicité, je suis plus que sceptique sur le succès de ce projet au regard de ce "simple" critère.
Pour se faire une idée du projet Natal, vous pouvez regarder une vidéo officielle de Microsoft.
Elle est accompagnée de commentaires qui précisent les caractéristiques d'un jeu Natal. En voici quelques uns :
- vous êtes le contrôleur (you are the controller)
- capture de mouvement intégral (full body motion capture)
- reconnaissance de la parole (voice recognition)
- reconnaissance de visage (facial recognition).
et j'en passe.
Sans oublier que ces jeux devront tourner sur la Xbox 360 !
Je connais la force de frappe de Microsoft en recherche (ce n'est pas une boutade), mais aussi le succès de ses produits comme Xbox 360, Zune, Zune HD ou Windows Mobile (là, c'est ironique).
Je n'imagine pas voir en 2010, ni même en 2011, un jeu avec toutes ces caractéristiques offrant simplicité, jouabilité, immersion... et fiabilité.
La vidéo est séduisante (sauf le son qui est insupportable), mais pour moi ce n'est qu'un joli conte de fées.
A voir le peu de réactions à l'annonce de Microsoft, j'en arrive à me demander si aujourd'hui les videogamers croient aux contes de fées !
Dans un contexte multijoueur, je ne pense pas qu'on verra à court terme la disparition de tout périphérique d'entrée et que la console sera capable de reconnaître les gestes de toutes les parties du corps (l'enfoncement d'un boomper, le pied qui pousse le skate, les bras qui tournent le volant...), l'expression du visage, la réponse orale à un quizz...
Allez, rendez-vous en 2011, on verra si vous pouvez tous vous agiter devant votre écran, dancer, skater, parler ou rire pour jouer avec votre Xbox.
Microsoft annonce aussi l'intégration de Facebook et Twitter à leur plate-forme de jeux. J'attends de savoir comment on enverra un tweet en faisant des grands gestes ou en hochant la tête, sans contrôleur ni clavier.
La vidéo se termine sur un slogan impérissable "la seule expérience dont tu as besoin est l'expérience de la vie" (the only experience you need is life experience).
L'expérience de la vie, c'est aussi de savoir utiliser des outils ou des dispositifs comme une manette de jeu ou une wiimote. Vouloir s'en passer n'est pas forcément la meilleure idée surtout si c'est pour n'autoriser aux joueurs que quelques gestes simples, quelques mots ou quelques expressions faciales qui n'auront rien de très naturel.
En un mot, le joueur risque avec Natal de ne contrôler pas grand chose.
Pour conclure, en un slogan "you are NOT the controller".

4 commentaires:

David a dit…

Bon, je crois que nous allons rectifier bien des choses aujourd'hui. La reconnaissance vocale a fait des progrès monstre. Prenons exemple sur Windows 7 que j'ai eu la chance de tester depuis la beta. La reconnaissance vocale fonctionne très bien et est même paramétrable.

Ensuite, pour la reconnaissance faciale, c'est vieux comme le monde et ce n'est pas quelque chose de très compliqué. Tu prends un image dans ton compte et chaque fois que le système reconnait les traits de la personne, elle accède directement à son compte. J'ai testé le système d'un collègue où je travaille et il l'avait fait en php ou java.

Troisièmement, le système utilisé pour reconnaitre les mouvements en 3d est un principe qui existe aussi depuis longtemps dans l'informatique depuis une caméra. Mais aujourd'hui, avec l'évolution de ces caméras ainsi que le système de profondeur utilisé par Microsoft prouve que cet appareil peut très bien fonctionné. En plus, il possède son propre processeur et mémoire, ce qui apporte une fluidité au système car le xbox n'aura pas à traiter les données mais plutôt les lire.

Enfin, pour finir, les programmeurs de jeux devront programmer avec l'API du Natal pour que celui-ci puisse retourner les données au jeu. On s'entend pour dire que le vidéo est à titre indicatif. C'est un montage tout simplement publicitaire mais je reste confiant que ceci peut bien fonctionné. Reste à être charmé par cet appareil dès sa sortie.

David a dit…

Va voir ça plutôt qu'être septique en passant.

http://www.gameblog.fr/news_9657_e3-09-gameblog-tv-project-natal-nos-impressions

efpi a dit…

@David, merci pour avoir signalé cette vidéo qui confirme ce que j'appelais la "force de frappe" de Microsoft en recherche.
Il faut dire que pour contrer Nintendo et sa wii, il fallait frapper fort.
Mon billet était une réaction à la vidéo de promotion du projet Natal qui comme tu le dis n'est qu'une belle publicité.
Peut-être que la reconnaissance de parole, de gestes, d'expression fonctionnent tant bien que mal, mais je ne pense pas que ça marche dans les conditions de la vidéo (en particulier pour la parole en multijoueur).
Le plus intéressant dans les commentaires des journalistes, c'est d'apprendre que la reconnaissance de gestes ne repose pas seulement sur la vision. Je reste persuadé qu'une simple caméra ne peux pas reconnaître les mouvements libre de tout le corps des joueurs.

David a dit…

http://www.xbox.com/fr-FR/news-features/news/Project-Natal-in-detail-050609.htm

Va voir ce lien. Il explique qu'il a 2 caméras RVB haute definition, d'une caméra de profondeur conçu depuis un projecteur infrarouge (principe des caméras de sécurité pour détecter les mouvements) et un capteur cmos (pièce utilisé dans les caméras numériques de haute qualité qui peut aller jusquà 21megapixels). Le micro est un multicouche qui permet de filtrer les bruits derrière la personne qui parle.

Cette technologie est vieille et ne couche pas très cher pour l'appareil mais ce qui fait toute la différence, c'est le logiciel qui tourne en continu et qui s'occupe des données que l'appareil lui envoit.

Bref, il utilise une technologie standard mais efficace avec un développement du logiciel hyper sophistiqué qui permet de fournir un produit révolutionnaire.