Le projet Genie de Google crée des mondes virtuels explorables en temps réel, offrant un aperçu de l'avenir de la réalité virtuelle

DeepMind, le laboratoire de recherche en IA de Google, a annoncé Genie 3 en août dernier, présentant un système d’IA capable de générer des environnements virtuels interactifs en temps réel. Google a désormais publié un prototype expérimental que les abonnés Google AI peuvent essayer dès aujourd’hui. Certes, vous ne pouvez pas encore générer un monde VR à la volée, mais nous nous en rapprochons de manière alléchante.

Les Nouvelles

Project Genie est ce que Google l’appelle un « prototype de recherche expérimentale », ce n’est donc pas encore exactement la « machine de jeu IA » de vos rêves. Essentiellement, il permet aux utilisateurs de créer, explorer et modifier des environnements virtuels interactifs via une interface Web.

Le système ressemble beaucoup aux générateurs d’images et de vidéos précédents, qui nécessitent la saisie d’une invite de texte et/ou le téléchargement d’images de référence, bien que Project Genie va encore plus loin.

Au lieu d’un, Project Genie dispose de deux zones d’invite principales : une pour l’environnement et une pour le personnage. Une troisième boîte de dialogue vous permet également de modifier l’apparence initiale avant de générer complètement l’environnement (par exemple, agrandir l’épée, changer les arbres en fonction du temps de chute).

En tant que premier système de recherche, Project Genie présente des limites, indique Google dans un article de blog. Les environnements générés peuvent ne pas correspondre étroitement à la physique ou aux invites du monde réel, le contrôle des personnages peut être incohérent, les sessions sont limitées à 60 secondes et certaines fonctionnalités annoncées précédemment ne sont pas encore incluses.

Et pour l’instant, la seule chose que vous pouvez produire est une vidéo de l’expérience, bien que vous puissiez explorer et remixer d’autres « mondes » disponibles dans la galerie.

Project Genie est désormais déployé auprès des abonnés Google AI Ultra aux États-Unis, âgés de 18 ans et plus, avec une disponibilité plus large prévue dans le futur. Vous pouvez en savoir plus ici.

Mon avis

Il y a de nombreux obstacles à surmonter avant de pouvoir voir quelque chose comme Project Genie fonctionner sur un casque VR.

L’un des obstacles les plus importants à surmonter est sans aucun doute le streaming dans le cloud. Franchement, le cloud gaming existe sur les casques VR, mais ce n’est pas génial pour le moment car la latence est très variable en fonction de la proximité avec le centre de données de votre service. Cela, ainsi que les grands noms du cloud gaming d’aujourd’hui (c’est-à-dire NVIDIA GeForce Now, Xbox Cloud Gaming) sont généralement orientés vers les jeux à écran plat ; en matière de rendu et de latence d’entrée, la barre est bien plus basse que les casques VR, qui nécessitent généralement un maximum de 20 ms de latence mouvement-photon pour éviter l’inconfort de l’utilisateur.

Et cela ne tient pas non plus compte du fait que Project Genie devrait également rendre le monde d’une manière ou d’une autre en gardant à l’esprit la stéréoscopie, ce qui peut présenter ses propres problèmes puisque le système aurait techniquement besoin de deux points de vue distincts qui se résoudraient en une seule image 3D solide.

D’après ce que je comprends, les modèles du monde créés dans Project Genie sont probabilistes, c’est-à-dire que les objets peuvent se comporter légèrement différemment à chaque fois, ce qui explique en partie pourquoi Genie 3 ne peut prendre en charge qu’un maximum de quelques minutes d’interaction continue à la fois. La génération mondiale Genie 3 a tendance à s’éloigner des invites, ce qui donne probablement des résultats indésirables.

Ainsi, même s’il est peu probable que nous en voyions une version VR dans un avenir très proche, je suis impatient de voir les petits pas qui mèneront à ce que cela pourrait éventuellement mener. L’idée de pouvoir organiser avec désinvolture un monde à la volée dans le style Holodeck que je peux explorer – qu’il soit passé, présent ou toute fiction de mon choix – me semble tellement plus intéressante du point de vue de l’apprentissage. L’une de mes applications VR les plus utilisées à ce jour est Google Earth VR, et je ne peux qu’en imaginer une version plus détaillée et plus dynamique pour m’aider à apprendre des langues étrangères, à voyager dans le temps et à visiter virtuellement le monde.

Mais avant même d’en arriver là, il existe une réelle possibilité qu’Internet soit envahi par le « game slop », ce qui ressemble à un retournement d’actifs poussé à l’extrême. Cela exposera également probablement les développeurs de jeux aux mêmes difficultés auxquelles d’autres artistes numériques sont actuellement confrontés en matière d’échantillonnage par l’IA et de recréation d’œuvres protégées par le droit d’auteur, bien qu’à un tout autre niveau (GTA VI n’importe qui?).

Cela, et je ne peux pas m’empêcher de penser que l’avenir s’annonce comme une situation très étrange, mais j’espère aussi très intéressante. et pas tout à fait terrible lieu. Je peux imaginer un avenir dans lequel les environnements photoréalistes basés sur l’IA vont de pair avec les interfaces cerveau-ordinateur (BCI) – deux sujets que Valve étudie depuis des années – et qu’il propose. Le La réalité virtuelle que j’attends en fait.