TECH ACTUS – Ubisoft a réussi à faire apprendre à une voiture à se conduire avec l’aide de l’intelligence artificielle.
Ubisoft La Forge, l’équipe / studio expérimental de prototypage de l’entreprise, a proposé un algorithme qui peut gérer des actions de jeu vidéo discrètes et continues de manière «raisonnée» et prévisible, et ils l’ont testé dans un «jeu commercial» (qui pourrait être The Crew ou The Crew 2) avec des résultats compétitifs.
„Les applications d’apprentissage par renforcement [l’une des façons de l’apprentissage automatique – ndlr] dans les jeux vidéo ont récemment vu des avancées massives venir de la communauté de la recherche, avec des agents formés pour jouer aux jeux Atari à partir de pixels ou pour être compétitifs avec les meilleurs joueurs du monde dans des jeux d’information complexes imparfaits. Ces systèmes ont comparativement été peu utilisés dans l’industrie du jeu vidéo, et nous pensons que le manque d’accessibilité est une raison majeure derrière cela. En effet, des résultats vraiment impressionnants… sont produits par de grands groupes de recherche avec des ressources informatiques bien au-delà de ce qui est généralement disponible dans les studios de jeux vidéo », ont écrit les co-auteurs.
Les chercheurs (nous pouvons les appeler comme tels …) ont noté que la collecte d’échantillons de données était lente et qu’il y avait des contraintes de budget temps sur les performances d’exécution des agents. Leur solution est basée sur l’architecture SAC (Soft Actor-Critic), qui a été proposée par l’Université de Californie, les chercheurs de Berkeley au début de l’année dernière. Il est plus efficace en termes d’échantillons que les algorithmes d’apprentissage par renforcement traditionnels, et il apprend à se généraliser à des conditions qu’il n’a pas encore vues. Il a ensuite été étendu à un paramètre hybride (Hybrid SAC) avec des actions continues et discrètes (par exemple, lorsqu’un joueur a la liberté d’effectuer des actions telles que se déplacer et sauter, chacune étant associée à des paramètres tels que les coordonnées et la direction de la cible). Ils ont évalué l’algorithme dans trois environnements conçus pour comparer les systèmes d’apprentissage par renforcement, tels qu’un simple jeu de type plateforme et deux jeux basés sur le football. Ils ont constaté que les performances étaient légèrement en retrait par rapport aux techniques de pointe, elles étaient dues à une bizarrerie architecturale, mais dans un test distinct, elles l’ont utilisé pour entraîner un véhicule dans un jeu vidéo avec deux actions continues (accélération et direction) et une action binaire discrète (frein à main) avec pour objectif de suivre une trajectoire donnée le plus rapidement possible dans des environnements que l’agent n’a pas rencontrés lors de l’entraînement.
«Nous avons montré que Hybrid SAC peut être appliqué avec succès pour entraîner une voiture à une tâche de conduite à grande vitesse dans un jeu vidéo commercial. [Cela démontre] l’utilité pratique d’un tel algorithme pour l’industrie du jeu vidéo », ont écrit les chercheurs. Ils ont également noté que cette approche pourrait être utilisée pour que l’agent puisse avoir les mêmes entrées qu’un joueur (dont le contrôleur pourrait être équipé d’un stick analogique qui fournit des valeurs continues et des boutons qui peuvent être enfoncés pour produire des actions discrètes par le biais de combinaisons).
Source: VentureBeat
Bonjour, supportez s’il vous plaît notre page theGeek.site sur Patreon, afin que nous puissions continuer à vous écrire les dernières nouvelles et critiques de jeux, de films et de technologies en tant que magazine indépendant.
Become a Patron!