J'ai créé une solution beaucoup trop complexe pour mon backlog Steam. Aucun regret. :: doismiu

Enfant, j’ai grandi en lisant des magazines de jeux vidéo, principalement les légendaires publications espagnoles Hobby Consolas et Playmania. C’était une tradition de m’arrêter au kiosque à journaux sur le chemin de l’école pour demander au vendeur s’il avait déjà reçu le dernier Hobby Consolas ou Playmania, ainsi que le magazine officiel de la NBA. Je passais des heures à lire les reportages et les rubriques d’actualités. Cependant, la section que je préférais de loin était l’analyse de jeux. Un article expliquant le gameplay et évaluant un titre selon des critères préétablis, aboutissant à une note finale, suffisait à me décider si un jeu valait la peine d’être joué. C’était en réalité plus important pour moi que de jouer aux jeux eux-mêmes, car les nouvelles sorties m’étaient largement inaccessibles (sauf à des dates spécifiques comme Noël). Ainsi, lire les analyses était ce qui se rapprochait le plus de jouer à un jeu à l’ère pré-YouTube, avant les vidéos de walkthrough et les streams de gameplay.

Eh bien, ce que je viens d’expliquer est parfaitement illustré par l’article que j’ai écrit sur les MMORPG pour les plus de 30 ans. Dans cet article, j’ai inclus les jeux du genre que j’avais joués, j’ai établi des critères et un système de notation, et je l’ai organisé de manière à rendre visible le résultat de mon évaluation via un tier list. Oui, j’ai fait exactement ce que faisaient les chroniqueurs de magazines, en respectant les proportions et la qualité qui s’imposent.

Des décennies ont passé depuis, et les choses ont changé. Les notes de jeux apparaissent désormais sur des sites web et dans des critiques vidéo sur YouTube, les médias écrits physiques sont devenus un intérêt un peu cult, et mon accès aux jeux a radicalement évolué. Alors qu’acheter un jeu était autrefois un événement rare impliquant une analyse exhaustive du coût d’opportunité, aujourd’hui, grâce à des plateformes comme Steam, il m’est devenu facile d’accumuler des jeux. Disons que j’ai probablement un peu exagéré. Au moment d’écrire cet article, ma bibliothèque Steam a accumulé 1047 jeux au cours des 10 dernières années. Oui, c’est bizarre. Et non, je n’en ai même pas joué à la moitié.

L’Idée

De ce désir d’analyser les jeux et de l’envie de tirer le meilleur parti de ma ludothèque est née l’idée suivante : et si je curatais tous les jeux que je possède ? En tant que simple question de temps mathématique, il est peu probable que je joue un jour à tous ces jeux. Compte tenu du travail, des cours et d’un futur héritier en route, cette improbabilité tend à devenir de plus en plus impossible.

Avec cela en tête, je me suis souvenu de ce qui rendait les analyses de ces magazines si uniques : les critères. Définir des points et les suivre dans une analyse transforme votre opinion d’un sentiment vague en quelque chose de tangible. Oui, les notes dans l’industrie du jeu peuvent être une manière creuse et problématique d’évaluer les jeux si elles sont prises comme seul mécanisme. Cependant, sans un minimum de standard, une opinion devient une simple divination.

Ce désir a donné naissance à un projet : une curation réalisée par une Intelligence Artificielle, utilisant des critères personnalisés par moi de manière artisanale, qui évalue toute ma bibliothèque Steam et classe les jeux via des tier lists séparées par sous-genres. J’ai nommé ce projet .2miu Curator.

Dans cet article, je vais expliquer comment je l’ai fait, les difficultés et les nombreux problèmes d’un projet de week-end un peu fou.

La Stack

Section développeur en vue !

Parlons de l’éléphant fullstack dans la pièce et abordons la technologie utilisée. Pour ce projet, j’ai utilisé Go comme langage principal pour le backend et SolidJS pour le frontend. Ceux qui me suivent savent que c’est ma stack standard actuelle. Non, je ne vais pas évangéliser sur la technologie, c’est le rôle des étudiants universitaires ignorants. Ce que je peux dire sur Go, c’est qu’il est extrêmement performant, ne perdant essentiellement qu’face au Rust et au C++, ce qui est déjà remarquable en soi. Mais au-delà de cela, j’ai utilisé la fonctionnalité qui justifie l’existence du langage de Google dans ce projet : les goroutines. Oui, beaucoup de langages gèrent les threads, mais Go a élevé cela à un autre niveau d’efficacité. Alors que la gestion de la concurrence dans d’autres langages ressemble souvent à une solution de contournement complexe ou à une lourde charge mémoire, dans Go, les goroutines sont des citoyens de première classe. Elles vous permettent de mettre à l’échelle des milliers de processus simultanés pour le coût mémoire d’une tasse de café. Bien sûr, dans ce projet, nous n’atteindrons pas l’extrême de milliers de requêtes, mais comme je l’ai dit, c’est déjà mon langage standard et j’ai besoin de travailler avec la concurrence, donc c’était un match parfait !

Concernant le frontend, j’ai opté pour SolidJS, qui fait également partie de ma stack standard axée sur la performance. Je pourrais prétendre que je l’ai fait pour améliorer le chargement des pages de X secondes avec des métriques époustouflantes, mais en réalité, je l’ai choisi parce que c’est ce que j’utilise, ou plutôt, ce que j’ai choisi d’utiliser.

Pour la base de données, j’ai utilisé MongoDB par souci de simplicité. L’architecture et l’objectif de ce projet criaient pour qu’on utilise SQLite, mais j’ai fini par sacrifier la raison à la commodité. Ça arrive, non ?

Initialement, cela devait être une application de bureau utilisant Wails comme couche entre le backend (Go) et le frontend (SolidJS). Cependant, j’utilise actuellement Hyprland comme environnement graphique sur ArchLinux. Anticipant d’éventuelles erreurs avec les technologies périphériques, j’ai décidé de simplifier et de laisser l’application sous forme d’application Web. Pourquoi n’ai-je pas utilisé Electron ? Je déteste tout ce qui est fait avec Electron. À ma stack, vous pouvez voir à quel point je valorise la performance. Exécuter Chromium juste pour afficher un écran n’est pas performant. Il y a aussi Tauri, que je n’ai jamais touché, mais qui semble être plus dans le style de Wails que d’Electron. Bien sûr, la base est faite en Rust, donc cela a parfaitement du sens.

Le projet

En laissant de côté la stack technologique, le projet .2miu Curator a un flux très simple :

La commande curator sync déclenche l’API Steam et interroge le endpoint /IPlayerService/GetOwnedGames/v0001/, qui est assez explicite, et peuple ma base de données MongoDB.

Une fois la base de données peuplée, une seconde commande curator analyze lance l’analyse de chaque jeu en utilisant les paramètres de genre que j’expliquerai plus tard, et peuple la collection MongoDB appelée analyses.

Les jeux sont affichés sur le frontend, qui est connecté à un second backend pour interroger les APIs internes (GetGames, Search, etc.).

Techniquement, c’est extrêmement simple, non ? N’importe quel programmeur qui regarde ce flux pourrait le reproduire sans problème. Alors qu’est-ce qui rend ce projet unique ? Il y a 3 points, et je veux les expliquer un par un.

Point 1 : La curation

Comme je l’ai dit, le but du projet est un curateur de jeux via une IA qui analyse les jeux AVEC MES CRITÈRES. Sans cela, ce serait un projet de 5 ou 10 minutes tout au plus, rien de plus. Mais ce serait quelque chose de totalement bancal car l’IA manquerait de paramètres pour évaluer les jeux. Elle recevrait les informations du jeu (nom, score Steam, description, etc.) et analyserait chaque jeu de la manière la plus libre possible.

Une des choses que j’ai aimées dans mon article sur les MMO était la façon dont j’avais personnalisé ce que j’attends d’un MMO. Pas ce que j’attends d’un bon jeu. Ce que j’attends d’un bon MMO. Des choses uniques comme la “progression horizontale” ou le “leveling” sont spécifiques à ce genre. Si j’évaluais un MMO avec des catégories fixes comme “Graphismes”, “Son”, “Fun”, etc., le résultat serait une liste absurde. Je suis sûr que dans ce scénario Black Desert Online serait TIER S, et la réalité est bien loin de cela.

Je voulais quelque chose de personnalisé par genres.

Cependant, les genres plus généraux sont difficiles à unifier sous un seul critère. Par exemple, le RPG est un genre qui va des Soulslike aux Looter RPG, en passant par les CRPG et les Dungeon Crawler.

C’est à ce moment-là que le projet du week-end a duré tout un week-end, et pas seulement 10 minutes.

Je suis allé genre par genre, en passant en revue les sous-genres et en créant 5 paramètres d’analyse que l’IA devrait suivre pour chacun. Au final, 84 sous-genres ont été évalués. Comme chaque sous-genre avait 5 catégories d’analyse, cela a donné un total de 420 catégories d’évaluation que j’ai créées manuellement. Oui, j’aurais pu demander à une IA de le faire, mais si je l’avais fait, le projet n’aurait eu aucun sens. Je veux que Deepseek évalue selon mes critères. En gros, j’ai établi la ligne éditoriale et j’ai engagé le journaliste (l’IA) pour faire les critiques.

Oui, c’était un travail titanesque, mais amusant. Tous ces critères ont été inclus dans un fichier appelé subgenres.yml, comme le montre l’exemple ci-dessous :

"Metroidvania":
  name: Map Design
    desc: Is the world interconnected elegantly? Are shortcuts satisfying?
  name: Ability Impact
    desc: Do new powers meaningfully change movement and combat?
  name: Combat Depth
   desc: Are boss fights challenging? Is there skill expression?
  name: Exploration Reward
    desc: Is backtracking fun? Are secrets worth finding?
  name: Guidance Balance
   desc: Is the "getting lost" factor balanced with clear objectives?

Pourquoi voudrais-je savoir si un Metroidvania a de bons Graphismes, du Son et d’autres aspects techniques ? Non ! Je veux savoir si le Map Design est bon, si les nouvelles capacités changent la façon de se battre, si le jeu est intuitif en matière de guidage ou si on s’y perd.

Quand Deepseek évalue un jeu Metroidvania, il questionnera ce que j’ai écrit et ne tirera pas de conclusions de son aléatoire standard.

Point 2 : Le Prompt

Comme l’analyse sera effectuée par IA, nous avons besoin de deux choses importantes : connaître le genre du jeu et lui envoyer mes critères pour ce genre.

C’est là que commence le premier défi. Les catégories Steam sont choisies par les propriétaires des jeux, et il y en a plusieurs. Par exemple, Diablo 4 est un Action RPG, plus précisément un Looter ARPG, tandis que Elden Ring est un Action RPG, mais un Soulslike dans ce cas. Mais si nous allons sur Steam, nous voyons que Diablo IV est : Action RPG, Hack and Slash, Loot, Isométrique, RPG, Coop en ligne, Dungeon Crawler, Solo, Coop. Dix catégories pour définir ce qu’est Diablo IV. Je ne peux pas analyser manuellement la catégorie de chaque jeu car, comme je l’ai dit, nous parlons de plus de 1000 titres.

L’approche ici a été d’envoyer la quantité maximale d’informations textuelles sur le jeu à Deepseek, ainsi que les tags et la liste des genres, et de laisser l’IA évaluer quel est le meilleur sous-genre pour ce jeu. Comme il s’agit d’une tâche simple, j’ai utilisé le modèle deepseek-chat, le plus basique. J’ai défini la température à 0 parce que je ne veux pas de créativité, je veux le jugement d’un bibliothécaire.

Une fois le genre choisi renvoyé, l’analyse du jeu est effectuée, cette fois avec deepseek-reasoner, celui qui “réfléchit” pour créer une couche supplémentaire de fiabilité concernant les informations. Deepseek analysera le jeu avec les critères d’un genre spécifique.

Dans ce second prompt, j’ai dû prendre quelques précautions :

Température = 0. La même chose s’applique ici. Je ne veux pas de créativité, je veux de la rigueur.

Ton de l’évaluation. Les IA n’aiment pas critiquer les choses. C’est pourquoi pour les jeux avec <50% d’avis positifs, j’ai été spécifique avec l’IA : Détruis le jeu. Si c’est un chef-d’œuvre, célèbre le jeu. Est-il banal ? Conclus l’avis avec un point positif et un point négatif.

Sois cohérent avec le genre. Les jeux de ferme ne visent pas à avoir des graphismes Unreal Engine 5 réalistes. Les jeux de simulation d’entreprise ne sont pas des simulateurs juridiques. J’ai dû faire plusieurs corrections lors des tests initiaux.

Envoie les informations Steam. Description, Avis Steam, Tags, etc. Du matériel supplémentaire pour que l’IA puisse analyser.

Le résultat ? Un jeu avec un sous-genre défini et 5 critères évalués.

Exemple d’appel I - Prompt pour la sélection du genre (DeepSeek Chat)

{
  "model": "deepseek-chat",
  "temperature": 0,
  "max_tokens": 500,
  "messages": [
    {
      "role": "system",
      "content": "Vous êtes un bibliothécaire strict. Vous classez les jeux dans un ensemble fixe de micro-genres spécifiques.\nContexte : Vous recevrez les détails d'un jeu et une Liste de Genres Autorisés.\nTâche : Identifiez le SEUL Genre Autorisé qui correspond le mieux au jeu.\n\nRègles :\n1. La sortie DOIT être un tableau JSON valide contenant EXACTEMENT UNE chaîne de caractères.\n2. La chaîne DOIT ÊTRE UNE COPIE EXACTE de la liste des Genres Autorisés fournie.\n3. N'INVENTEZ PAS de nouveaux genres. N'utilisez PAS les tags Steam qui ne sont pas dans la liste des Genres Autorisés.\n4. Sélectionnez exactement 1 genre.\n5. Si absolument aucun des Genres Autorisés ne convient, retournez [\"Uncategorized\"].\n"
    },
    {
      "role": "user",
      "content": "## DÉTAILS DU JEU\nTitre : Diablo IV\nDescription : Retournez dans les ténèbres. La bataille sans fin entre les Hauts Cieux et les Enfers Ardents fait rage tandis que le chaos menace de consumer Sanctuaire. Avec des démons sans fin à massacrer, d'innombrables capacités à maîtriser, des Donjons cauchemardesques et du butin Légendaire, ce vaste monde ouvert apporte la promesse de l'aventure et de la dévastation. Survivez et triomphez des ténèbres—ou succombez aux ombres.\nTags : [Action, RPG, Hack and Slash, Loot, Multiplayer, Dark Fantasy, Open World, Character Customization, Co-op, Online Co-Op, PvP, Replay Value, Story Rich, Atmospheric, Action RPG]\n\n## LISTE DES GENRES AUTORISÉS\nVous DEVEZ sélectionner UNIQUEMENT parmi les genres listés ci-dessous. N'utilisez pas les tags Steam.\n\n[\"Tactical RTS\", \"Grand Strategy\", \"4X Strategy\", \"Turn-Based Tactics\", \"Real-Time Tactics\", \"Colony Sim\", \"City Builder\", \"Tower Defense\", \"Auto Battler\", \"Soulslike\", \"Looter ARPG\", \"CRPG\", \"JRPG\", \"Tactical RPG\", \"Creative Sandbox\", \"Open World RPG\", \"Open World Action\", \"Dungeon Crawler\", \"Metroidvania\", \"Roguelike\", \"Roguelite\", \"Character Action\", \"Hack and Slash\", \"Beat em Up\", \"2D Platformer\", \"3D Platformer\", \"Boomer Shooter\", \"Arena Shooter\", \"Hero Shooter\", \"Tactical Shooter\", \"Extraction Shooter\", \"Immersive Sim\", \"Looter Shooter\", \"Military Sim\", \"MMORPG\", \"Battle Royale\", \"MOBA\", \"Survival Craft\", \"Life Sim\", \"Farming Sim\", \"Management Sim\", \"Tycoon\", \"Vehicle Sim\", \"Flight Sim\", \"Space Sim\", \"Arcade Racing\", \"Sim Racing\", \"Kart Racing\", \"2D Fighter\", \"3D Fighter\", \"Platform Fighter\", \"Survival Horror\", \"Psychological Horror\", \"Horror\", \"Puzzle Platformer\", \"Puzzle\", \"Visual Novel\", \"Interactive Fiction\", \"Walking Simulator\", \"Point and Click\", \"Hidden Object\", \"Deckbuilder\", \"Card Game\", \"Digital Board Game\", \"Football Soccer\", \"Basketball\", \"Sports General\", \"Rhythm Game\", \"Physics Sandbox\", \"Cozy\", \"Experimental\", \"Hybrid\", \"Uncategorized\", \"Action Adventure\", \"Stealth\", \"Monster Tamer\", \"Twin Stick Shooter\", \"Party Game\", \"Idle Clicker\", \"Musou Horde\", \"Wargame\", \"First Person Shooter\", \"Third Person Shooter\", \"Adult Visual Novel\", \"Arcade\", \"Arcade Action\", \"Vehicular Soccer\", \"VR Game\", \"Business Sim\"]\n\n## INSTRUCTIONS\n1. Analysez les détails du jeu.\n2. Choisissez le SEUL Genre Autorisé qui correspond le mieux au jeu.\n3. Retournez UNIQUEMENT un tableau JSON avec EXACTEMENT UNE chaîne, ex. : [\"Genre A\"].\n4. Si le jeu ne correspond à AUCUN des genres autorisés, retournez [\"Uncategorized\"].\n5. STRICTEMENT AUCUN AUTRE TEXTE."
    }
  ]
}

Résultat attendu : [Looter ARPG]

Exemple d’appel II - Prompt complet pour l’analyse (DeepSeek Reasoner)

{
  "model": "deepseek-reasoner",
  "temperature": 0,
  "max_tokens": 4096,
  "messages": [
    {
      "role": "system",
      "content": "Rôle : Vous êtes le \"Curateur 2miu\", un critique de jeux vidéo élite, impitoyable et hautement technique. Votre travail est d'analyser les jeux sur la base de critères structurels spécifiques, pas seulement de \"vibes\".\n\nDirectives principales :\n1. Honnêteté brutale : N'adoucissez pas les échecs. Cependant, restez objectif sur les succès même dans les produits imparfaits.\n2. Isolement du contexte : Analysez le jeu UNIQUEMENT sur la base de la Description, des Tags et des Métriques fournis. N'hallucinez pas de fonctionnalités.\n3. Spécifique au genre : On vous donnera un Genre cible et 5 critères spécifiques. Évaluez le jeu strictement par rapport à ces critères.\n4. La contextualisation du score : Un faible Score d'Avis Utilisateurs (< 50%) est un signal d'alarme majeur, MAIS vous devez en diagnostiquer la cause.\n   - Si le score est bas à cause de **problèmes Techniques/Gameplay** (bugs, contrôles maladroits), punissez les critères pertinents impitoyablement.\n   - Si le score est bas à cause de **Monétisation/Politique** (bombardement d'avis, cupidité du battle pass) mais que le jeu de base est fonctionnel, notez les critères de Gameplay HAUT (objectivement) et punissez les critères de Valeur/Progression.\n   - Ne laissez PAS la \"Haine de la Communauté\" contaminer des critères comme \"Graphismes\" ou \"Gunplay\" à moins que ces aspects spécifiques ne soient mauvais.\n\nFormat de sortie :\nVous devez répondre UNIQUEMENT avec du JSON valide. Pas de formatage markdown, pas de remplissage conversationnel. Ne calculez pas le Tier, fournissez simplement les scores.\nStructure :\n{\n  \"criteria\": [\n    {\n      \"name\": \"Nom du Critère de l'Entrée\",\n      \"score\": 1-10,\n      \"justification\": \"Explication de 15-25 mots. Soyez spécifique.\",\n      \"note\": \"Champ hérité optionnel\"\n    }\n  ],\n  \"summary\": \"Verdict de 30-50 mots. Si les scores sont élevés, soyez poétique. Si les scores sont bas, soyez sarcastique et impitoyable.\"\n}"
    },
    {
      "role": "user",
      "content": "## ANALYSE DU JEU CIBLE\n\n**Métadonnées :**\n- Titre : Diablo IV\n- Développeur : Blizzard Entertainment\n- Éditeur : Blizzard Entertainment\n- Date de sortie : 5 juin 2023\n- Accès anticipé : non\n\n**Les Données (Faits) :**\n- Description Steam : \"Retournez dans les ténèbres. La bataille sans fin entre les Hauts Cieux et les Enfers Ardents fait rage tandis que le chaos menace de consumer Sanctuaire. Avec des démons sans fin à massacrer, d'innombrables capacités à maîtriser, des Donjons cauchemardesques et du butin Légendaire, ce vaste monde ouvert apporte la promesse de l'aventure et de la dévastation. Survivez et triomphez des ténèbres—ou succombez aux ombres.\"\n- Tags Steam (Nettoyés) : [Action, RPG, Hack and Slash, Loot, Multiplayer, Dark Fantasy, Open World, Character Customization, Co-op, Online Co-Op, PvP, Replay Value, Story Rich, Atmospheric, Action RPG]\n- Score d'Avis Global : 68% (basé sur 125 432 avis)\n- Score d'Avis Récents : 65%\n\n**Contexte de Genre :**\nJ'ai classé ce jeu comme : **Looter ARPG**\n\n**Tâche d'Analyse :**\nÉvaluez le jeu sur la base de ces 5 critères spécifiques pour un Looter ARPG. Notez chacun de 1 à 10.\n\n **INSTRUCTION CRITIQUE : RELATIVITÉ ET NUANCE BASÉES SUR LES TAGS**\nInterprétez les critères à travers le prisme des Tags Steam pour établir les attentes de base correctes :\n\n1. **La Règle du Contexte** : Utilisez les Tags pour calibrer l'échelle. (ex. 'Répétitif' est fatal pour un jeu narratif, mais attendu pour un 'Musou' ou un 'Diablo-like'. 'Simplicité' est une vertu pour 'Cozy', un défaut pour 'Grand Strategy').\n2. **La Règle de l'Exécution** : Jugez le jeu selon les standards de son micro-genre spécifique (ex. 'Idle Clicker', 'Visual Novel'), pas selon les standards généraux du jeu vidéo. A-t-il réussi à être ce qu'il a ESSAYÉ d'être ?\n3. **Résolution des Conflits** : Si les Tags contredisent le Genre attribué (ex. tag 'Relaxing' sur un 'Survival Horror'), faites confiance à l'attribution du **Genre** et à ces Critères spécifiques plutôt qu'aux tags utilisateurs.\n\n **OBLIGATOIRE : RESPECT DE LA DÉFINITION DES CRITÈRES**\nVous devez évaluer UNIQUEMENT sur la base de la définition spécifique fournie ci-dessous pour chaque critère. N'utilisez pas votre propre définition générale de ces termes.\n- Si le critère 'Graphics' dit 'Évaluez les Performances', vous devez évaluer les FPS/Bugs, PAS le Style Artistique.\n- Une adhésion stricte à la description fournie est requise pour la cohérence dans la base de données.\n\n1. **Satisfaction du Loot** : Les drops sont-ils gratifiants ? Les moments de \"gros lot\" sont-ils excitants ?\n2. **Diversité des Builds** : La théorie de l'endgame est-elle profonde ? Peut-on facilement respec ?\n3. **Boucle d'Endgame** : Le contenu de niveau max est-il varié ? Les objectifs sont-ils clairs ?\n4. **Fluidité du Combat** : La réactivité des compétences est-elle élevée ? Détruire des hordes est-il agréable ?\n5. **Respect du Joueur** : La monétisation est-elle juste ? Peut-on jouer hors ligne/solo si désiré ?\n\n**Liste de Contraintes :**\n- Analysez les Scores (Global : 68%, Récents : 65%). Cherchez les notes de contexte ci-dessus concernant les Arcs de Rédemption ou la Détérioration.\n- Un faible score est-il dû à un mauvais gameplay ou à un bombardement d'avis ? Si le gameplay est poli, notez les critères de gameplay haut malgré le score.\n- Les tags sont-ils cohérents avec le genre ?\n\nGénérez l'analyse JSON maintenant."
    }
  ]
}

Résultat attendu :

{
  "criteria": [
    {
      "name": "Loot Satisfaction",
      "score": 7,
      "justification": "Les drops légendaires sont percutants avec des pics de puissance clairs, mais l'itemisation peut sembler répétitive avec trop d'améliorations incrémentales plutôt que des découvertes excitantes.",
    },
    {
      "name": "Build Diversity",
      "score": 8,
      "justification": "Les arbres de compétences profonds et les tableaux parangon permettent une expérimentation significative des builds. Les coûts de respec sont raisonnables, encourageant la théorie sans punir les erreurs.",
    },
    {
      "name": "Endgame Loop",
      "score": 6,
      "justification": "Les Donjons Cauchemardesques et les événements mondiaux offrent de la variété au début, mais la boucle devient répétitive. Le contenu saisonnier aide mais les activités de base manquent d'engagement à long terme.",
    },
    {
      "name": "Combat Flow",
      "score": 9,
      "justification": "Le combat est réactif et satisfaisant. Les animations des compétences ont du poids, le nettoyage de hordes est viscéral, et la boucle de rétroaction du massacre de démons est constamment engageante.",
    },
    {
      "name": "Player Respect",
      "score": 5,
      "justification": "Le battle pass et la boutique cosmétique existent mais n'affectent pas le gameplay. Cependant, l'obligation d'être toujours en ligne empêche un vrai jeu solo, et le modèle saisonnier crée une pression FOMO.",
    }
  ],
  "summary": "Un ARPG poli avec un combat exceptionnel et des systèmes de builds profonds, mais la boucle d'endgame devient monotone et l'obligation d'être toujours en ligne sape l'agence du joueur. La chasse au loot est satisfaisante mais manque des pics de dopamine de ses prédécesseurs."
}

Point 3 : Frontend

Comme je l’ai mentionné, j’avais initialement prévu d’utiliser Wails mais j’ai décidé de rester sur solidjs et de construire une application web à la place. Le concept central du système a toujours été de créer un tier list basé sur les genres ou sous-genres de jeux. Il avait également besoin de deux autres fonctionnalités : un filtre pour le Tier S et une recherche de jeux. La fonction de recherche est standard. D’un autre côté, le filtre par Tier me permet de voir tous les jeux de Tier S de ma bibliothèque, ou même ceux du Tier F.

Alors, comment les Tiers ont-ils été définis ?

Facile !

Tier	Plage de Score	Description
S	9.5 - 10.0	Exceptionnel
A	9.0 - 9.49	Excellent
B	8.0 - 8.99	Très bon
C	7.0 - 7.99	Bon
D	6.0 - 6.99	Correct
E	5.0 - 5.99	Faible
F	0.0 - 4.99	Médiocre

Maintenant que ceci est établi, nous pouvons parler davantage des écrans.

Écran Principal - Tier List

L’écran principal de l’application affiche les jeux organisés dans un format de tier list, similaire à ce que l’on voit dans les communautés de jeux de combat. Lorsque vous sélectionnez un genre dans la barre latérale, le système affiche tous les jeux analysés de ce genre, organisés par leur Tier (S, A, B, C, D, F).

Chaque carte de jeu affiche :

L’image de couverture du jeu (image d’en-tête de Steam)
Le titre du jeu
Le badge du Tier (S, A, B, C, D ou F) dans le coin supérieur droit
Le logo de la plateforme (Steam ou GOG) dans le coin inférieur droit
Le nom du genre
Le score du curateur (échelle de 0 à 10)

Les jeux sont automatiquement triés au sein de chaque tier par leur score, les jeux avec le score le plus élevé apparaissant en premier. Cliquer sur n’importe quelle carte de jeu ouvre une fenêtre modale détaillée montrant l’analyse complète, y compris les scores des 5 critères, les justifications et le résumé généré par l’IA.

Filtre par Genre

La barre latérale fournit une liste complète des 84 genres disponibles dans le système. Par défaut, “Tous les genres” est sélectionné, ce qui affiche les jeux de tous les genres. Lorsque vous cliquez sur un genre spécifique, la tier list se met à jour pour n’afficher que les jeux classés sous ce genre.

Ce mécanisme de filtrage est essentiel car, comme je l’ai expliqué plus tôt, chaque genre a ses propres critères d’évaluation spécifiques. Un jeu qui pourrait être Tier C dans un genre serait Tier S dans un autre, selon à quel point il correspond aux attentes de ce sous-genre spécifique.

Filtre par Tier

En plus du filtrage par genre, la barre latérale fournit également un filtre par Tier. Cela vous permet de visualiser tous les jeux d’un tier spécifique à travers tous les genres, ou de le combiner avec un filtre de genre pour voir, par exemple, tous les jeux de Tier S dans le genre “Soulslike”.

Le filtre par tier est particulièrement utile pour :

Découvrir les meilleurs jeux de ma bibliothèque (Tier S)
Identifier les jeux qui pourraient nécessiter une réévaluation (Tier F)
Comparer des jeux de qualité similaire à travers différents genres

La Curation

C’est le cœur du projet. Cette section contient les résultats de la curation effectuée par DeepSeek selon mes critères spécifiques. Avec cinq catégories analysées, elle présente un paragraphe résumant la perspective du curateur dans le style classique des Curateurs Steam. Vous trouverez également le Score de Curation, le Score Steam et un lien pour accéder directement au jeu sur Steam.

Le Panthéon

Le Panthéon est un écran spécial dédié exclusivement aux jeux de Tier S - les chefs-d’œuvre qui ont atteint un score de 9,5 ou plus. C’est le Hall of Fame de ma bibliothèque de jeux.

Le Panthéon affiche tous les jeux de Tier S dans une belle disposition en grille, triés par score (le plus élevé en premier). Chaque carte montre :

La couverture du jeu avec un effet de lueur dorée
Le titre du jeu
Le score exact (par exemple, 9.7)
La classification par genre
Le score des avis Steam pour comparaison

Cet écran sert de collection organisée des meilleurs jeux absolus de ma bibliothèque, quel que soit le genre. C’est l’endroit où aller lorsque vous voulez trouver le prochain chef-d’œuvre à jouer.

Écran d’Audit

L’écran Audit est un outil analytique puissant qui me permet de comparer les évaluations de DeepSeek avec les avis des utilisateurs de Steam. Cet écran fournit plusieurs vues :

Vue Jeux Individuels : Montre tous les jeux avec leur note du curateur (convertie en échelle 0-100), leur note Steam et la différence entre les deux. Cela aide à identifier :

Les jeux où le curateur est plus indulgent que les utilisateurs Steam
Les jeux où le curateur est plus sévère que la communauté
Les classifications erronées potentielles ou les erreurs d’évaluation

Vue Groupes de Genres : Agrège les données par genre, montrant les notes moyennes pour chaque genre. Cela révèle quels genres ont tendance à obtenir des scores plus élevés ou plus bas dans le système de curation par rapport à Steam.

Vue Catégories d’Évaluation : Décompose l’analyse par les critères d’évaluation spécifiques (les 5 critères par genre), montrant quels aspects des jeux ont tendance à obtenir de meilleurs ou de moins bons scores.

L’écran d’Audit est essentiel pour maintenir la qualité et la cohérence du système de curation, me permettant d’identifier des modèles et des améliorations potentielles dans les critères d’évaluation.

Écran Cimetière

Le Cimetière est un mémorial pour les jeux qui ont été retirés de la vente, fermés, ou autrement perdus dans les méandres du temps. Ce sont des jeux qui ne peuvent plus être achetés ou joués, souvent à cause de :

Fermetures de serveurs (jeux uniquement en ligne)
Problèmes de licences
Décisions des développeurs/éditeurs
Litiges juridiques

Chaque entrée dans le Cimetière affiche :

Le titre du jeu
La cause du décès (ex : “Serveurs fermés”, “Retiré de Steam”, “Abandonné par les développeurs”)
La date du décès (quand le jeu est devenu indisponible)

Le Cimetière sert de registre historique pour les jeux qui faisaient autrefois partie de ma bibliothèque mais qui sont désormais inaccessibles. C’est un rappel de l’impermanence des médias numériques et de l’importance de la préservation dans l’industrie du jeu vidéo.

Ces écrans fonctionnent ensemble pour offrir une vue d’ensemble complète de la bibliothèque de jeux, me permettant de découvrir des pépites cachées, d’identifier les meilleurs jeux à jouer, et de maintenir une collection organisée qui reflète mes préférences et mes standards personnels en matière de jeux vidéo.

Problèmes (et ils sont nombreux !)

Prétendre que le plan décrit ci-dessus a été exécuté à 100% sans aucun problème relève du fantasme qu’aucun développeur n’a jamais réellement vécu à ce jour. Il y a eu, en réalité, de nombreux problèmes durant le bref développement de cette application.

Problème numéro 1 : Les Genres

Comme je l’ai mentionné, la curation couvre 84 genres. Est-ce que c’était le plan depuis le début ? Loin de là. Initialement, il y avait 63 genres, ce qui est déjà beaucoup. Cependant, après avoir examiné les résultats de l’analyse, j’ai trouvé des incohérences parce que certains jeux ne rentraient tout simplement dans aucune des catégories existantes. Regardons l’exemple ci-dessous.

Comme j’ai évité les genres trop larges pour me concentrer sur la spécificité, les étiquettes générales comme Action, Aventure, FPS, ou Third Person Shooter ont été écartées. Cependant, nous nous sommes ensuite retrouvés avec des jeux qui ne correspondaient à aucun des sous-genres définis. C’est exactement ce qui s’est passé avec Max Payne 3. Avec les options disponibles, DeepSeek a décidé de le catégoriser comme un Tactical Shooter. Le résultat ? Max Payne a été jugé comme un Tactical Shooter médiocre, recevant une note de 2,6. Le problème, c’est que ce n’est pas du tout un Tactical Shooter.

À cause de cela, après une analyse détaillée de plus de 1000 jeux, j’ai dû identifier ces anomalies, et un problème clair est apparu. Comme je l’ai dit, les jeux étaient analysés, mais le “mètre étalon” utilisé pour certains d’entre eux ne correspondait pas au jeu lui-même.

Alors oui, j’ai dû ajuster cela manuellement. Mais honnêtement, qui peut planifier parfaitement du premier coup tous les sous-genres de jeux possibles ?

Maintenant, Max Payne 3 a la note correcte.

Problème numéro 2 : L’écart dans les catégories analysées

Une autre métrique importante à évaluer est la différence entre les scores DeepSeek et les scores Steam. Ici, nous avons deux types d’écarts à analyser : Genre vs. score Steam et Catégorie vs. score Steam. Bien sûr, le but n’est pas de faire correspondre exactement le score de l’IA à celui de Steam, car alors le projet n’aurait aucun sens. Cependant, des différences énormes suggèrent généralement des problèmes.

Commençons par le premier.

Pour calculer le taux de variation, la formule est simple. Étant donné les valeurs moyennes de tous les jeux d’un genre :

(Score DeepSeek * 10) - Score Steam = Variation

Si la variation est négative, DeepSeek (selon mes critères) a évalué un jeu plus négativement que le public. Si la variation est positive, il l’a évalué plus positivement. Plus le résultat est proche de zéro, plus le consensus entre ma curation et Steam est élevé.

Les variations positives sont attendues, car un jeu peut avoir des avis négatifs sur Steam pour des raisons spécifiques (comme l’utilisation d’assets IA, une controverse avec le créateur, ou une mise à jour défectueuse) qui nuisent à la réputation du jeu mais n’affectent pas nécessairement ses mécaniques réelles.

Les variations négatives, cependant, indiquent généralement un problème. Presque toujours, le problème est le même : un critère spécifique que j’avais prévu n’a pas de sens pour ce jeu en particulier.

À partir de l’image ci-dessus, prenons 3 exemples : Horreur, Simulateur de vol, et Simulateur d’entreprise. Dans l’analyse des Genres vs. Score Steam, nous avons un pourcentage considérablement négatif. J’avais besoin d’enquêter sur ce qui se passait.

Pour ce faire, j’ai effectué le deuxième type d’analyse : Critères évalués vs. Score Steam.

Ici, le scénario change légèrement. Dans le cas de critères ou catégories spécifiques, des variations élevées n’indiquent pas toujours un bug. Par exemple, regardez les jeux de Basketball (essentiellement la série 2K). Ils pourraient avoir une variation de -24,5 % pour le critère Monétisation mais une variation de +20,5 % pour le critère Gameplay sur le terrain. Lorsque vous additionnez tous les critères, vous obtenez une différence de +2,5 %, ce qui est une variation minimale. Cela explique parfaitement ce qu’est la série 2K aujourd’hui : un gameplay excellent avec une monétisation terrible.

Cependant, les genres identifiés comme problématiques dans l’analyse précédente doivent également voir leurs critères examinés ici. Revenons aux exemples de genres mentionnés plus tôt, où nous pouvons identifier des critères qui n’ont vraiment pas de sens.

Horreur - Critère Multijoueur. Variation de -67 %

Simulateur d’entreprise - Critère Gestion du personnel. Variation de -54,4 %

Simulateur de vol - Critère Support VR. Variation de -46,8 %

Je pense que le problème devient très clair avec cette analyse, n’est-ce pas ? Évaluer le multijoueur dans un jeu d’horreur n’a souvent pas de sens (j’ai fait l’erreur de trop me concentrer sur Dead By Daylight). La gestion du personnel n’est généralement pas au cœur d’un simulateur d’entreprise où vous attribuez typiquement un rôle générique à un employé sans vous soucier des lois, des primes salariales ou d’une gestion complexe. Quant aux Simulateurs de vol, bien que le Support VR soit une fonctionnalité sympathique, cela ne devrait pas être un critère de jugement obligatoire en soi.

La solution ici était de revoir les catégories avec des variations supérieures à 25 % (c’est à partir de là que j’ai commencé à identifier des anomalies) et de repenser les critères utilisés.

Avec cela, nous sommes arrivés aux variations ci-dessous. Une variation maximale des genres de -23,2 % est quelque chose de totalement acceptable. Après avoir fait une analyse manuelle des plus grandes variations, j’ai conclu que les résultats ont du sens dans le cadre de MES CRITÈRES.

Problème numéro 3 : La scission des genres

Certains genres sont tout simplement trop vastes. C’était le cas avec Sandbox.

Lorsque j’ai initialement créé la liste des genres, je pensais que Sandbox serait une catégorie raisonnable. Après tout, c’est un terme bien connu dans le jeu vidéo, non ? Eh bien, le problème est que Sandbox englobe des jeux qui vont de GTA V à Spore. Oui, les deux sont des jeux “sandbox” dans le sens où ils vous donnent la liberté de faire ce que vous voulez. Mais le type de liberté qu’ils offrent est fondamentalement différent.

GTA V, c’est semer le chaos dans un monde ouvert réaliste, voler des voitures, tirer sur des gens et vivre une histoire criminelle cinématographique. Spore, c’est créer des créatures à partir de zéro, les faire évoluer, construire des civilisations et conquérir la galaxie. Ils partagent l’étiquette “sandbox”, mais les évaluer avec les mêmes critères serait absurde.

Imaginez juger GTA V sur la “profondeur de la création de créatures” ou Spore sur les “mécaniques de niveau de recherche”. L’IA serait complètement perdue et les scores n’auraient aucun sens.

La solution ? Diviser le genre en deux.

J’ai créé Action Monde Ouvert pour des jeux comme GTA, Saints Row, Watch Dogs, et titres similaires où vous courez dans un monde ouvert réaliste (ou semi-réaliste) en semant le chaos et en suivant une histoire. Les critères ici se concentrent sur des éléments comme l’interactivité du monde, la variété des missions, le plaisir de déplacement et le chaos émergent.

D’un autre côté, Sandbox Créatif est né pour des jeux comme Spore, Minecraft, Terraria, et titres similaires où l’accent est mis sur la création, la construction et l’expression de soi à travers les mécaniques de jeu. Ici, les critères ont évolué vers la profondeur des outils, la liberté créative, les systèmes de progression et les fonctionnalités communautaires.

Cette simple scission a immédiatement corrigé des dizaines de jeux mal catégorisés. Les scores ont recommencé à avoir du sens, et les jeux étaient enfin jugés pour ce qu’ils sont réellement, et non pour ce qu’un terme vague et fourre-tout suggère.

Problème numéro 4 : Les jeux “adorés” avec lesquels je ne suis pas d’accord

C’est là que les choses deviennent personnelles. Et un peu pimentées.

Les notes Steam sont démocratiques. N’importe qui peut laisser un avis. Et parfois, la démocratie a… des goûts discutables.

Laissez-moi vous donner deux exemples qui m’ont fait douter de l’humanité.

Exhibit A : Les jeux Hentai.

Si vous avez déjà parcouru les jeux les mieux notés de Steam sans filtre, vous avez probablement remarqué quelque chose de particulier. Les visual novels pour adultes et les jeux hentai ont souvent des avis extrêmement positifs. On parle de scores positifs à 95% et plus. Plus élevés que certains véritables chefs-d’œuvre de game design.

Pourquoi ? Eh bien, disons qu’il existe une légion très dévouée de… passionnés qui notent ces jeux d’une main pendant que l’autre est… occupée ailleurs. Ces individus donneront un 10/10 à n’importe quel jeu montrant des poitrines d’anime, peu importe si le jeu a une substance, du gameplay ou même un contrôle qualité basique.

Mes critères se moquent de votre note post-éclaircie. J’évalue les Visual Novels pour Adultes sur la base de la qualité narrative, du développement des personnages, de la cohérence artistique, de l’agence du joueur et du rythme. Si l’histoire est nulle et que le “gameplay” consiste juste à cliquer sur du texte mal traduit pour atteindre la scène NSFW suivante, la note le reflétera. Désolé, messieurs de culture. Le Curateur 2miu a des standards.

Exhibit B : Les jeux d’objets cachés.

Écoutez, je comprends que les jeux d’objets cachés ont leur public. Généralement, ce sont des gens qui veulent une expérience relaxante, quelque chose pour se détendre après une longue journée. Et c’est parfaitement valide.

Mais voici mon problème : ces jeux sont souvent trop simples à mon goût. Le défi est minimal, les mécaniques sont répétitives, et les “énigmes” méritent à peine ce nom. Vous cliquez sur des objets cachés dans une scène en désordre. C’est tout. C’est le jeu entier. Peut-être y a-t-il une intrigue policière médiocre pour lier le tout.

Pourtant sur Steam ? Ces jeux ont souvent des avis Très positifs. Le public les adore. C’est du jeu réconfortant.

Mes critères pour les jeux d’Objets Cachés évaluent des choses comme la conception des scènes, les systèmes d’indices, l’intégration des énigmes et les accroches narratives. La plupart de ces jeux obtiennent un Tier C ou D dans mon système. Pas parce qu’ils sont mauvais dans ce qu’ils font, mais parce que ce qu’ils font ne m’impressionne tout simplement pas.

C’est le moment où je dois vous rappeler : c’est MA curation. Mes critères. Mon goût. Si vous adorez les jeux d’objets cachés, tant mieux pour vous. Mais dans l’univers du Curateur 2miu, ils ne vont pas remporter de prix.

Les chiffres : Métriques du projet

Avant de plonger dans les défis, prenons un moment pour apprécier l’ampleur de cette entreprise absurde. Les chiffres ne mentent pas, et ces chiffres racontent l’histoire d’un projet de week-end qui a légèrement dérapé.

Vue d’ensemble générale

Métrique	Valeur
Total de jeux dans la bibliothèque	1 064
Jeux analysés avec succès	1 047
Jeux ignorés (exclus)	5
Total de sous-genres	89
Total de catégories d’évaluation	445
Temps d’analyse moyen par jeu	~66,9 secondes
Total d’appels API à DeepSeek	1 787

445 catégories d’évaluation artisanales. 89 sous-genres. Plus d’une minute par jeu pour une analyse approfondie. Le modèle deepseek-reasoner ne précipite pas ses jugements, et honnêtement, je respecte cela. La qualité prend du temps.

Répartition par Tier

Voici comment ma bibliothèque se répartit après la curation :

Tier	Plage de score	Jeux	Pourcentage
S	9,5 - 10,0	39	3,7 %
A	9,0 - 9,49	132	12,6 %
B	8,0 - 8,99	473	45,2 %
C	7,0 - 7,99	215	20,5 %
D	6,0 - 6,99	100	9,6 %
E	5,0 - 5,99	42	4,0 %
F	0,0 - 4,99	46	4,4 %

La répartition raconte une histoire intéressante. Près de la moitié de ma bibliothèque (45,2 %) atterrit dans le Tier B - le territoire “Très bon”. C’est logique : après plus d’une décennie de soldes Steam, j’ai accumulé des jeux qui semblaient assez prometteurs pour être achetés mais jamais assez urgents pour être joués. Ce ne sont pas des chefs-d’œuvre, mais ce ne sont pas des déchets non plus. C’est l’éternelle pile d’attente.

Les véritables trésors ? 39 jeux de Tier S - le Panthéon. Moins de 4 % de ma bibliothèque a atteint le statut de chef-d’œuvre. Pendant ce temps, 46 jeux sont assis dans le Tier F, l’équivalent numérique du regret d’achat. Au moins, maintenant je sais lesquels éviter.

Top 10 des genres par nombre de jeux

Rang	Genre	Jeux
1	Action Aventure	53
2	Puzzle	44
3	Survival Horror	42
4	Tactical RTS	42
5	Hack and Slash	34
6	Point and Click	31
7	First Person Shooter	29
8	Puzzle Platformer	26
9	Boomer Shooter	24
10	Open World RPG	24

Apparemment, mon goût en matière de jeux est un mélange chaotique de genres. Les jeux d’Action Aventure et de Puzzle dominent, mais le Survival Horror à la 3e place avec 42 jeux révèle une tendance masochiste dont je n’étais pas pleinement conscient. La forte présence des jeux Tactical RTS et Point and Click est une conséquence directe d’avoir grandi à l’âge d’or du jeu PC. Et oui, 24 Boomer Shooters. DOOM et ses descendants ont une place permanente dans mon cœur.

Champions de Niveau S par Genre

Tous les genres ne sont pas égaux. Certains ont plusieurs représentants de niveau S, tandis que d’autres n’en ont aucun. Voici les genres qui ont produit des chefs-d’œuvre :

Genre	Jeux de Niveau S
CRPG	4
Puzzle-Platformer	3
Roman Visuel	3
Immersive Sim	2
Roguelite	2
Soulslike	2
Platformer 2D	1
Action-Aventure	1
Action-Arcade	1
Boomer Shooter	1

Les CRPG mènent la danse avec 4 titres de niveau S. Sans surprise, le genre connaît une véritable renaissance, et des jeux comme Disco Elysium, Baldur’s Gate 3 et Divinity: Original Sin 2 sont tout simplement construits différemment. Les Puzzle-Platformers et les Romans Visuels sont à égalité avec 3 titres chacun, prouvant qu’il n’est pas nécessaire d’avoir des budgets colossaux ou des graphismes photoréalistes pour atteindre la grandeur.

Pendant ce temps, des genres comme Hidden Object (0 Niveau S), Idle Clicker (0 Niveau S) et Roman Visuel Adulte (0 Niveau S - choquant, je sais) restent des zones sans chef-d’œuvre. Du moins, selon mes critères.

Statistiques du Cimetière

Métrique	Valeur
Jeux Morts (Total)	4
Serveurs Fermés	3
Retirés de Steam	1
Abandonnés (Injouables)	0

Seulement 4 jeux de ma bibliothèque sont désormais injouables. Cela représente 0,4 % de ma collection perdue dans le néant. Un petit nombre, mais chacun est un rappel que la propriété numérique est une illusion et que les exigences de connexion permanente sont une malédiction pour le jeu vidéo. Trois d’entre eux sont morts parce que leurs serveurs ont été fermés. Ils n’ont pas échoué parce que c’étaient de mauvais jeux, ils ont échoué parce que quelqu’un a décidé d’appuyer sur un interrupteur.

Répartition des Catégories d’Évaluation

Vous vous souvenez de ces 445 catégories d’évaluation faites à la main ? Voici comment elles se répartissent :

Type de Catégorie	Nombre	Pourcentage
Gameplay/Mécaniques	317	71,2 %
Progression/Récompenses	38	8,5 %
Expérience du Joueur	36	8,1 %
Design/Esthétique	27	6,1 %
Technique/Méta	27	6,1 %

L’accent écrasant mis sur le Gameplay/Mécaniques (71,2 %) est délibéré et reflète ma philosophie personnelle : un jeu peut avoir des graphismes médiocres et une histoire oubliable, mais si sa boucle de gameplay centrale est satisfaisante, il vaut la peine d’être joué. À l’inverse, le plus beau jeu du monde ne vaut rien si y jouer ressemble à une corvée.

Lorsque j’ai créé ces 445 critères répartis sur 89 genres, je ne me demandais pas “Est-ce que ce jeu est joli ?” ou “La bande-son est-elle mémorable ?”. Je me demandais : “Est-ce amusant à jouer ? La boucle centrale fonctionne-t-elle ? Le gameplay respecte-t-il mon temps ?”. C’est pourquoi des critères axés sur les mécaniques comme le Flux de Combat, le Design des Cartes, la Diversité des Builds et autres dominent le système d’évaluation.

Les Défis que le Projet ne Résout Pas

Soyons honnêtes : aucun système n’est parfait, et ce projet a ses limites. Il existe certains défis qui, malgré tous mes efforts, restent non résolus.

Les Jeux Incatégorisables

Certains jeux refusent simplement de rentrer dans une case. Ils sont trop bizarres, trop expérimentaux ou trop uniques pour être jugés selon des critères standards.

Prenez Bully (ou Canis Canem Edit, pour les Européens). Est-ce un jeu d’Action en Monde Ouvert ? En quelque sorte. Est-ce un Life Sim ? Plus ou moins. Est-ce un Beat ’em Up ? Partiellement. Est-ce un Simulateur de Lycée ? Peut-être ? Le jeu mélange tellement d’éléments qu’aucun genre unique ne capture son essence. DeepSeek va choisir quelque chose, mais quoi qu’il choisisse, ce sera légèrement faux.

Ou considérez Passpartout: The Starving Artist. Vous incarnez un artiste français peignant vos propres chefs-d’œuvre et essayant de les vendre à des connaisseurs d’art prétentieux tout en gérant votre addiction au vin et à la baguette. Est-ce un Business Sim ? Un Bac à Sable Créatif ? Un Simulateur d’Art ? Un Tycoon ? Un jeu comique sur les stéréotypes français ? Oui. Tout ça. Rien de tout ça. Bonne chance pour trouver un genre qui capture ça.

Ces jeux finissent soit dans la catégorie Hybride (une catégorie fourre-tout que j’ai créée précisément pour ce problème) soit dans Non Catégorisé (quand même Hybride semble être un étirement). L’analyse pour ces jeux doit être prise avec des pincettes. Ce ne sont pas de mauvais jeux ; ils sont juste impossibles à évaluer avec un système standardisé.

Les Chefs-d’Œuvre Multi-Genres

En lien avec ce qui précède, certains jeux sont véritablement excellents parce qu’ils mélangent plusieurs genres. Mais mon système les évalue comme une chose ou une autre, jamais les deux.

Un jeu qui est à 50 % Metroidvania et 50 % Roguelite sera jugé soit comme un Metroidvania (risquant de manquer ce qui rend les éléments roguelite géniaux) soit comme un Roguelite (risquant d’ignorer le design de carte brillant). Le score sera techniquement exact pour le genre choisi, mais pourrait ne pas refléter l’image complète.

C’est une limitation fondamentale de tout système d’évaluation basé sur les genres. La seule solution serait de permettre des assignations multiples de genres avec des critères pondérés, mais cela augmenterait la complexité de façon exponentielle. Pour un projet de week-end, j’ai décidé que la simplicité l’emportait.

Le véritable objectif du projet

Je tiens à être très clair sur un point : le but de ce projet n’est PAS d’être un analyseur de jeux définitif.

Ce n’est pas un remplacement pour lire des critiques, regarder des vidéos de gameplay ou se forger sa propre opinion. Le Curateur .2miu n’essaie pas de vous dire ce qui est objectivement bon ou mauvais.

Le véritable objectif est bien plus simple : m’aider à trouver des jeux qui valent la peine d’être essayés.

Avec plus de 1000 jeux dans ma bibliothèque, je n’aurai jamais le temps de tous les jouer. J’ai besoin d’un filtre. Un moyen de me dire : “Hé, parmi tous ces jeux que tu as achetés en solde et oubliés, ceux-là pourraient vraiment valoir ton temps.”

Et vous savez quoi ? Ça marche.

Laissez-moi vous donner deux exemples.

Command & Conquer™ 3: Kane’s Wrath a reçu une note Tier S. C’est un jeu que j’ai acheté dans un bundle il y a des années et que je n’ai même jamais installé. Le Real-Time Strategy n’est pas mon genre principal. Je n’aurais jamais joué à ce jeu naturellement. Mais maintenant ? Maintenant, je suis curieux. Un Tier S dans mon propre système de curation ? Peut-être que je devrais lui donner sa chance.

RollerCoaster Tycoon 2 est une autre surprise Tier S. J’ai de vagues souvenirs d’enfance de l’original, mais je ne me suis jamais mis à jouer à la suite. Il est resté dans ma bibliothèque pendant des années, intact. Le curateur dit qu’il est exceptionnel dans la catégorie Tycoon. Il est temps de construire des montagnes russes, je suppose.

Ce sont ces découvertes qui rendent le projet valable. Pas valider les jeux que je savais déjà être excellents, mais faire remonter des pépites cachées que j’aurais autrement ignorées.

Validation : Les chefs-d’œuvre

Bien sûr, le système serait sans valeur s’il ne parvenait pas à reconnaître une qualité évidente. J’ai donc été soulagé (et honnêtement un peu fier) lorsque l’analyse a confirmé ce que tout joueur sait déjà.

Celeste ? Tier S. Hollow Knight ? Tier S. Elden Ring ? Tier S. Hades ? Tier S. Disco Elysium ? Tier S.

Ces jeux ne sont pas des surprises. C’est une validation. Lorsque votre système de curation alimenté par l’IA identifie correctement des chefs-d’œuvre universellement acclamés comme des chefs-d’œuvre, vous savez que les critères fonctionnent. Le système n’est pas cassé. Il n’attribue pas les scores au hasard. Il y a une logique réelle derrière les évaluations.

Et cela me donne confiance dans les surprises. Si le système a raison à propos de Hollow Knight, peut-être a-t-il aussi raison à propos de ce jeu obscur dont je n’ai jamais entendu parler et qui s’est retrouvé en Tier S.

Conclusion : Le rédacteur en chef de mon propre magazine

Permettez-moi de vous ramener au point de départ : un enfant lisant Hobby Consolas et Playmania, fasciné par l’analyse de jeux et les notes des critiques.

Je ne suis jamais devenu journaliste de jeu vidéo. Je n’ai jamais travaillé pour un magazine de jeu. Mais avec ce projet, je suis en quelque sorte devenu quelque chose de similaire : le rédacteur en chef de ma propre publication de jeu personnelle.

Réfléchissez-y. Dans le journalisme de jeu traditionnel, le rédacteur en chef définit la ligne éditoriale. Il établit les critères, les standards, la philosophie de la façon dont les jeux doivent être évalués. Puis il engage des journalistes pour écrire les critiques en suivant ces directives.

C’est exactement ce que j’ai fait ici.

DeepSeek écrit le texte. Il génère les scores. Il produit les justifications et les résumés. Mais l’âme de chaque analyse est la mienne. Chaque critère a été façonné à la main par moi. Chaque paramètre d’évaluation reflète ma philosophie de jeu personnelle. Ce que je valorise dans un Metroidvania. Ce que j’attends d’un Looter ARPG. Ce qui fait qu’un Soulslike est génial.

L’IA est mon journaliste. Je suis la ligne éditoriale.

En fin de compte, ces 420 catégories d’évaluation créées manuellement ne sont pas seulement des points de données. C’est un manifeste de mon goût en matière de jeux, codifié dans un système capable d’analyser plus de 1000 jeux d’une manière que je n’aurais jamais pu faire manuellement.

Nous sommes en 2026, et j’ai enfin mon propre Hobby Consolas. Il est numérique, il est alimenté par l’IA, et il ne critique que les jeux que je possède. Mais cet enfant qui s’arrêtait au kiosque à journaux tous les mois serait plutôt impressionné.

Le Curateur .2miu est un projet personnel et n’est affilié ni à Steam, Valve, DeepSeek, ni à aucun des jeux mentionnés. Toutes les opinions exprimées sont les miennes, filtrées à travers une IA qui n’a d’autre choix que d’être d’accord avec moi. C’est la beauté d’être le rédacteur en chef.

Scène post-générique : L’arsenal en ligne de commande

Pour les nerds qui sont restés jusqu’à la fin.

Vous ne pensiez tout de même pas que je vous laisserais partir sans vous montrer le CLI ? Voici toutes les commandes que le Curateur .2miu supporte. N’hésitez pas à imaginer la sortie de terminal satisfaisante.

Commandes principales

./curator sync                    # Synchroniser la bibliothèque Steam
./curator analyze                 # Analyser les jeux en attente
./curator status                  # Afficher la progression du traitement
./curator genres                  # Lister les genres disponibles
./curator check-excluded          # Vérifier les jeux exclus
./curator check-game --id=<id>    # Vérifier un jeu spécifique
./curator audit --f <file>        # Traiter un fichier d'audit
./curator deduplicate-analyses    # Supprimer les analyses en double
./curator move-to-graveyard --f <file>  # Déplacer des jeux vers le cimetière
./curator analyze-graveyard       # Analyser les jeux du cimetière

Options d’analyse

Pour quand vous avez besoin d’une précision chirurgicale dans votre curation :

./curator analyze --id=220                    # Analyser par App ID
./curator analyze --id=220,400,570            # Analyser plusieurs jeux
./curator analyze --genre="Soulslike"         # Ré-analyser un genre entier
./curator analyze --all                       # Tout ré-analyser (prenez un café)
./curator analyze --games 10                  # Limiter à N jeux
./curator analyze --zero-reviews              # Ré-analyser les jeux avec 0% de critiques

Drapeaux de synchronisation

./curator sync --games 100                    # Limiter la synchronisation à N jeux
./curator sync --force-recreate               # ATTENTION : Supprime TOUTES les données

Ce drapeau --force-recreate ? Je ne l’ai utilisé qu’une seule fois. Par accident. À 2 heures du matin. Après que 800 jeux avaient déjà été analysés.

Tirez les leçons de mes erreurs.