MiroFish, 55 000 etoiles et zero preuve

Un étudiant de 20 ans a codé un simulateur d'humains virtuels en 10 jours. GitHub a perdu la tête. Un milliardaire chinois a sorti 4 millions de dollars en 24 heures. Personne n'a encore vérifié si le truc marchait vraiment.

MiroFish, 55 000 etoiles et zero preuve

Podcast

Une fourmi toute seule, c'est con. Ça suit des règles basiques, ça tourne en rond, ça ne résout rien.
Mais des milliers de fourmis ensemble trouvent le chemin le plus court, construisent des ponts, gèrent des colonies entières. Aucune d'entre elles ne comprend le plan global. Le plan émerge.
C'est exactement le principe derrière MiroFish. Sauf qu'à la place des fourmis, ce sont des agents IA.
Des milliers. Avec chacun sa personnalité, sa mémoire, ses opinions. Et à la place de la colonie, c'est une simulation de réseaux sociaux.
Le projet a atteint la première place mondiale sur GitHub le 7 mars 2026. Devant OpenAI. Devant Google. Devant Microsoft. 55 900 étoiles à ce jour. Et le mec derrière avait 20 ans quand il l'a codé.

Le stagiaire et le milliardaire

Guo Hangjiang n'est pas sorti de Stanford. Il est en dernière année à l'Université des Postes et Télécommunications de Pékin. Son pseudo en ligne, c'est "Baifu".
Fin 2024, il avait déjà fait un coup avec BettaFish, un outil d'analyse de sentiment multi-agent qui avait ramassé 20 000 étoiles GitHub en une semaine.
MiroFish, c'est le cran au-dessus. Codé en 10 jours pendant un stage chez Shanda Group. Chen Tianqiao, le fondateur de Shanda Group, a vu la démo.
Chen Tianqiao, c'est l'ex-homme le plus riche de Chine.
Fortune bâtie sur les jeux vidéo dans les années 2000. Reconverti en investisseur tech.
Il pousse depuis quelques années une théorie qu'il appelle le "super-individu", l'idée qu'avec l'IA, une seule personne peut faire le boulot d'une boîte entière.
Il a regardé la démo de Guo. En 24 heures, 30 millions de yuans sur la table. Environ 4,1 millions de dollars. Pour un prototype en version 0.1.
Un stagiaire devenu CEO en un week-end. L'histoire est trop belle pour ne pas faire le tour de LinkedIn.

SimCity pour la prospective

Tu uploades un document. N'importe quoi. Un article de presse, un rapport financier, un projet de loi. MiroFish le découpe, en extrait les acteurs, les relations, les tensions, et construit un graphe de connaissances via GraphRAG. Ensuite, il génère des milliers d'agents. Chaque agent a une personnalité unique, une mémoire persistante (via Zep Cloud), des opinions propres.
Ces agents sont lâchés dans deux environnements simulés en parallèle, un style Twitter et un style Reddit, et ils font leur vie. Ils postent, débattent, se convainquent, forment des camps, changent d'avis. Ou s'enfoncent dans leurs positions. À la fin, un ReportAgent synthétise le bordel.
Quelles opinions ont bougé, quelles coalitions se sont formées, quels scénarios se dessinent.
Le moteur sous le capot s'appelle OASIS. C'est un projet open-source du collectif CAMEL-AI, adossé à un vrai papier de recherche (arXiv, avec des chercheurs d'Oxford, Imperial College, Max Planck, Shanghai, Sydney).
OASIS gère jusqu'à un million d'agents et supporte 23 actions sociales.
C'est la seule brique du pipeline qui a une assise académique sérieuse. L'équipe a même testé un truc fun.
Les 80 premiers chapitres du "Rêve dans le pavillon rouge" (un classique chinois dont la fin originale a été perdue) uploadé dans MiroFish pour simuler comment les personnages auraient terminé l'histoire. Pas de la prédiction au sens strict. Plutôt de l'exploration narrative pilotée par des dynamiques de groupe.

Le chiffre qui fait saliver (et qui ne prouve rien)

Un développeur a branché MiroFish sur un bot Polymarket. 2 847 "humains digitaux" simulés avant chaque trade. Résultat qu'il a lui-même annoncé, 4 266 dollars de profit sur 338 transactions.
C'est l'anecdote la plus relayée. Et c'est exactement ça.
Une anecdote, un seul développeur, des résultats auto-déclarés, pas de vérification indépendante, pas de période de test documentée.
Les analyses plus sérieuses indiquent que MiroFish s'en sort sur les questions d'opinion publique à long terme (politiques institutionnelles, traités, dynamiques sociales) mais perd pied dès que ça touche aux marchés financiers, où l'information privée et la microstructure font la différence.
Des agents IA qui simulent des réactions humaines à une controverse ? Plausible. Des agents IA qui battent des traders avec accès à des flux privés ? Beaucoup moins.

Ce que personne ne veut entendre

Aucun benchmark. MiroFish n'a publié aucune comparaison entre ses prédictions et ce qui s'est réellement passé, rien nada, Zéro. Les démos sont des démonstrations de méthode, pas de résultat.
C'est joli, c'est impressionnant visuellement, mais ça ne prouve rien.
Les limites sont connues et documentées (y compris par les chercheurs d'OASIS eux-mêmes dans leur papier). Les agents IA, tous bâtis sur les mêmes LLMs, sont plus sensibles au comportement de troupeau que de vrais humains. Le risque s'appelle "consensus collapse".
Un faux accord général qui émerge non pas parce que le raisonnement est solide, mais parce que les agents pensent tous avec le même cerveau de base.
Les biais RLHF n'arrangent rien. Les agents sont trop polis, trop raisonnables.
L'opinion publique, la vraie, c'est rarement poli.
La répétabilité est un autre problème. Lance la même simulation deux fois, tu obtiens deux résultats différents.
Quand un outil de "prédiction" ne se prédit pas lui-même, ça pose question. Et puis les coûts. Des milliers d'agents qui consomment des appels API LLM pendant des dizaines de rounds, ça crame un budget vite fait. Le README recommande de rester sous 40 rounds. Autrement dit, la simulation complète est un luxe.

Moteur de scénarios, pas boule de cristal

MiroFish ne prédit pas l'avenir. Il simule des dynamiques sociales plausibles. La nuance est fondamentale.

Et dans ce cadre-là, le concept tient. L'idée que les grands mouvements émergent de millions d'interactions plutôt que d'une équation linéaire, c'est plus proche du fonctionnement réel du monde que n'importe quel modèle classique de prédiction. OASIS a des fondations académiques solides.
Le pipeline technique est propre. L'histoire de Guo Hangjiang raconte quelque chose de vrai sur l'époque, un gamin de 20 ans avec un bon concept et les bons outils peut faire trembler le classement mondial.
Mais 55 000 étoiles GitHub n'ont jamais été une preuve de fiabilité. La hype n'est pas un benchmark. Et tant que personne ne publie une comparaison rigoureuse entre ce que MiroFish annonce et ce qui se passe vraiment, la seule posture raisonnable c'est de regarder. Sans toucher.

Le jour où les benchmarks arrivent, on en reparle.

Sources GitHub | PANews | TMTPOST | arXiv (OASIS) | DEV Community | Perplexity AI Magazine | MiroFish

Vous vous êtes abonné(e) avec succès à MetaSlave
Super ! Terminez le paiement pour obtenir un accès complet à MetaSlave
Bon retour ! Vous vous êtes connecté(e) avec succès.
Succès ! Votre compte est entièrement activé, vous avez maintenant accès à tout le contenu.
Succès ! Vos informations de facturation ont été mises à jour.
La mise à jour des informations de facturation a échoué.