{"id":5869,"date":"2026-04-08T14:15:01","date_gmt":"2026-04-08T12:15:01","guid":{"rendered":"https:\/\/nlion.fr\/blog\/?p=5869"},"modified":"2026-04-08T14:27:21","modified_gmt":"2026-04-08T12:27:21","slug":"playawale-fin-de-lopen-data-sauvage","status":"publish","type":"post","link":"https:\/\/nlion.fr\/blog\/playawale-fin-de-lopen-data-sauvage\/","title":{"rendered":"Playawale : Fin de l\u2019Open Data sauvage"},"content":{"rendered":"\n<p class=\"has-text-align-left\">J\u2019ai d\u00e9tect\u00e9 une aspiration massive sur mes g\u00e9n\u00e9rateurs de fichiers JSON. De nombreuses parties ont \u00e9t\u00e9 r\u00e9cup\u00e9r\u00e9es par des bots.<\/p>\n\n\n\n<p class=\"has-text-align-left\">Ce n\u2019est pas grave en soi, mais la m\u00e9thode manque de correction. J&rsquo;ai d\u00e9sactiv\u00e9 l&rsquo;exportation JSON publique pour le moment.<\/p>\n\n\n\n<p class=\"has-text-align-left\">J&rsquo;ai pris aussi les mesures n\u00e9cessaires cette nuit :<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Analyse des acc\u00e8s : Identification des signatures et des horaires de passage des robots.<br><\/li>\n\n\n\n<li>Blocage serveur : Verrouillage des acc\u00e8s suspects directement \u00e0 la source.<br><\/li>\n\n\n\n<li>S\u00e9curisation du code : Le syst\u00e8me de replay a \u00e9t\u00e9 verrouill\u00e9 par une signature cryptographique (HMAC). D\u00e9sormais, l&rsquo;acc\u00e8s aux flux de donn\u00e9es et aux coups jou\u00e9s n\u00e9cessite une cl\u00e9 dynamique, rendant toute tentative d&rsquo;aspiration automatis\u00e9e inop\u00e9rante.<\/li>\n<\/ul>\n\n\n\n<p class=\"has-text-align-left\">Le site est d\u00e9sormais sous surveillance active. <\/p>\n\n\n\n<p class=\"has-text-align-left\">Si quelqu&rsquo;un travaille sur une IA en Deep Learning et a besoin de datasets pour l&rsquo;entra\u00eenement, une collaboration honn\u00eate est pr\u00e9f\u00e9rable au pillage de donn\u00e9es.<\/p>\n\n\n\n<p class=\"has-text-align-left\">Comment je l\u2019ai vu ? <\/p>\n\n\n\n<p class=\"has-text-align-left\">Une analyse de mes statistiques a r\u00e9v\u00e9l\u00e9 une anomalie flagrante : plus de 1000 visites quotidiennes inhabituelles. En remontant les logs, j&rsquo;ai identifi\u00e9 des comportements typiques de bots (requ\u00eates r\u00e9p\u00e9titives et signatures non-humaines) qui aspiraient mes fichiers en boucle.<\/p>\n\n\n\n<p class=\"has-text-align-left\">L&rsquo;auteur a utilis\u00e9 un script d&rsquo;aspiration automatis\u00e9 (un bot) con\u00e7u pour simuler un comportement humain.<\/p>\n\n\n\n<p class=\"has-text-align-left\">Exploration (Crawling) : Le bot a scann\u00e9 l&rsquo;arborescence du site pour lister toutes les URLs des replays. Et j&rsquo;ai commis l&rsquo;erreur de laisser un index de parties trop pr\u00e9visible (simple num\u00e9rotation), ce qui a rendu le travail du crawler extr\u00eamement simple pour lister et aspirer les donn\u00e9es.<\/p>\n\n\n\n<p class=\"has-text-align-left\">Pour \u00eatre honn\u00eate, je ne pensais pas que mes replays int\u00e9resseraient quelqu&rsquo;un d&rsquo;autre que les joueurs eux-m\u00eames. Je n&rsquo;avais pas imagin\u00e9 que ces donn\u00e9es pourraient devenir une cible pour de l&rsquo;aspiration automatis\u00e9e.<\/p>\n\n\n\n<p class=\"has-text-align-left\">Extraction (Scraping) : Il a cibl\u00e9 mes g\u00e9n\u00e9rateurs JSON qui, jusqu&rsquo;ici, livraient les donn\u00e9es de parties en \u00ab\u00a0Open Data\u00a0\u00bb.<\/p>\n\n\n\n<p class=\"has-text-align-left\">Moissonnage : En lan\u00e7ant des requ\u00eates simultan\u00e9es, il a t\u00e9l\u00e9charg\u00e9 l&rsquo;int\u00e9gralit\u00e9 des coups jou\u00e9s sans doute pour constituer une base de donn\u00e9es (dataset) de mes replays, et \u00e0 mon avis pour entra\u00eener une IA.<\/p>\n\n\n\n<p class=\"has-text-align-left\">Par mesure de s\u00e9curit\u00e9 suppl\u00e9mentaire, j&rsquo;ai \u00e9galement d\u00fb bloquer l&rsquo;acc\u00e8s aux utilisateurs via le r\u00e9seau Tor. Je suis d\u00e9sol\u00e9 pour ce d\u00e9sagr\u00e9ment, mais c&rsquo;\u00e9tait une \u00e9tape n\u00e9cessaire pour isoler efficacement les flux suspects.<\/p>\n\n\n\n<p class=\"has-text-align-left\">Pour passer sous les radars, le scraper a utilis\u00e9 des terminaux fant\u00f4mes afin de mimer des connexions mobiles l\u00e9gitimes. Le plus fou dans l&rsquo;histoire ? L&rsquo;auteur a sans doute pay\u00e9 pour un service de \u00ab\u00a0device farm\u00a0\u00bb afin de piller mes donn\u00e9es. Quitte \u00e0 investir de l&rsquo;argent, il aurait mieux fait de m&rsquo;offrir un caf\u00e9 pour en discuter, \u00e7a lui aurait co\u00fbt\u00e9 moins cher ! <img loading=\"lazy\" decoding=\"async\" height=\"16\" width=\"16\" alt=\"\ud83d\ude02\" src=\"https:\/\/static.xx.fbcdn.net\/images\/emoji.php\/v9\/td0\/1\/16\/1f602.png\"><\/p>\n\n\n\n<p class=\"has-text-align-left\"><a href=\"https:\/\/playawale.com\/fr\/replay_ai.php?id=2989\">https:\/\/playawale.com\/fr\/replay_ai.php?id=2989<\/a><\/p>\n\n\n\n<p class=\"has-text-align-left\">#Awale #IA #DeepLearning #Ma\u00eetreAwal\u00e9 #collaboration<\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>J\u2019ai d\u00e9tect\u00e9 une aspiration massive sur mes g\u00e9n\u00e9rateurs de fichiers JSON. De nombreuses parties ont \u00e9t\u00e9 r\u00e9cup\u00e9r\u00e9es par des bots. Ce n\u2019est pas grave en soi, mais la m\u00e9thode manque&#8230;<\/p>\n","protected":false},"author":1,"featured_media":5877,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[],"class_list":["post-5869","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualites"],"_links":{"self":[{"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/posts\/5869","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/comments?post=5869"}],"version-history":[{"count":4,"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/posts\/5869\/revisions"}],"predecessor-version":[{"id":5874,"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/posts\/5869\/revisions\/5874"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/media\/5877"}],"wp:attachment":[{"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/media?parent=5869"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/categories?post=5869"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/nlion.fr\/blog\/wp-json\/wp\/v2\/tags?post=5869"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}