Jeu de données Bitcoin
Comment participer au défi EGC
Répondre au défi EGC consiste a soumettre à EGC 2024 un article synthétisant un travail de recherche portant ou utilisant les données fournies dans le cadre du défi. Cet article sera évalué (peer-review) par des membres du PC d’EGC, puis un vainqueur du défi sera choisi en fonction de ces évaluations. Le défi peut donc consister à répondre a différentes questions sur ce jeu de données, comme présenté ci-dessous. Les articles candidats au défi seront tous présentés dans un session réservée d’EGC.
Date limite de soumission
13 octobre 2023
Notification aux auteurs
20 novembre 2023
Version finale des articles
8 décembre 2023
Challenges auquel répondre dans le cadre du défi
Toute contribution appliqué au jeu du données du défi peut être soumise comme participation au défi. Nous proposons plus particulièrement 2 challenges, plus un challenge libre.
Séries temporelles : Prédiction de l’évolution du cours du Bitcoin. Ce défi consiste a prédire le cours du Bitcoin, en se basant non seulement sur le cours précédent, mais aussi sur les nombreuses autre séries temporelles fournies (acteurs, nombre de transactions, etc.), ainsi qu’éventuellement sur les séries de graphes.
Graphes : Prédiction de liens, Prédiction de graphes. Disposant de multiples graphes correspondant à des journées différentes, mais impliquant les mêmes acteurs, il est possible de s’intéresser a prédire comment les intéractions entre ces acteurs vont évoluer au cours du temps, et donc de chercher a prédire les liens d’un graphe prochain, c’est à dire qui intéragira avec qui dans le futur, éventuellement avec les montants échangés. La tâche peut consister a prédire l’intégralité d’un graphe, ou a prédire certains liens cachés d’un graphe futur, a partir d’un apprentissage sur les graphes passés, voire en s’aidant des séries temporelles décrivant l’évolution de l’activité globale ou de certains acteurs particuliers.
Objectif libre: De nombreuses autres contribution peuvent être proposées sur ces données, telles que des tâches de classification, de détection d’anomalies, de détection d’événements, de désanonysmisation (acteurs semblant différent mais ayant un comportement identique), etc.
Description générale des données
Deux types de données sont fournis, synthétisant l’activité sur une période de 2 ans et demie, du 01/01/2015 au 30/06/2017:
– Des séries temporelles, décrivant l’activité générale de la Blockchain, ainsi que l’activité de 100 acteurs majeurs
– Des réseaux de transactions (1 par jour) décrivant les échanges entre un sous-ensemble d’acteurs majeurs
Les fichiers se trouvent dans ce dépôt Git.
Contacts
Muhammad Arslan
Muhammad.Arslan@u-bourgogne.fr
Remy Cazabet
remy.cazabet@univ-lyon1.fr
Joe Raad
joe.raad@universite-paris-saclay.fr
Ali Yassin
ali.yassin@u-bourgogne.fr