École d’hiver É-EGC
News! Le programme prévisionnel est disponible ici.
La dixième École d’Hiver é-EGC, sur le thème « Analyse des données et apprentissage face à l’urgence climatique et la crise écologique, humanitaire et économique », est un événement organisé par l’Association Extraction et Gestion de Connaissances (EGC).
Cet événement s’organise autour de deux activités principales :
> Deux jours de formation : les 22 et 23 janvier 2024
> Participation à la conférence EGC 2024 : du 24 au 26 janvier 2024
L’inscription se réalise en deux étapes
1. Les participants doivent manifester leur intérêt, avant le 7/12/2023, pour participer à l’École en s’inscrivant avec ce formulaire : https://forms.gle/YcN8tSj7nP7A7kR58
Extension : la date limite de pré-inscription est repoussée au 07/12/2023
Pour que la pré-inscription soit prise en compte, elle doit être accompagnée d’un CV récent du participant.
2. Après la confirmation de la pré-inscription par le comité d’organisation, et avant le 20/12/2023, les participants doivent s’inscrire via la page d’inscription de la conférence EGC 2024 (attention de bien choisir le tarif comprenant l’École).
Le nombre de participants est limité à 30 personnes. Le tarif de l’inscription sera affiché sur le site de la conférence EGC (https://iutdijon.u-bourgogne.fr/egc2024/ecole-e-egc/) et il comprend :
• la participation à l’École d’Hiver (22 et 23 janvier 2024) ;
• la participation à la conférence (24 au 26 janvier 2024) ;
• les déjeuners et le repas de gala.
Dates importantes
• Date limite pré-inscriptions (CV à fournir) : 7/12/2023
• Inscription effective (École + conférence EGC), sur le site de la conférence) : 20/12/2023
Thème de l’école
Analyse des données et apprentissage face à l’urgence climatique et la crise écologique, humanitaire et économique
Cette école s’intéresse aux méthodes aujourd’hui disponibles permettant la fusion de données multimodales (audio, image, texte, série temporelle, etc.), l’analyse et l’apprentissage pour apporter des outils et solutions aux problématiques posées par le changement climatique et ses impacts sur notre environnement et nos sociétés. Cette thématique englobe les approches de l’intelligence artificielle aussi bien symbolique, que numérique ou hybride pour le traitement et l’analyse de données complexes et de connaissances issues de différents domaines scientifiques (sciences sociales, sciences de la Terre et du vivant, sciences médicales, etc.). La multidisciplinarité, ainsi que la diversité, la complexité et l’hétérogénéité des données mettent aux défis nos approches actuelles et nécessitent de nouvelles directions de recherche.
Objectifs de l’école
Les deux jours de formation ont pour but principal d’offrir aux participants des tutoriaux d’initiation dans le domaine de recherche couvrant les thèmes de l’école mais également des tutoriaux plus spécifiques présentant les récentes avancées proposant des solutions et des techniques nouvelles pour les différentes problématiques ayant émergées dans ce domaine. Certains exposés seront associés à des séances plus pratiques afin de permettre aux participants de manipuler quelques outils.
La participation à la conférence permettra aux participants de prendre part à un des événements majeurs de la communauté francophone de l’extraction et la gestion de connaissances. Elle leur permettra d’assister à des présentations de nouvelles avancées et approches développées dans la communauté, ceci pouvant ainsi inspirer leur parcours scientifique futur.
Enfin, cette école souhaite offrir aux jeunes chercheurs (doctorants, post-doctorants et ingénieurs) et aux chercheurs confirmés du domaine la possibilité de se rencontrer et d’échanger des idées, ce qui devrait également permettre aux jeunes chercheurs d’enrichir leur réseau.
Public concerné
L’École d’Hiver é-EGC 2024 s’adresse particulièrement aux doctorants et étudiants souhaitant approfondir leurs connaissances dans le domaine de l’exploration de données et de l’apprentissage, avec un focus sur l’application de ces compétences pour soutenir les Objectifs de développement durable.
Comité scientifique et organisation
• Zaineb Chelly Dagdia (UVSQ, Paris-Saclay)
• Claudia Marinica (LS2N, Université de Nantes)
• Jérome Gensel (LIG, Université Grenoble Alpes)
• Christophe Cruz (ICB, Université de Bourgogne)
• Mustapha Lebbah (UVSQ, Paris-Saclay)
Programme de l’école
Lundi 22/01/2024
8h30 – Accueil et attribution de badges
8h45 – 9h00 – Zaineb Chelly Dagdia, Christophe Cruz, Jérôme Gensel, Claudia Marinica, Bienvenue et présentation du programme de l’école
9h00 – 10h30 – Reik DONNER (Magdeburg-Stendal University of Applied Sciences, Potsdam Institute for Climate Impact Research, Potsdam), “Complex system and network methods for understanding nonlinear climate variability and extremes”
10h30 – 10h45 – Pause café
10h45 – 12h30 – Davide FARANDA (Laboratoire de Science du Climat et de l’Environnement, Institut Pierre Simon Laplace, CNRS), “Comment peut-on attribuer les événements météorologiques extrêmes au changement climatique?”
12h30 – 14h00 – Déjeuner
14h00 – 15h30 – Pierre Gançarski (ICUBE, Université de Strasbourg), “Environnement et analyse de séries temporelles d’images de télédétection en Observation de la Terre”
15h30 – 16h00 – Pause café
16h00 – 18h00 – Germain Forestier (IRIMAS, Université de Haute-Alsace), Deep Learning For Time Series Classification
20h00 – Dîner
Mardi 23/01/2024
09h00 – 10h30 – Freddy Bouchet (CNRS, ENS/PSL), “Rare event simulations and machine learning applied to extreme heat waves and extremes of renewable energy production”
10h30 – 11h00 – Pause café
11h00 – 12h30 – Pierrick BRUNEAU (Luxembourg Institute of Science and Technology, Luxembourg), “Science des données et apprentissage pour lutter contre les changements climatiques”
12h30 – 14h00 – Déjeuner
14h00 – 15h30 – Aidan HOGAN (Universidad de Chile, Santiago), “Knowledge Graphs: An Introduction”
15h30 – 16h00 – Pause café
16h00 – 17h00 – Aidan HOGAN (Universidad de Chile, Santiago), “Knowledge Graphs: An Introduction” – séance pratique
17h00 – 17h30 – Clôture de l’école
Les intervenants
Freddy Bouchet
ENS Lyon, PSL
Freddy Bouchet is a physicist, director of research at the CNRS, and adjunct professor at ENS/PSL. He conducts his research at the Dynamic Meteorology Laboratory (LMD/IPSL) in the Geosciences Department of the École Normale Supérieure, Paris. He trained in mathematics (agrégation) and physics (DEA) at ENS Lyon. He is a statistical physicist specializing in the study of rare events in complex dynamics. In addition to fundamental contributions to statistical physics and large deviation theory, his main field of application is climate dynamics. For example, he has developed new mathematical tools and algorithms to study extreme heat waves and abrupt climate changes (tipping points). In recent years, he has applied these statistical physics tools to the study of rare event statistics for fluctuations in renewable energy production, a crucial issue for the energy transition.
After completing a PhD in physics in a mathematics laboratory (Institut Fourier) with applications in geophysics (Jupiter’s climate and ocean dynamics), Freddy Bouchet has always conducted interdisciplinary research. He is now involved in developing trans-disciplinary research for energy and ecological transitions, in conjunction with non-academic players. For example, he is developing a project between IPSL, the Pierre Simon Laplace climate science institute, and RTE, the electricity grid operator, to work on the links between climate and energy.
Freddy Bouchet heads the GDR « Theoretical Challenges for Climate Sciences », which brings together climatologists, oceanographers, atmosphericists, mathematicians, physicists, computer scientists and specialists in data science and machine learning, to develop the fundamental research needed to meet the many societal challenges in the climate sciences. He is also a member of the scientific committee and board of the Institut des Mathématiques pour la Planète Terre. The aim of his position as Associate Professor at ENS/PSL is to develop interdisciplinarity between mathematics, physics, data science and climate and transition sciences. He also teaches the physical foundations of energy transition scenarios and policies, as well as the physical foundations and impacts of climate change at ENS Paris and ENS Lyon. Freddy Bouchet is involved in various groups and think tanks in accelerating the ecological transition. He has advised several politicians. In 2019, he created the « Ecological transition at ENS Lyon » group to accelerate the reduction of the environmental impact of research, and is an active member of the Labos1point5 collective.
Abstract: Understanding extreme events and their probability is key for the study of climate change impacts, risk assessment, adaptation, and the protection of living beings. Extreme heatwaves are, and likely will be in the future, among the deadliest weather events. Forecasting their occurrence probability a few days, weeks, or months in advance is a primary challenge for risk assessment and attribution, but also for fundamental studies about processes, dataset or model validation, and climate change studies. As another key issue, in order to mitigate climate change, the energy transition will rely much on renewable energy. We also study extremes of residual load (energy demand minus renewable energy production), which are key for the electricity grid stability and resilience.
Because of a lack of data related to a too short historical record, the rarity of the events, and of the difficulty to obtain rare events in climate models, uncertainty quantification is extremely difficult for extreme events. We develop a methodology to tackle this problem by combining probabilistic machine learning using deep neural network and rare event simulations.
We will first demonstrate that deep neural networks can predict the probability of occurrence of long lasting 14-day heatwaves over France, up to 15 days ahead of time for fast dynamical drivers (500 hPa geopotential height fields), and at much longer lead times for slow physical drivers (soil moisture). This forecast is made seamlessly in time and space, for fast hemispheric and slow local drivers.
A key scientific message is that training deep neural networks for predicting extreme heatwaves occurs in a regime of drastic lack of data. We suggest that this is likely the case for most other applications of machine learning to large scale atmosphere and climate phenomena. We discuss perspectives for dealing with this lack of data issue, for instance using rare event simulations.
Rare event simulations are a very efficient tool to oversample drastically the statistics of rare events. Using a climate model, with this tool we obtain several orders of magnitude more extreme heat waves compared to a control run. We will discuss the coupling of machine learning approaches, for instance the analogue method, with rare event simulations, and discuss their efficiency and their future interest for climate simulations.
In this tutorial, an introduction will present the applied problems and their mathematical formulation, and some key results. We will moreover present the theory for an example of a rare event algorithm, and the basic mathematical aspects of optimal predictions patterns which are at the base of the interpretation of machine learning approaches for climate extremes.
Pierrick Bruneau
LIST, Luxembourg Institute of Science and Technology
Pierrick Bruneau est chercheur permanent au LIST. Il a obtenu son doctorat en Informatique à l’Université de Nantes en 2010. Ses recherches se concentrent sur l’apprentissage automatique, avec des contributions aux aspects fondamentaux de l’apprentissage bayésien, ainsi que des applications aux sciences de l’environnement. Il a aussi développé une expertise pour tirer le maximum des architectures parallèles et des installations de calcul haute performance. Parmi d’autres projets, il a récemment mené des recherches sur l’utilisation du deep learning pour améliorer l’estimation de l’étendue des inondations avec des données de médias sociaux (FNR CORE Publimape) et pour mettre en œuvre un modèle de prédiction hybride de la puissance produite par des panneaux photovoltaïques (FNR Bridges Combicast).
Résumé: Parmi les Objectifs de Développement Durables figure la lutte contre les changements climatiques (ODD 13). Cet objectif est central, car il recouvre beaucoup d’autres objectifs, principalement le recours aux énergies durables (ODD 7) et les villes et communautés durables (ODD 11). Dans ces deux interactions, on peut identifier les deux leviers principaux dont nous disposons pour l’action climatique : un levier plutôt préventif (si tant est que l’on peut encore parler de prévention aujourd’hui), en développant l’utilisation des énergies renouvelables, et un levier plutôt curatif, visant à atténuer les effets des changements climatiques, en aménageant l’environnement urbain de manière résiliente aux crues, par exemple (ODD 11).
Cette session sera axée sur deux contributions qui peuvent être attachées à ces leviers :
– En utilisant des données de Twitter pour essayer d’améliorer la prévention et la prédiction des crues [1]
– En utilisant des modèles de prédictions hybrides basés sur le deep learning pour améliorer l’intégration de l’énergie solaire dans le mix énergétique [2]
Nous mettrons également ces contributions en perspectives, en les liants à d’autres contributions récentes sur ces sujets, ainsi qu’aux technologies pertinentes pour le développement de telles applications.
[1] Bruneau, Pierrick, et al. « Measuring the impact of natural hazards with citizen science: The case of flooded area estimation using Twitter. » Remote Sensing 13.6 (2021): 1153.
[2] Koster, Daniel, et al. « Single-Site Forecasts for 130 Photovoltaic Systems at Distribution System Operator Level, Using a Hybrid-Physical Approach, to Improve Grid-Integration and Enable Future Smart-Grid Operation. » Solar RRL 7.8 (2023): 2200652.
Reik Donner
Magdeburg-Stendal University of Applied Sciences, Potsdam Institute for Climate Impact Research, Potsdam
Bio
Résumé:
Davide Faranda
LSCE, Université Paris-Saclay
Davide Faranda est un chercheur CNRS en sciences climatiques au Laboratoire des Science du Climat et del l’Environnement dont le travail se concentre sur l’attribution des événements météorologiques extrêmes. Il a développé des outils dynamiques et statistiques avancés pour étudier le lien entre le changement climatique et ces phénomènes. En 2018, il a reçu le prix EGU Division Outstanding Early Career Scientists Award. Ses résultats d’attribution incluent des événements tels que l’ouragan Ida, la vague de froid en France et le cyclone méditerranéen Apollo. Faranda coordonne également des projets nationaux et européens sur l’attribution des événements extrêmes au changement climatique en utilisant des techniques d’apprentissage automatique. Depuis 2020, il conseille des étudiants en doctorat et coordonne l’équipe ESTIMR sur les statistiques et la dynamique des événements climatiques extrêmes. En 2023, il a été promu Directeur de Recherche en Data Science et a lancé ClimaMeter, un projet international pour attribuer rapidement les événements extrêmes, impliquant plusieurs scientifiques internationaux. Faranda est également reconnu dans les médias pour son rôle de sensibilisation au changement climatique, notamment avec le jeu vidéo ClimarisQ, et intervient régulièrement dans des écoles primaires pour expliquer le rôle des chercheurs dans la société.
Résumé tutoriel: Le changement climatique est un défi mondial aux conséquences multiples et profondes, notamment l’intensification et l’augmentation de la fréquence de nombreux phénomènes météorologiques extrêmes. En réponse à ce problème urgent, nous présentons les outils statistiques pour évaluer et contextualiser les événements météorologiques extrêmes par rapport au changement climatique. Cette science, appelée attribution, se préoccupe d’offrir un aperçu en temps quasi réel de la dynamique des événements extrêmes, servant de ressource pour les chercheurs et les décideurs politiques, ainsi que d’outil de diffusion de la science pour le grand public. Les études d’attribution portent actuellement sur plusieurs événements extrêmes tels que les vagues de chaleur, les vagues de froid, les fortes précipitations, les sécheresses, les cyclones et les tempêtes de vent (liste non exhaustive). Cette présentation élucide les méthodologies couramment utilisées pour l’attribution, les sources de données et les techniques d’analyse, fournissant ainsi une vue d’ensemble de ses fondements scientifiques. Pour illustrer l’attribution, nous travaillerons en groupe sur des rapports récents sous les angles scientifiques et de la communication. Ce travail de groupe nous aidera à comprendre comment les études d’attribution contribuent à une meilleure compréhension des interactions complexes entre le changement climatique et les phénomènes météorologiques extrêmes, dans l’espoir de favoriser une prise de décision éclairée et renforcer la résilience climatique à long terme.
Résumé séance pratique: Nous travaillerons en groupe sur des rapports récents sur l’attribution des evenements extremes au changement climatique sous les angles scientifiques et de la communication. Ce travail de groupe nous aidera à comprendre comment les études d’attribution contribuent à une meilleure compréhension des interactions complexes entre le changement climatique et les phénomènes météorologiques extrêmes. Dans cet exercice vous explorerez les études d’attribution du Medicane Daniel menées par World Weather Attribution, Climameter et Medcyclones. Cet exercice vise à approfondir votre compréhension des méthodologies et résultats des études d’attribution tout en développant vos compétences de présentation écrite et orale.
Objectif:
1. Lire et Analyser les Rapports d’Attribution : Examinez rapidement les rapports d’attribution de World Weather Attribution, Climameter et Medcyclones sur le Medicane Daniel. Identifiez les principales conclusions et méthodologies.
2. Synthétiser l’Information : Rédigez un court rapport (environ 300 mots) synthétisant l’information des trois rapports. Mettez en évidence les points clés.
3. Préparer des Présentations Écrites et Orales : Créez une présentation orale concise (3 minutes) résumant les principales conclusions des études d’attribution. Mettez l’accent sur l’essentiel.
Procédure:
1. Distribution des Rapports :
– Recevez rapidement trois rapports d’attribution, un de chaque organisation.
2. Lecture Individuelle :
– Parcourez rapidement chaque rapport, notant les principales conclusions et méthodologies.
3. Synthèse :
– Rédigez un court rapport (environ 300 mots) synthétisant l’information des trois rapports. Identifiez les similitudes et différences.
4. Présentation Orale :
– Préparez une présentation orale concise (3 minutes) mettant en avant les principales conclusions des études d’attribution.
5 Discussion:
-Engagez-vous dans des discussions rapides pour partager des perspectives.
Questions Directrices pour les Présentations Écrites et Orales :
1. Quelles méthodologies chaque organisation a-t-elle utilisées pour attribuer le Medicane Daniel au changement climatique ?
2. Quelles étaient les principales conclusions de chaque étude d’attribution ? Y avait-il des variations dans les résultats ?
3. Comment chaque organisation a-t-elle abordé les incertitudes dans ses évaluations d’attribution ?
Conclusion : Cet exercice rapide offre une opportunité pour approfondir votre compréhension des études d’attribution et améliorer vos compétences de communication en un laps de temps limité. En synthétisant l’information et en présentant oralement, vous gagnez des connaissances sur l’attribution des événements extrêmes et apprenez à transmettre efficacement des résultats scientifiques. Profitez de cette occasion d’apprentissage collaboratif avec vos pairs.
Germain Forestier
IRIMAS, Université de Haute-Alsace
Germain Forestier est titulaire d’un doctorat en informatique de l’Université de Strasbourg. Il a passé un an en tant que post-doctorant à l’INRIA Rennes / INSERM, où il a travaillé sur l’analyse de données biomédicales. Il est actuellement Professeur des Universités en informatique à l’Université de Haute-Alsace (France) et occupe également un poste de professeur associé à la Monash University (Australie). Ses domaines de recherche incluent la science des données, la fouille de données, les séries temporelles, l’apprentissage automatique, le big data, l’intelligence artificielle et l’apprentissage profond. Il est également directeur du département informatique de l’institut de recherche IRIMAS de l’Université de Haute-Alsace.
Résumé:
Pierre Gançarski
ICUBE, Université de Strasbourg
Depuis les années 2010-2020, les spécialistes en Observation de la Terre disposent d’une masse toujours croissante de données satellitaires à haute fréquence temporelles. Alors qu’ils disposaient pour une zone d’étude, de quelques images par an, avec la profusion de ces satellites, une image tous les deux jours est maintenant disponible à des tarifs tout à fait abordables (voire gratuitement dans le cas du programme Copernicus-Sentinel).
De par la nouveauté de telles données, les champs sémantiques appropriés pour qualifier ou contraindre les données ne sont pas encore été parfaitement définis. Ainsi, par exemple, une nomenclature des classes d’évolutions des zones péri-urbaines n’est pas encore complète ni même en phase réelle de formalisation. De fait, dans ce cas, mettre en application des méthodes modernes de classification supervisée s’avère très difficile et se base sur des classes et des exemples définis ad’hoc.
Dans cette intervention, je présenterai dans un premier temps, les caractéristiques de tels données et les défis associés. Je présenterai ensuite les quelques méthodes applicables sur ces données, méthodes principalement non supervisées. Enfin, à titre d’exemple, je donnerai les grandes lignes du projet Hérelles qui tente d’apporter des réponses aux défis de l’utilisation de séries temporelles d’images de télédétection en Observation de la Terre.
Résumé :
Aidan Hogan
Universidad de Chile, Santiago
Aidan is a Professor and Vice-Director of the Department of Computer Science, University of Chile, and Vice-Director of the Millennium Institute for Foundational Research on Data (IMFD). His research interests primarily relate to the Semantic Web, Graph Databases, Information Extraction and Reasoning; he has published over one hundred peer-reviewed works on these topics. He is an Editor-in-Chief and Co-Founder of the upcoming journal Transactions on Graph Data & Knowledge (TGDK). He is the (co)author of three books, namely « Reasoning on the Web of Data », « The Web of Data », and « Knowledge Graphs ».
Résumé: Knowledge Graphs have received growing attention in recent years, particularly in scenarios that involve integrating diverse sources of data at large scale. Within such scenarios, Knowledge Graphs have popularised the idea of modelling data following a graph-based abstraction, where nodes represent entities and edges represent the relations between entities. In terms of research, Knowledge Graphs have become a novel point of convergence for different communities, wherein a variety of techniques for creating, enriching, validating and analysing Knowledge Graphs have been proposed, alongside techniques for querying, reasoning, and generating machine learning models over them. In terms of practice, Knowledge Graphs are now used in diverse applications involving question answering, recommendations, classification and prediction, semantic search, information extraction, and more besides. In this tutorial, we will provide an introduction to Knowledge Graphs, covering the basics of how they modelled, the techniques that they enable, the research questions that they raise, and the applications in which they have been used. We will finish the tutorial with a hands-on session querying Wikidata for information relating to climate change.
Contacts
Claudia Marinica
claudia.marinica@univ-nantes.fr
Zaineb Chelly
zaineb.chelly-dagdia@uvsq.fr
Frédéric Demoly
frederic.demoly@utbm.fr
Mohammed Lalou
mohammed.lalou@u-bourgogne.fr
Yicha Zhang
yicha.zhang@utbm.fr