Offre de thèse
Apprentissage fédéré pour la détection des défauts de l'arc dans le contexte de bases de données petits et variées avec un modèle frugal.
Date limite de candidature
24-04-2025
Date de début de contrat
01-10-2025
Directeur de thèse
SCHWEITZER Patrick
Encadrement
Co-director de thèse : Virginie FRESSE, ST Etienne University, Hubert Curien Laboratory (virginie.fresse@univ-st-etienne.fr) Co-director de thèse : Guillaume MULLER, Institut Fayol, Mines Saint-Étienne, guillaume.muller@emse.fr
Type de contrat
école doctorale
équipe
DEPARTEMENT 4 - N2EV : 406 - Mesures et architectures électroniquescontexte
Lors de la constitution de la base de données de signature de courant de ligne, afin de pouvoir utiliser des stratégies relevant de l'IA, les chercheurs sont confrontés à plusieurs problèmes : - Le plus important est qu'il est impossible de couvrir toutes les situations qui pourraient conduire à la production d'un défaut d'arc réel dans une installation. Simuler des arcs électriques en laboratoire est difficile et prend du temps, les bases de données disponibles sont ainsi limitées en volume. - Les données sont souvent floues : les conditions en laboratoire peuvent différer des conditions réelles. - Le réseau électrique évolue avec le temps (vieillissement des câbles et des charges électriques) ; au cours de leur vie, les propriétaires acquièrent de nouveaux appareils dont la signature électrique est inconnue et le système doit s'adapter afin de ne pas déclencher de fausses alarmes. - Les données sont distribuées et sensibles : les entreprises ou les équipes de recherche universitaires ne souhaitent pas partager les bases de données afin de protéger leur propriété intellectuelle. - Le dispositif de détection électronique embarqué sera inséré dans l'installation domestique ou dans un avion, ce qui nécessitera d'être économe en consommation et d'avoir le moins d'impact possible.spécialité
Systèmes électroniqueslaboratoire
IJL - INSTITUT JEAN LAMOUR
Mots clés
Détection défauts d'arcs, Apprentissage fédéré, TinyML, IA Frugale, Few shot learning , Coreset selection
Détail de l'offre
Les arcs électriques peuvent se produire dans n'importe quelle installation électrique (par exemple, les avions, les maisons, les panneaux solaires...) et peuvent être très dangereux, car ils peuvent rapidement provoquer un fort échauffement et déclencher un incendie.
Certains chercheurs ont conclu que les disjoncteurs de défaut d'arc ne sont pas entièrement fiables, car dans certains cas, des défauts d'arc en série ne sont pas détectés. Les systèmes actuels sont également sensibles aux faux positifs et aux faux négatifs.
Le développement de nouvelles stratégies de détection fiables, robustes et frugales est donc devenu un défi majeur pour assurer la sécurité électrique des installations.
Les stratégies de détection (principalement basées sur l'analyse du courant de ligne) sont de plus en plus basées sur l'apprentissage automatique (associé à des descripteurs temporels ou fréquentiels), nécessitant la construction d'une large base de données expérimentale.
Lors de la constitution de cette base de données, les chercheurs sont confrontés à plusieurs problèmes :
- Le plus important est qu'il est impossible de couvrir toutes les situations qui pourraient conduire à la production d'un défaut d'arc réel dans une installation. Simuler des arcs électriques en laboratoire est difficile et prend du temps, les bases de données disponibles sont ainsi limitées en volume.
- Les données sont souvent floues : les conditions en laboratoire peuvent différer des conditions réelles.
- Le réseau électrique évolue avec le temps (vieillissement des câbles et des charges électriques) ; au cours de leur vie, les propriétaires acquièrent de nouveaux appareils dont la signature électrique est inconnue et le système doit s'adapter afin de ne pas déclencher de fausses alarmes.
- Les données sont distribuées et sensibles : les entreprises ou les équipes de recherche universitaires ne souhaitent pas partager les bases de données afin de protéger leur propriété intellectuelle.
- Le dispositif de détection électronique embarqué sera inséré dans l'installation domestique ou dans un avion, ce qui nécessitera d'être économe en consommation et d'avoir le moins d'impact possible.
Afin de relever ces défis, le candidat au doctorat devra rechercher, étudier et développer des technologies impliquants :
- L'apprentissage fédéré : afin de permettre l'entraînement de modèles sans déplacer les données, tout en respectant la confidentialité.
- Techniques d'apprentissage sur un dataset petit : afin d'aider les modèles profonds à apprendre avec moins de données.
- L'IA générative : pour remédier au manque de données, les ensembles de données expérimentales seront complétés par des données synthétiques générées par l'IA. Des techniques d'IA générative telles que GAN (Generative Adversarial Networks) ou VAE (Variational Auto-Encoders) seront testées.
- Apprentissage par transfert : afin de pouvoir entraîner un modèle qui fonctionne indépendamment de l'installation.
- TinyML/Frugal AI : afin de faire fonctionner le modèle sur un petit appareil embarqué.
- IA explicable : afin de mieux comprendre, déboguer et corriger les cas particuliers (principalement les faux-positifs/négatifs).
Les résultats attendus du projet sont :
- Un ensemble de jeux de données contenant des signatures obtenues par expérimentation dans un laboratoire de test, des bases de données industrielles, des méthodes d'augmentation et de sélection de données pour enrichir les différents jeux de données sélectionnés.
- Une méthodologie de fédération de modèles adaptée au contexte applicatif (diversité des jeux de données et petits jeux de données) et à des modèles frugaux optimisés pour la en détection de défauts.
- La mise à disposition d'un modèle « global » appris à partir d'ensembles de données de laboratoire pour le transfert vers le cadre d'apprentissage fédéré proposé.
- Un prototype de modèles fédérés optimisés dans un prototype de système électronique embarqué expérimental.
Keywords
Arc fault detection, Federating Learning, TinyML, Frugal IA, Few shot learning, Coreset selection
Subject details
Electric arc faults can occur in any electric installation (e.g. airplane, domestic houses, solar panels…) and can be very dangerous, as they can quickly heat and start a fire. Some researchers have concluded that Arc Fault Circuit Breaker are not entirely reliable as there are cases in which series arc fault go undetected. Current systems are also susceptible to both false-positives and false-negatives. Developing new detection strategies that are reliable, robust and frugal has therefore become a major challenge for ensuring the electrical safety of installations. Detection strategies (mainly based on line current analysis) are more and more based on machine learning (associated with time or frequency descriptors), requiring the construction of a large experimental database. While building this database, researchers face several problems: - The most important being that, it is impossible to cover all the situations that could lead to the production of an actual arc fault in an installation. Building experiments to simulate electric arcs in laboratory is difficult and takes time, so the available datasets are limited in volume. - Data is often out-of-focus: conditions in laboratory may differ from actual conditions or conditions between two installations may differ. - The electrical network evolves over time (aging of cables and electrical loads), during their life, owners will acquire new devices, with unknown electric signatures and the system must adapt in order not to trigger false alarms. - Data is distributed and sensitive: companies or university research teams do not want to share their datasets to protect their IP. - The embedded electronic detection device will be inserted in home/aircraft installation, thus be frugal in its own consumption and have the smallest impact possible. In order to solve these challenges, the Ph.D. candidate is expected to research, study and develop technologies involving: - Federated Learning: in order to allow training models without moving data, thus respecting confidentiality. - Techniques of Few-Shot learning: in order to help deep models learn with less data. - Generative AI : in order to tackle the lack of data, the experimental datasets will be supplemented by synthetic data generated by AI. Generative AI techniques such as GAN (Generative Adversarial Networks) or VAE (Variational Auto-Encoders) will be tested. - Transfer Learning: in order to be able to train a model that works independently of the installation. - TinyML/Frugal AI: in order to make the model run on a small embedded device - Explainable AI: in order to better understand, debug and correct the corner cases (mostly false-positives/negatives). The expected results of the project are : - A set of datasets containing signatures obtained by experimentation in a test laboratory, industrial databases, data augmentation and selection methods to enrich the various datasets selected. - A model federation methodology adapted to the application context (dataset diversity and small datasets) and to frugal models optimized for defect detection specialization. - Provision of a “global” model learned from laboratory datasets for transfer to the proposed federated learning framework. - A prototype of optimized federated models in experimental hardware
Profil du candidat
Candidat
- Niveau d'études souhaité : Ingénieur ou Master 2 dans des domaines liés à l'informatique, aux mathématiques appliquées, aux statistiques, à la science des données, à l'intelligence artificielle ou au traitement du signal.
- Solides connaissances et compétences en analyse de données et en techniques d'apprentissage automatique, avec un intérêt marqué pour la recherche, le traitement du signal et la programmation.
- Bonnes aptitudes à la communication et au travail en équipe
- Maîtrise de l'anglais technique
Pour postuler à cette offre, veuillez envoyer votre CV, une lettre de motivation, les relevés de notes de votre licence et de votre master, une lettre du superviseur du stage de M2 (s'il a été effectué ou commencé il y a plus de trois mois) ou du projet précédent, ainsi que d'autres documents pertinents (lettres de recommandation, publications, rang de master, etc.)
Contacts:
Thesis director : Patrick SCHWEITZER, Lorraine University, IJL (patrick.schweitzer@univ-lorraine.fr)
Thesis Co-director : Virginie FRESSE, ST Etienne University, Hubert Curien Laboratory (virginie.fresse@univ-st-etienne.fr)
Thesis Co-director : Guillaume MULLER, Institut Fayol at Mines Saint-Étienne, guillaume.muller@emse.fr
Candidate profile
Candidate
- Desired level of education: Engineer or Master 2 in fields related to computer science, applied mathematics, statistics, data science, Artificial Intelligence or signal processing.
- Solid knowledge and skills in data analysis and machine learning techniques with a keen interest in research, signal processing and programming.
- Good communication and teamwork skills
- Proficient technical English
To apply to this offer, please send your CV, cover letter, transcripts of your bachelor's and master's degrees, letter from supervisor of M2 internship (if completed or started more than 3 months ago) or previous project as well as other relevant documents (letters of recommendation, publications, master's rank, etc.)
Contacts:
Thesis director : Patrick SCHWEITZER, Lorraine University, IJL (patrick.schweitzer@univ-lorraine.fr)
Thesis Co-director : Virginie FRESSE, ST Etienne University, Hubert Curien Laboratory (virginie.fresse@univ-st-etienne.fr)
Thesis Co-director : Guillaume MULLER, Institut Fayol at Mines Saint-Étienne, guillaume.muller@emse.fr
Référence biblio
- Humbert, J.B., Schweitzer, P., Weber, S. (2021). Electric Power Systems Research, 196, 107084.
- Duc Vu, H., Calderon, C., Schweitzer, P., Weber, S., Britsch, N., (2019). International Journal of Electrical Power & Energy Systems, 113
- W. Li, Y. Liu, Y. Li and F. Guo, 'Series Arc Fault Diagnosis and Line Selection Method Based on Recurrent Neural Network,' in IEEE Access, vol. 8, pp. 177815-177822, 2020
- X. Liu, D. Huang, T. Jing and Y. Zhang, 'Detection of AC Arc Faults of Aviation Cables Based on H-I-W Three-Dimensional Features and CNN-LSTM Neural Network,' in IEEE Access, vol. 10, pp. 106958-106971, 2022
- Y. Wang, L. Hou, K. C. Paul, Y. Ban, C. Chen and T. Zhao, 'ArcNet: Series AC Arc Fault Detection Based on Raw Current and Convolutional Neural Network,' in IEEE Transactions on Industrial Informatics, vol. 18, no. 1, 2021
- A. Chabert, M.C. Bakkay, P. Schweitzer, S. Weber, J. Andrea, A Transformer Neural network for AC series arc-fault detection, Engineering Applications of Artificial Intelligence, Volume 125, 2023
- Hu, C., Qu, N. & Zhang, S. Series arc fault detection based on continuous wavelet transform and DRSN-CW with limited source data. Sci Rep 12, 12809, 2022
- Wang, J., Li, X. and Zhang, Y., 2024. A series fault arc detection method based on denoising autoencoder and deep residual network. Frontiers in Energy Research, 12, p.1341281.
- Chu, R.; Schweitzer, P.; Zhang, R. Series AC Arc Fault Detection Method Based on High-Frequency Coupling Sensor and Convolution Neural Network. Sensors 2020
- Ghazal Alqabbani, Tests of Series Arcing and Arc Fault Detection Devices in Low Voltage Systems https://kth.diva-ortal.org/smash/get/diva2:1592521/FULLTEXT01.pdf
- Xiaoyang Zheng, Zhixia Feng, Zijian Lei and Lei Chen, Few-shot learning fault diagnosis of rolling bearings based on siamese network, Measurement Science and Technology, Volume 35, Number 9, 2024
- Tian C, Xu Z, Wang L, Liu Y. Arc fault detection using artificial intelligence: Challenges and benefits. Math Biosci Eng. 2023
- Sarker IH. Machine learning: Algorithms, real-world applications and research directions. Sn computer science. 2021;2(3):160.
- LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521(7553):436–44.
- Dosovitskiy A, Springenberg JT, Riedmiller MA, Brox T. Discriminative unsupervised feature learning with convolutional neural networks. Corr [Internet]. 2014;abs/1406.6909. Available from: http://arxiv.org/abs/1406.6909
- Fei-Fei L, Fergus R, Perona P. One-shot learning of object categories. Ieee transactions on pattern analysis and machine intelligence. 2006;28(4):594–611.
- Bromley J, Guyon I, LeCun Y, Säckinger E, Shah R. Signature verification using a “siamese” time delay neural network. In: Proceedings of the 6th international conference on neural information processing systems. Denver, Colorado: Morgan Kaufmann Publishers Inc.; 1993. p. 737–44. (Nips'93).
- Ben-David S, Blitzer J, Crammer K, Kulesza A, Pereira F, Vaughan JW. A theory of learning from different domains. Machine learning. 2010;79:151–75.
- Pan SJ, Yang Q. A survey on transfer learning. Ieee transactions on knowledge and data engineering. 2010;22(10):1345–59.
- Brunton SL, Kutz JN. Data-driven science and engineering: Machine learning, dynamical systems, and control. Cambridge University Press; 2022.
- TinyML Foundation. https://www.tinyml.org/
- Molnar C. Interpretable Machine Learning. Lulu.com; 2020
- P. Magalhaes, V. Fresse, B. Suffran, O. Alata “A Resource-Driven Approach for Implementing CNNs on FPGAs Using Adaptive IPs” HIPEAC conference, 20-22 janvier 2025, Barcelone, Espagne.
- C. Maron, V. Fresse, A. Ohayon “Synthetic Monoclass Teachers Distillation in the Edge using Federated Learning Approach” The 2nd IEEE International Conference on Federated Learning Technologies and Applications (FLTA24), 17-19 septembre 2024, Valence, Espagne
- J. Damurie, S. Duffner, V. Fresse “Heterogeneous SplitFed: Federated Learning with Trainable and Untrainable Clients” The 2nd IEEE International Conference on Federated Learning Technologies and Applications (FLTA24), 17-19 septembre 2024, Valence, Espagne.
- L. Grativol Ribeiro, M. Leonardon, G. Muller, V. Fresse, M. Arzel “FLoCoRA: federated learning compression with low-rank adaptation”. 32nd European Signal Processing Conference EUSIPCO, 26-30 aout 2024, Lyon France.
- L. Grativol, L. Gauthier, M. Léonardon, J. Morlier, A. Lavrard-Meyer, G. Muller, V. Fresse, M Arzel.: “PEFSL: A deployment Pipeline for Embedded Few-Shot Learning on a FPGA SoC“. International Symposium on Circuits and Systems ISCAS 2024: 1-5, Singapore.
- L. Grativol, M. Léonardon, G. Muller, V. Fresse, Matthieu Arzel “Federated learning compression designed for lightweight communications“. ICECS 2023: 1-4.
- Aouedi, O., Piamrat, K., Muller, G., & Singh, K. (2022, January). FLUIDS: Federated Learning with semi-supervised approach for Intrusion Detection System. In 2022 IEEE 19th Annual Consumer Communications & Networking Conference (CCNC) (pp. 523-524). IEEE.
- Aouedi, O., Piamrat, K., Muller, G., & Singh, K. (2022). Federated semisupervised learning for attack detection in industrial Internet of Things. IEEE Transactions on Industrial Informatics, 19(1), 286-295.