Browsing by Author "Boudane, Fatima"
Now showing 1 - 5 of 5
- Results Per Page
- Sort Options
Item Gabriel graph-based connectivity and density for internal validity of clustering(Springer link, 2020) Boudane, Fatima; Berrichi, A.Clustering has an important role in data mining field. However, there is a large variety of clustering algorithms and each could generate quite different results depending on input parameters. In the research literature, several cluster validity indices have been proposed to evaluate clustering results and find the partition that best fits the input dataset. However, these validity indices may fail to achieve satisfactory results, especially in case of clusters with arbitrary shapes. In this paper, we propose a new cluster validity index for density-based, arbitrarily shaped clusters. Our new index is based on the density and connectivity relations extracted among the data points, based on the proximity graph, Gabriel graph. The incorporation of the connectivity and density relations allows achieving the best clustering results in the case of clusters with any shape, size or density. The experimental results on synthetic and real datasets, using the well-known neighborhood-based clustering (NBC) algorithm and the DBSCAN (density-based spatial clustering of applications with noise) algorithm, illustrate the superiority of the proposed index over some classical and recent indices and show its effectiveness for the evaluation of clustering algorithms and the selection of their appropriate parametersItem Le problème de classification automatique de données : approches mono et multi-objectif(Université M'hamad Bougara : Faculté des Sciences, 2021) Boudane, Fatima; Berrichi, Ali( Directeur de thèse)Le clustering est l’une des tâches les plus importantes et les plus étudiées en data mining. Bien que beaucoup d’algorithmes de clustering aient été proposés dans la littérature de recherche, la plupart d'entre eux ne peuvent pas traiter correctement des ensembles de données ayant des clusters de formes arbitraires et de densité variable. De plus, les plus connus des algorithmes dépendent des paramètres utilisateur qui sont difficiles à définir. Dans le cadre de cette thèse, nous considérons le problème de clustering traitant des ensembles de données avec un nombre inconnu de clusters, ayant des formes arbitraires, présentant des variations de densité et contenant des outliers. Notre motivation principale est de proposer de nouvelles approches permettant d’automatiser le processus de clustering en considérant des ensembles de données possédant toutes ces spécifications. Pour répondre à ces exigences, nous avons proposé, tout d’abord, un nouvel indice de validation du clustering basé sur la connectivité et la densité (CDBCVI), qui permet de faire face au cas de clusters de formes arbitraires et de différentes densités. Il facilite ainsi l'évaluation des algorithmes de clustering et la sélection de leurs paramètres appropriés. Ce nouvel indice est basé sur les relations de densité et de connectivité entre les objets de données, extraites sur la base du graphe de proximité de Gabriel. L'incorporation des relations de connectivité et de densité permet d'obtenir de bons résultats de clustering dans le cas de clusters de n'importe quelle forme, taille ou densité. Par la suite, nous avons proposé trois approches de clustering mono- et multi-objectif qui permettent d’automatiser le processus de clustering et d’améliorer la qualité de ses résultats. Ces approches utilisent un schéma de codage de solutions basé sur la densité, inspiré des algorithmes basés sur la densité NBC (Neighborhood-Based Clustering) et DBSCAN (Density Based Spatial Clustering of Applications with Noise) qui sont très efficaces dans le cas de clusters ayant des formes arbitraires et des densités différentes. La première approche consiste à utiliser la métaheuristique de recherche par voisinage variable (Variable Neighborhood Search (VNS)), afin de remédier à la difficulté du choix de la valeur du paramètre unique de l’algorithme NBC et améliorer ses résultats. La deuxième approche consiste à utiliser l’algorithme de colonie d’abeilles artificielles (Artificiel Bee Colonies (ABC)) afin d’automatiser et améliorer la qualité du clustering de l’algorithme NBC. Quant à la troisième approche, elle consiste à utiliser l’algorithme ABC afin d’automatiser et améliorer la qualité du clustering en s’inspirant de la procédure d’expansion de clusters de l’algorithme DBSCAN. Pour améliorer le processus d'évaluation des solutions de clustering au cours des itérations, nous avons défini plusieurs fonctions objectif basées sur des concepts de densité, vu que la prise en compte d'une seule fonction objectif peut ne pas être conforme aux ensembles de données ayant des clusters de formes complexes et des outliers. Nous avons testé la performance des approches proposées par une expérimentation approfondie sur des ensembles de données réels et synthétiques. Les résultats expérimentaux démontrent l’efficacité et la supériorité des approches proposées par rapport à plusieurs d’autres approches de la littératureItem Machine learning in the medical field: A comprehensive overview(Institute of Electrical and Electronics Engineers Inc, 2023) Belgacem, Ali; Khoudi, Asmaa; Boudane, Fatima; Berrichi, AliMachine learning utilization in medicine has increased interest over the last few years. With its impressive results in treating diseases and medical conditions, it will be important to understand and analyze how the scientific community has used it. Thus, opening up space for new research and opportunities in medicine. The objective of this study is to review the literature on machine learning applications in the medical sector. Therefore, we conducted an extensive research by reviewing recent studies and surveys on machine-learning health solutions. As a result, we offer, in this paper, a fresh study affirming the foundations and necessities of a machine learning application in the medical field. We also provide a breakdown of current research trends, which highlights future research opportunities.Item Multi-Objective artificial bee colony algorithm for Parameter-Free Neighborhood-Based clustering(IGI Global, 2021) Boudane, Fatima; Berrichi, AliAlthough various clustering algorithms have been proposed, most of them cannot handle arbitrarily shaped clusters with varying density and depend on the user-defined parameters which are hard to set. In this paper, to address these issues, the authors propose an automatic neighborhood-based clustering approach using an extended multi-objective artificial bee colony (NBC-MOABC) algorithm. In this approach, the ABC algorithm is used as a parameter tuning tool for the NBC algorithm. NBC-MOABC is parameter-free and uses a density-based solution encoding scheme. Furthermore, solution search equations of the standard ABC are modified in NBC-MOABC, and a mutation operator is used to better explore the search space. For evaluation, two objectives, based on density concepts, have been defined to replace the conventional validity indices, which may fail in the case of arbitrarily shaped clusters. Experimental results demonstrate the superiority of the proposed approach over seven clustering methodsItem Spécification formelle des systèmes adaptatifs(2013) Boudane, FatimaLes systèmes logiciels adaptatifs modifient leur comportement seuls à travers des opérations de reconfigurations dynamiques telles que l’insertion, la suppression et le remplacement de composants et/ou de connexions entre ces composants en utilisant des mécanismes de reconfiguration. Afin d’assurer la correction du comportement de ces systèmes pendant et après l’adaptation, nous proposons dans ce mémoire une méthode de modélisation et de vérification formelle permettant au concepteur de modéliser ces systèmes, de spécifier ses propriétés et de les vérifier. La méthode proposée s’articule autour de deux approches. Dans la première, nous proposons un modèle pour représenter un système adaptatif par composant, en utilisant le formalisme de transformation de graphe et le formalisme fonctionnel, tout avec prise en compte des contraintes imposées au système (invariant, pré\post-conditions). Quant à la deuxième approche, elle permet de transformer le modèle semi-formel, construit par la première approche, en une spécification formelle exprimée avec le langage Event-B. Nous automatisons cette transformation par la proposition de certaines règles. Pour valider notre spécification et garantir sa cohérence, nous utilisons le système de preuve de l’atelier B
