- Aluno: Maruan Biasi El Achkar
- Dataset: Global Earthquake-Tsunami Risk Assessment Dataset
- Fonte: https://www.kaggle.com/datasets/ahmeduzaki/global-earthquake-tsunami-risk-assessment-dataset
- Objetivo: Clusterização geográfica - Iidentificar regiões do mundo com perfis sísmicos semelhantes.
Google Colab com Modelo de Regressão Junto: https://colab.research.google.com/drive/1Ur-HOe-lJGxtiUsxz-oVdDbSwK9BliRn?usp=sharing
A análise de clusterização é uma técnica fundamental de aprendizado de máquina não supervisionado, utilizada para descobrir agrupamentos naturais e padrões ocultos em um conjunto de dados. O objetivo é agrupar pontos de dados que são semelhantes entre si em "clusters", mantendo os grupos distintos uns dos outros.
- Aplicar um algoritmo de clusterização para particionar um conjunto de dados em diferentes segmentos.
- Escolher um dataset de sua preferência.
- Executar pré-processametno dos dados.
- Determinar um número ideal de clusters.
- Visualizar os resultados, avaliar e interpretar o significado de cada cluster.