Este proyecto muestra cómo entrenar y probar un modelo de lenguaje pequeño (SLM) para clasificar frases según su emoji usando Hugging Face Transformers y PyTorch.
- Python 3.8 o superior
- Acceso a internet para descargar modelos preentrenados
Instala todas las dependencias necesarias ejecutando:
pip install -r requirements.txt
- Clona o descarga este repositorio y entra en la carpeta del proyecto.
- (Opcional) Crea y activa un entorno virtual:
- Windows:
python -m venv .venv .venv\Scripts\activate
- Linux/Mac:
python3 -m venv .venv source .venv/bin/activate
- Windows:
- Instala las dependencias:
pip install -r requirements.txt
- Ejecuta el script principal:
- Windows:
python ejem.py
- Linux/Mac:
python ejem.py
- Windows:
Copia y guarda esto como run_all_win.ps1
y ejecútalo en PowerShell:
python -m venv .venv
.venv\Scripts\activate
pip install -r requirements.txt
python ejem.py
Copia y guarda esto como run_all_unix.sh
y ejecútalo en la terminal:
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python ejem.py
- El script
ejem.py
entrena y evalúa el modelo, y permite probar frases interactivamente. - Si tienes problemas con dependencias, asegúrate de tener la última versión de pip:
pip install --upgrade pip
. - El entrenamiento es rápido porque el dataset es pequeño y el modelo es ligero.
Autor: Juan Domingo Autor: Juan Carlos Macías