Guía de uso

Una vez que cuentes con la placa máster inicializada y uno o más nodos slave configurados, podrás comenzar a utilizar el clúster. Y esto incluye funciones como ejecutar scripts en paralelo, visualizar las métricas de los nodos y el estado de la red, o administrar el sistema de manera remota desde el máster.

Ejecución en el clúster

El sistema cuenta con la herramienta Slurm, que proporciona un sistema de colas tanto para usuarios como para procesos para gestionar la ejecución en el clúster. A continuación explicamos algunas de las funcionalidades que esta herramienta ofrece:

Para más información sobre la herramienta Slurm y cómo utilizarla, puedes consultar su documentación en su página web: https://slurm.schedmd.com/documentation.html.

Monitorización del sistema

El sistema cuenta con una herramienta de monitorización que se instala y configura durante la inicialización del sistema para que puedas hacer un seguimiento exhaustivo del clúster. Esta herramienta es Ganglia, y para acceder a la página web que muestra las métricas de tu clúster deberás acceder a un navegador desde la placa máster.

Si deseas conocer más sobre las posibilidades que te ofrece esta herramienta, puedes echar un vistazo en su página web: http://ganglia.sourceforge.net/.

Administración remota

El sistema cuenta con un par de scripts para la administración y mantenimiento del clúster. Estos scripts permiten la ejecución de comandos en todos los nodos del clúster de manera remota desde la placa máster. De esta manera, se ofrece la posibilidad de consultar el estado de servicios o de ejecutar comandos de actualización o reinicio, por ejemplo, de una manera rápida y centralizada, sin necesidad de tener que conectarse uno a uno a todos los nodos del clúster.

Para esta tarea, se cuenta con dos scripts, llamados 'global_execute_seq' y 'global_execute_par', que ejecutan el comando o secuencia de comandos con pipes que se les indique por parámetro en todos los nodos del clúster.

Aspectos a tener en cuenta: