Articles

Getstarted

Getting an Account

Para solicitar una cuenta en el cluster computacional HTCF, envíe un correo electrónico para obtener más información.

Access

Using the HTCF Submit Node

El servidor de login es htcf.wustl.edu

~$ ssh [email protected]

Si está utilizando un servidor X localmente, puede conectarse con -Y para algunas aplicaciones gráficas.Una vez conectado, puede crear un espacio de trabajo interactivo o enviar trabajos por lotes.

~$ ssh -Y [email protected] 

Datos &Almacenamiento de datos

Directorios home

Cada cuenta de usuario HTCF tiene un directorio home de 20GB. Este directorio puede utilizarse para almacenar scripts, herramientas de desarrollo, etc. Los directorios home se encuentran en «/home/WUSTL_KEY_ID» y están disponibles en todos los nodos. Se guardan en un almacenamiento tolerante a fallos y se realizan snapshops frecuentes para evitar la pérdida accidental de datos. Se guardan copias de las últimas instantáneas diarias fuera del sitio para fines de recuperación de desastres.

Almacenamiento a largo plazo

El LTS se utiliza para almacenar datos de proyectos en bruto y «terminados». Los directorios LTS no están disponibles en los nodos del clúster. El almacenamiento a largo plazo es el espacio del proyecto de laboratorio, disponible en incrementos de terabytes. Se mantiene en un almacenamiento tolerante a fallos con snapshops. Las copias de las últimas instantáneas diarias se guardan fuera del sitio para fines de recuperación de desastres.

Almacenamiento de alto rendimiento

El almacenamiento de alto rendimiento HTCF es un sistema de archivos grande y distribuido capaz de manejar más de 6GB/segundo de rendimiento total. El HTS es un espacio de rascado y no se hace una copia de seguridad. El almacenamiento de alto rendimiento es temporal. No podemos recuperar absolutamente nada en /scratch una vez eliminado.

*Los datos almacenados en /scratch están sujetos a la Política de Limpieza de Datos de Scratch.

Más información está disponible en nuestra Página de Almacenamiento de Datos &

Software

Lista del software disponible en HTCF

module avail

Para cargar el software:

module load bowtie2

Para solicitar módulos de software adicionales, póngase en contacto con nosotros.

Puede encontrar más información en nuestra página de software

Software GUI

Como el HTCF es principalmente un sistema de colas por lotes para el procesamiento de alto rendimiento de grandes cantidades de datos, la aplicación GUI no es soportada directamente por el HTCF. La instalación y configuración de la aplicación GUI en el HTCF se deja al usuario final.

Flujo de trabajo

Los trabajos suelen seguir un flujo de trabajo genérico.

  • A – Los datos brutos preprocesados entran en el LTS
  • B – Los datos brutos se copian en el scratch para su procesamiento
  • C – Los datos postprocesados se copian en el LTS
  • D – Se eliminan los datos intermedios generados en el paso B

Particiones

Partición Máxima memoria Duración Máximo de CPUs en cola
debug 250GB sin límite 3004
interactivo 250GB 8 horas 3004

Trabajos

Interactivo

Las sesiones interactivas son para ejecutar scripts interactivos, vizualización, cualquier tarea que sea demasiado intensiva en términos computacionales para ejecutarse en el nodo de inicio de sesión que no se envíe a través de sbatch. Los valores por defecto son: 1 núcleo de CPU, 1 GB de RAM y un límite de tiempo de 8 horas.

Puede crear una sesión interactiva ejecutando:

~$ interactive

o puede modificar el siguiente comando para adaptarlo a sus necesidades:

srun --mem=2000 --cpus-per-task=1 -J interactive -p interactive --pty /bin/bash -l

Envío de trabajos por lotes

  • Determinar recursos
  • Crear archivo de trabajo
  • Crear archivo sbatch con los recursos necesarios
  • Enviar
  • Monitorear

Ejemplos de trabajos por lotes

Crear un script de trabajo (myjob.sbatch):

#!/bin/bash#SBATCH --cpus-per-task=1#SBATCH --mem=1Gml programprogram /scratch/lab/files/ABC.fasta /scratch/lab/files/ABC.out

Enviar el script sbatch.

sbatch myjob.sbatch

Ver el trabajo en la cola

user@htcf:~$ squeueJOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)106 debug example example R 0:13 1 n067

GPUs

El HTCF tiene actualmente un pequeño número de GPUs NVIDIA Tesla V100.

Se puede acceder a una GPU utilizando los siguientes parámetros de slurm:

#SBATCH -p gpu#SBATCH --gres=gpu