Articles

Getstarted

アカウントの取得

HTCF計算クラスタのアカウントを取得するには、メールでお問い合わせください。

アクセス

HTCF投稿ノードの使用

ログインサーバはhtcf.wustl.HTCFです。edu

~$ ssh [email protected]

ローカルでXサーバーを使用している場合、一部のグラフィックアプリケーションでは-Yで接続できます。ログインすると、インタラクティブなワークスペースを作成したり、バッチジョブを投入したりできます。

~$ ssh -Y [email protected] 

データ & データストレージ

ホームディレクトリ

各HTCFユーザーアカウントには20GBのホームディレクトリが与えられています。 このディレクトリは、スクリプトや開発ツールなどの保存に使用できます。 ホームディレクトリは”/home/WUSTL_KEY_ID “にあり、すべてのノードで利用可能です。 これらはフォールトトレラントストレージに保管され、不慮のデータ損失を防ぐために頻繁にスナップショットが行われます。 最新の日次スナップショットのコピーは、災害復旧の目的でオフサイトに保管されます。

長期ストレージ

LTS は、未加工および「完成」プロジェクトデータを保管するために使用されます。 LTS ディレクトリは、クラスタ ノードでは使用できません。 長期保存はラボ・プロジェクト・スペースで、テラバイト単位で利用できます。 スナップショップを備えたフォールトトレラントストレージに保管されます。 最新の日次スナップショットのコピーは、災害復旧の目的でオフサイトに保管されます。

High Throughput Storage

HTCF 高処理ストレージは、6GB/秒以上の総スループットを処理できる大規模で分散したファイル システムです。 HTSはスクラッチスペースであり、バックアップは行われません。 ハイ・スループット・ストレージは一時的なものです。 スクラッチに保存されたデータは、スクラッチデータクリーニングポリシーの対象となります。

詳細はソフトウェアページ

GUI Software

HTCFは主に大量データの高スループット処理のためのバッチキューイングシステムであるため、GUIアプリケーションはHTCFでは直接サポートされていません。 GUIアプリケーションのインストールとHTCFへのセットアップはエンドユーザーに任されています。

ワークフロー

ジョブは通常一般的なワークフローに従います。

  • A – 前処理されたRaw DataがLTSに入る
  • B – Raw Dataが処理のためにスクラッチにコピーされる
  • C – 後処理されたデータがLTSにコピーされる
  • D – – 前処理されたデータがスクラッチにコピーされる
  • C – 前処理されたデータがスクラッチにコピーされる。 ステップBで生成された中間データを削除

Partitions

8時間

Partition 最大メモリ 期間 キュー内の最大CPU
debug 250GB 制限なし 3004
インタラクティブ 250GB 3004

Jobs

インタラクティブ

インタラクティブセッションとはインタラクティブ・スクリプトを実行するためのものであります。 sbatch経由で送信されない、ログインノードで実行するには計算量が多すぎるタスク。 デフォルトは以下の通りです。 CPUコア1個、RAM1GB、時間制限8時間です。

~$ interactive

を実行することにより、対話型セッションを作成することができます。

srun --mem=2000 --cpus-per-task=1 -J interactive -p interactive --pty /bin/bash -l

バッチジョブの送信

  • リソースの決定
  • ジョブファイルの作成
  • 必須リソースでsbatchファイルを作成
  • 送信
  • 監視

Sbatch 例

Job scriptを作成 (myjob.NET)

ジョブファイルを作成します。

#!/bin/bash#SBATCH --cpus-per-task=1#SBATCH --mem=1Gml programprogram /scratch/lab/files/ABC.fasta /scratch/lab/files/ABC.out

sbatchスクリプトをsubmitします。

sbatch myjob.sbatch

キュー内のジョブを見る

user@htcf:~$ squeueJOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)106 debug example example R 0:13 1 n067

GPUs

現在HTCFには少数のNVIDIA Tesla V100 GPUがあります。

GPUには次のslermパラメータでアクセスできます:

#SBATCH -p gpu#SBATCH --gres=gpu