Getstarted
アカウントの取得
HTCF計算クラスタのアカウントを取得するには、メールでお問い合わせください。
アクセス
HTCF投稿ノードの使用
ログインサーバはhtcf.wustl.HTCFです。edu
~$ ssh [email protected]
ローカルでXサーバーを使用している場合、一部のグラフィックアプリケーションでは-Yで接続できます。ログインすると、インタラクティブなワークスペースを作成したり、バッチジョブを投入したりできます。
~$ ssh -Y [email protected]
データ & データストレージ
ホームディレクトリ
各HTCFユーザーアカウントには20GBのホームディレクトリが与えられています。 このディレクトリは、スクリプトや開発ツールなどの保存に使用できます。 ホームディレクトリは”/home/WUSTL_KEY_ID “にあり、すべてのノードで利用可能です。 これらはフォールトトレラントストレージに保管され、不慮のデータ損失を防ぐために頻繁にスナップショットが行われます。 最新の日次スナップショットのコピーは、災害復旧の目的でオフサイトに保管されます。
長期ストレージ
LTS は、未加工および「完成」プロジェクトデータを保管するために使用されます。 LTS ディレクトリは、クラスタ ノードでは使用できません。 長期保存はラボ・プロジェクト・スペースで、テラバイト単位で利用できます。 スナップショップを備えたフォールトトレラントストレージに保管されます。 最新の日次スナップショットのコピーは、災害復旧の目的でオフサイトに保管されます。
High Throughput Storage
HTCF 高処理ストレージは、6GB/秒以上の総スループットを処理できる大規模で分散したファイル システムです。 HTSはスクラッチスペースであり、バックアップは行われません。 ハイ・スループット・ストレージは一時的なものです。 スクラッチに保存されたデータは、スクラッチデータクリーニングポリシーの対象となります。
詳細はソフトウェアページ
GUI Software
HTCFは主に大量データの高スループット処理のためのバッチキューイングシステムであるため、GUIアプリケーションはHTCFでは直接サポートされていません。 GUIアプリケーションのインストールとHTCFへのセットアップはエンドユーザーに任されています。
ワークフロー
ジョブは通常一般的なワークフローに従います。
- A – 前処理されたRaw DataがLTSに入る
- B – Raw Dataが処理のためにスクラッチにコピーされる
- C – 後処理されたデータがLTSにコピーされる
- D – – 前処理されたデータがスクラッチにコピーされる
- C – 前処理されたデータがスクラッチにコピーされる。 ステップBで生成された中間データを削除
Partitions
Partition | 最大メモリ | 期間 | キュー内の最大CPU |
---|---|---|---|
debug | 250GB | 制限なし | 3004 |
インタラクティブ | 250GB | 3004 |
Jobs
インタラクティブ
インタラクティブセッションとはインタラクティブ・スクリプトを実行するためのものであります。 sbatch経由で送信されない、ログインノードで実行するには計算量が多すぎるタスク。 デフォルトは以下の通りです。 CPUコア1個、RAM1GB、時間制限8時間です。
~$ interactive
を実行することにより、対話型セッションを作成することができます。
srun --mem=2000 --cpus-per-task=1 -J interactive -p interactive --pty /bin/bash -l
バッチジョブの送信
- リソースの決定
- ジョブファイルの作成
- 必須リソースでsbatchファイルを作成
- 送信
- 監視
Sbatch 例
Job scriptを作成 (myjob.NET)
ジョブファイルを作成します。
#!/bin/bash#SBATCH --cpus-per-task=1#SBATCH --mem=1Gml programprogram /scratch/lab/files/ABC.fasta /scratch/lab/files/ABC.out
sbatchスクリプトをsubmitします。
sbatch myjob.sbatch
キュー内のジョブを見る
user@htcf:~$ squeueJOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)106 debug example example R 0:13 1 n067
GPUs
現在HTCFには少数のNVIDIA Tesla V100 GPUがあります。
GPUには次のslermパラメータでアクセスできます:
#SBATCH -p gpu#SBATCH --gres=gpu