Skip to content
Synge Todo edited this page Oct 28, 2021 · 18 revisions

ai.phys manual [知の物理学研究センターワークステーションマニュアル]

情報共有Slackワークスペース

Hostname ホスト名

  • ai.phys.s.u-tokyo.ac.jp (login server ログインサーバ)
    • Intel Xeon Gold 5118 2.3GHz, 12core x 2, 96GB
    • only accepts SSH from inside UTokyo / 東大内からのみSSH可
    • only accepts public key authentication / 公開鍵認証のみ
  • ai-c01 (CPU server)
    • Intel Xeon Gold 5118 2.3GHz, 12core x 2, 96GB
  • ai-c11, ai-c12, ai-c13, ai-c14, ai-c15, ai-c16 (CPU server)
    • Intel Xeon Gold 5218 2.3GHz, 16core x 2, 96GB
  • ai-g01, ai-g02, ai-g03 (GPGPU server)
    • Intel Xeon Gold 5118 2.3GHz, 12core x 2, 96GB
    • NVIDIA Titan V x 2
  • ai-g11, ai-g12 (GPGPU server)
    • AMD EPYC 7502P
    • NVIDIA A100 x 1
  • IPアドレス・MACアドレス一覧

Compilers, Libraries, etc / コンパイラ、ライブラリ、他

  • gnu compiler 8.3 (gcc, g++, gfortran)
  • intel compiler 2021.1 (icc, icpc, ifort)
  • amd compiler (aocc) 2.3 (clang, clang++, flang)
    • amd compiler を使いたい場合は source /home/amd/amdvars.sh を実行してください
  • openmpi 3.1 (mpicc, mpicxx, mpif90)
    • デフォルトでは mpi* は intel compiler を呼び出します
    • gnu compiler を使いたい場合は source /home/materiapps-gcc/env.sh を実行してください
    • amd compiler を使いたい場合は source /home/materiapps-amd/env.sh を実行してください
  • OpenBLAS, MKL, AOCL
    • AOCL を使いたい場合は source /home/amd/amdvars.sh を実行してください
  • cuda 11.4
  • cutensor 1.3
    • 環境変数 CUTENSOR_ROOT が設定済み。使用例: nvcc -I${CUTENSOR_ROOT}/include xxx.cu -L${CUTENSOR_ROOT}/lib -lcutensor
  • cmake 3.15
  • python 2.7, python3.6 including numpy, scipy, matplotlib, etc
  • boost, eigen3, fftw, hdf5, etc
  • alps, lammps, etc

Batch system / バッチシステム

  • 数分以上のジョブはバッチシステムを利用して実行してください
  • バッチシステムはSLURMを使っています
  • List of partitions (queues)
    • PartitionName=debug Nodes=ai,ai-c01,ai-g[01-03] Default=YES MaxTime=1:00:00
    • PartitionName=batch Nodes=ai-c01,ai-g[01-03] Default=NO MaxTime=24:00:00
    • PartitionName=gpu Nodes=ai-g[01-03] Default=NO MaxTime=24:00:00
  • 簡単な使い方
    • sinfo: パーティション(バッチキュー)の一覧と状態の取得 (-N -lオプションをつけるとさらに詳細な情報が表示される)
    • squeue: ジョブの一覧と状態の取得
    • sbatch: ジョブの投入
      • ジョブスクリプトファイル(例: submit.sh)を作成して、sbatch submit.shを実行
      • ジョブスクリプトの例
        • シリアルジョブ(1プロセス1スレッド)用のスクリプトファイル: serial.sh
        • MPIジョブ(複数プロセス)用のスクリプトファイル: mpi.sh
        • OpenMPジョブ(複数スレッド)用のスクリプトファイル: openmp.sh
        • MPI/OpenMPハイブリッドジョブ(複数プロセス複数スレッド)用のスクリプトファイル: hybrid.sh
    • scancel: ジョブの削除