PbsExitStatus

PbsExitStatus コマンドは qsubarraypbs コマンドで実行したジョブの終了ステータスを確認するコマンドです。機能的にはPBSの tracejob コマンドとほぼ同じですが、アレイジョブの確認が tracejob コマンドよりし易くなっています。

注意) qsubarraypbsコマンドを使用した時は、必ずPbsExitStatus コマンドでジョブの終了ステータスを確認して下さい。

利用方法

$ PbsExitStatus [オプション]  (JOB ID)  [日付]

オプション
  • -n (日数) … 指定された日数分まで遡ってジョブを確認します。
  • -e … 異常終了したジョブ(ジョブの終了ステータスが 0 以外のもの)だけを表示します。
  • -m … 使用メモリが最大のジョブを表示します。
  • -c …出力行数をカウント。
  • -t … ジョブの実行時間(walltime)の合計を出力します。

日付
  • 指定された日付に終了したジョブを確認します。
  • 日付は YYYYMMDD の形式で指定します。複数の日付を指定することができます。ワイルドカード(*)、範囲指定([0-9])による指定も可能です(ワイルドカード等を使う場合は""で囲って下さい)。
    例)
    20160814
    20160814 20160815
    "2016081[456]"
    "2016081*"
  • -n オプションと日付を同時に指定した場合は、日付の指定が優先されます。

補足
  • 指定された日付(もしくは -n オプションで指定した日数)に終了したジョブを確認します。qsubarraypbsコマンドの実行に数日かかった場合は、その日数をカバーできるように日付を指定して下さい。
  • "Exit_status=0" (正常終了)でないジョブがないか確認して下さい(-e オプションを指定すると、"Exit_status=0" 以外のものだけが表示されます)。
  • もし "Exit_status=0" でないものがある場合は、resources_used.mem が指定したメモリ制限を超えていないか、resources_used.walltime が24時間(24:00:00) を超えていないかを確認して下さい。

実行例
    $ PbsExitStatus  -m  24319[].fe3  "2016090*"
    09/07/2016 13:16:30;0010;Server@fe3;Job;24319[1].fe3;Exit_status=0 resources_used.cpupercent=1989 resources_used.cput=63:08:54 resources_used.mem=6578180kb resources_used.ncpus=20 resources_used.vmem=7647772kb resources_used.walltime=03:25:38

関連ページ