PbsExitStatus

PbsExitStatus コマンドはPBSの qsubコマンドやqsubarraypbs コマンドで実行したジョブの終了ステータスや、使用メモリ量を確認するコマンドです(当スパコンシステム独自のコマンドです)。 機能的にはPBSの tracejob コマンドとほぼ同じですが、アレイジョブの確認が tracejob コマンドよりし易くなっています。

注意) qsubarraypbs コマンドを使用した時は、必ず PbsExitStatus コマンドでジョブの終了ステータスを確認して下さい。

利用方法

$ PbsExitStatus [オプション]  (JOB ID)

オプション
  • -e … 異常終了したジョブ(ジョブの終了ステータスが 0 以外のもの)だけを表示します。
  • -m … 使用メモリが最大のジョブを表示します。
  • -c …出力行数をカウント。
  • -t … ジョブの実行時間(walltime)の合計を出力します。

補足
  • Exit_status=0 (正常終了)でないジョブがないか確認して下さい(-e オプションを指定すると、Exit_status=0 以外のものだけが表示されます)。
  • もし Exit_status=0 でないものがある場合は、resources_used.mem が指定したメモリ制限を超えていないか確認して下さい。

実行例
    $ PbsExitStatus -m 13671[].apfe3
    12/13/2019 12:50:09;0010;Server@apfe3;Job;13671[62].apfe3;Exit_status=0 resources_used.cpupercent=144 
    resources_used.cput=00:07:54 resources_used.mem=53136kb resources_used.ncpus=2 resources_used.vmem=783816kb 
    resources_used.walltime=00:05:11
    
主な項目
意味
Exit_status
ジョブスクリプトの返り値。0 でない場合はエラーが発生しています。
resources_used.cpupercent
ジョブの平均CPU使用率(%)。
resources_used.mem
ジョブの使用メモリ量。
resources_used.ncpus
ジョブスクリプトのqsub時に -l オプションの ncpus= で指定した使用コア数
resources_used.walltime
ジョブの実行時間

関連ページ