新システムへの移行スケジュール
新システムへの移行は、1) 準備期間 ⇒ 2) 仮運用 ⇒ 3) 正式運用 の順に進められます。
準備期間
新システムへの移行準備のため、現在提供されている計算ノードの一部が停止されます。
また、移行に際してご協力いただきたい作業があります。
(1)<計算サーバで実行中のジョブ停止および一部サービスの停止>
ジョブ停止実施日 : 2023/11/24 20:00
ファイルシステム入替作業実施日 : 2023/11/25-26
内容 : ホームディレクトリ等で利用している大容量ネットワークファイルシステムの入替作業のため、
ホームディレクトリへのアクセス等、多くのサービスが一時的に利用できなくなります。
また、計算サーバで実行中の全てのジョブが停止します。
入替作業は、11月25日から開始されます。26日24時までには終了する見込みですが、状況により予定よりも短時間で
終了する、逆に予定よりも長引く可能性があることをご承知おきください。
作業が終わり次第、ホームページなどでお知らせします。
★ 作業中、ファイルサーバおよびログインノードへのログインは控えてください。
また、Materials Studio/Discovery Studio, Mathematica 等、スパコンシステムのライセンスサーバに
アクセスするアプリケーションの起動・使用も控えてください。
★ 作業開始前の2023/11/24 20:00以降に実行中のジョブは順次終了させていただきます。
★ 以下のサービスはご利用いただけますが、数分から1時間程度、サービスが一時的に中断されます。
・メールの送受信
・クラウドストレージサービス
・ホームページ公開サービスを利用したWebへのアクセス
(2)<共有メモリ型スパコン Superdome Flex の一部停止>
実施日 : 2023/12/11
内容 : 新システム導入作業に伴い、現行の共有メモリ型スパコン Superdome Flex
2ノードのうちの1ノード(ホスト名:sdf2)を停止します。
これにより、SDFキューとしての計算リソースは半減することになります。
もし、SDFキュー利用時に、停止しないノード(ホスト名:sdf1)にてジョブを実行したい場合には、
PBSのオプションとして host=sdf1-adm を指定して実行してください。
ただ、sdf1についても2023年12月末頃には停止となる予定です。
指定例:
#PBS -l select=1:ncpus=4:mem=4gb:host=sdf1-adm
sdf2 停止後(12/11以降)は、利用できるノードは sdf1 のみとなりますので、このオプションをつけなくても
自動的に sdf1 にてジョブが実行されます。
[Q] sdf1-adm をつけないとどうなりますか。
[A] sdf1およびsdf2のうち空いているサーバにてジョブが実行されます。
そして、もしsdf2 でジョブが実行された場合、12/11以降に強制停止されることになります。
[Q] sdf1-adm をつけるとどうなりますか。
[A] 必ず sdf1 にてジョブが実行されます。
(3)<分散型スパコンの一部停止>
実施日 : 2023/12/11
内容 : 次期システムへの移行に伴い、現行の分散型スパコンのおよそ1/3のCPUノードが利用停止となり、
仮運用が開始されるまでは残りのCPUノードのみでの運用となります。
また、残りのCPUノードについては仮運用期間が終了する1月末頃まで利用可能となる予定です。
そのため、SMALLキューやAPCキューにおいてジョブ実行終了が12/11以降までかかると思われるジョブについては、
nonstop=1 をつけてバッチジョブを実行してください。
このオプションをつけることで停止予定以外のCPUノードにてジョブが実行されます。
このオプションをつけない場合、停止予定のCPUノードも含め、空いている計算ノードにてジョブが実行されます。
12/11以降はこのオプションをつける必要はありません。
指定例:
#PBS -l select=1:ncpus=4:mem=4gb:nonstop=1
計算リソースの減少に伴い、現行システムではバッチジョブが混雑する可能性が高い状態が続くものと想定されます。
ご不便をおかけしますが、ご理解のほどよろしくお願いいたします。
[Q] nonstop=1 をつけないとどうなりますか。
[A] 停止予定のCPUノードでジョブが実行された場合、12/11以降に強制停止されることになります。
[Q] nonstop=1 をつけるとどうなりますか。
[A] 停止予定以外のCPUノードでジョブが実行されます。
(4)</aptmp/(ユーザ名) のファイル整理のお願い>
対象者 : 計算サーバのユーザ(/aptmp/(ユーザ名) を利用されている方)
整理期間 : まだ作業が完了していないユーザも散見されるため期限を延長しています。
最終期限は未定ですが、特にファイルサイズが多いユーザは早めに作業を終了していただくようご協力をお願いします。
内容 : 仮運用開始数日前までの間に、計算サーバの一時領域である /aptmp/ を、新システムの /aptmp/ へコピーする作業を
今後複数回実施します。具体的な作業開始日はまだ未定ですが、作業を迅速に進めるうえでも速やかにユーザ自身でファイルの整理を行い、
コピー対象ファイルサイズの削減にご協力をお願いします。
(/aptmp/(ユーザ名)/の使用量が多いユーザには個別にご連絡させて頂く場合があります)。
/aptmp/(ユーザ名) を利用されている方は、具体的な作業内容についてこちらを必ずご確認ください。
/aptmp/(ユーザ名) を利用されていない方は、何も行う必要はありません。
<<別ウィンドウで表示>>
(5)<共有メモリ型スパコン Superdome Flex の全停止>
実施日 : 2023年12月末頃
内容 : 現行の共有メモリ型スパコン Superdome Flex として運用を継続していた sdf1 についても
仮運用開始直前には完全に停止します。
仮運用
(6)<新システムの仮運用開始>
実施日 : 2024年1月中旬頃
内容 : 共有メモリ型スパコンの一部および分散型スパコンの一部の利用が開始されます。
新システムを利用される場合、新しいログインノードにログインしてご利用ください。
新しいログインノードのホスト名は fe1 となります。
ログイン例:
% ssh fe1.scl.kyoto-u.ac.jp
ジョブスケジューラのバッチキューの名称や計算リソースの制限値については一部変更となる可能性があります。
詳細については後日改めて周知させていただく予定です。
仮運用期間中は、新サーバにて実行されるジョブのCPU/GPUの使用についてはすべて課金の対象外となります。
現行システムにて実行されるジョブのCPU/GPUの使用およびMS/DS利用サービスに対しては従来通り課金対象となります。
(7)<現行システムの分散型スパコンの停止>
実施日 : 2024年1月末頃
内容 : 現行システムの分散型スパコンがすべて停止します。
これにより、現行システムで実行していたジョブもすべて停止され、それと同時に現行システムのログインノード apfe1 へも
ログインできなくなります。現行システムの/aptmp 以下へのアクセスもできなくなります。
したがって、もし /aptmp 以下にジョブの計算結果等を保存している場合には、これ以後、その計算結果を取得することができません。
そのため、現行システムから新システムへコピーする必要のあるファイルが/aptmp 以下にある場合には、
分散型スパコンシステムがすべて停止する前に必ずコピーを行ってください。
(8)<新システムの共有メモリ型スパコンおよび分散型スパコンの全ノード利用開始>
実施日 : 未定
内容 : 新システムのすべての計算ノードが利用開始となります。
仮運用期間中は、新サーバにて実行されるジョブのCPU/GPUの使用についてはすべて課金の対象外となります。
有償アプリケーション
新システムでは利用不可
- Gaussian09
- Reaxys
- SCIGRESS
これまで通り利用可能
- Intel compiler
- Amber
- ADF (宇治地区利用者のみ)
- CSD
- Gaussian16
- GaussView6
- Gaussian&GaussView(Win/Mac/Linux)貸し出しメディア (宇治地区利用者のみ)
- Materials Studio(全モジュール利用可能)
- Discovery Studio(全モジュール利用可能)
- Materials Science Suite (宇治地区利用者のみ)
- Mathematica (宇治地区利用者のみ)
- Q-Chem
新規に利用可能
- Molpro (宇治地区利用者のみ)
- TURBOMOLE (利用者数限定)
(※) 無償のアプリケーションについては利用頻度が少ないなど、特別な理由がなければ現行システムと同じ無償アプリケーションをご利用いただけます。
変更履歴
日付 |
内容 |
2023/8/28 |
初版 |
2023/10/10 |
スケジュール遅延に伴う実施日"未定"への修正 |
2023/11/6 |
ファイルシステム入替作業日の予定追加 |
2023/11/22 |
共有メモリ型スパコン(SDFキュー)の計算ノード(sdf2)の停止 |
2023/11/29 |
分散型スパコンの計算ノードの一部停止 |
ご不明な点などありましたら、スパコンシステムまでお問合せください。