(注:このページは古いバージョンの情報になります。最新版はこちらをご覧下さい。) AlphaFold2 は DeepMind社が開発したタンパク質立体構造予測プログラムです。 利用方法$ module load AlphaFold/2.2.3 $ run_alphafold.sh # オンラインヘルプの表示 $ run_alphafold.sh -o outdir -f input.fa -t 2022-03-12実行コマンドは run_alphafold.sh です(これは AlphaFold2 の非Docker版実行スクリプトを当スパコンシステム向けに改修したものです)。 必須オプション -o <output_dir> Path to a directory that will store the results. -f <fasta_path> Paths to FASTA files, each containing a prediction target that will be folded one after another. If a FASTA file contains multiple sequences, then it will be folded as a multimer. Paths should be separated by commas. All FASTA paths must have a unique basename as the basename is used to name the output directories for each prediction. (a comma separated list) -t <max_template_date> Maximum template release date to consider (ISO-8601 format - i.e. YYYY-MM-DD <= 2022-03-12). Important if folding historical test sets.その他のオプション -n <openmm_threads> OpenMM threads (default: 8) --model_preset=<monomer|monomer_casp14|monomer_ptm|multimer> Choose preset model configuration (default: monomer) - monomer : the monomer model - monomer_casp14 : the monomer model with extra ensembling - monomer_ptm : monomer model with pTM head - multimer : multimer model --num_multimer_predictions_per_model <int> How many predictions (each with a different random seed) will be generated per model. E.g. if this is 2 and there are 5 models then there will be 10 predictions per input. Note: this FLAG only applies if model_preset=multimer (default: '5')(注1) run_alphafold.py のオプションも指定可能です。 (注2) hhblitsの使用コア数は4,hmmsearch, jackhmmerの使用コア数は8で決め打ちですが、OpenMM の使用コア数は -n オプションで指定可能です(デフォルトは8)。 より進んだ利用方法AlphaFold2 の全オプションを指定可能な実行コマンド run_alphafold.py もあります。利用法はオンラインヘルプ $ run_alphafold.py $ run_alphafold.py --helpshort $ run_alphafold.py --helpfullをご覧下さい。 (参考1) run_alphafold.sh コマンドのジョブ $ run_alphafold.sh -o outdir -f input.fa -t 2022-03-12と同等の run_alphafold.py コマンドのジョブは以下の様になります。 PREFIX=/usr/appli/freeware/AlphaFold/2.2.3 export OPENMM_CPU_THREADS=8 run_alphafold.py \ --output_dir=outdir \ --fasta_paths=input.fa \ --max_template_date=2022-03-12 \ --db_preset=full_dbs \ --model_preset=monomer \ --data_dir=${PREFIX}/data \ --bfd_database_path=${PREFIX}/data/bfd/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt \ --mgnify_database_path=${PREFIX}/data/mgnify/mgy_clusters.fa \ --template_mmcif_dir=${PREFIX}/data/pdb_mmcif/mmcif_files \ --obsolete_pdbs_path=${PREFIX}/data/pdb_mmcif/obsolete.dat \ --uniclust30_database_path=${PREFIX}/data/uniclust30/uniclust30_2018_08/uniclust30_2018_08 \ --uniref90_database_path=${PREFIX}/data/uniref90/uniref90.fasta \ --pdb70_database_path=${PREFIX}/data/pdb70/pdb70 \ --hhblits_binary_path=/usr/bin/hhblits \ --hhsearch_binary_path=/usr/bin/hhsearch \ --jackhmmer_binary_path=/usr/bin/jackhmmer \ --kalign_binary_path=/usr/bin/kalign (参考2) run_alphafold.sh コマンドのジョブ $ run_alphafold.sh -o outdir -f input.fa -t 2022-03-12 --model_preset=multimerと同等の run_alphafold.py コマンドのジョブは以下の様になります。 PREFIX=/usr/appli/freeware/AlphaFold/2.2.3 export OPENMM_CPU_THREADS=8 run_alphafold.py \ --output_dir=out \ --fasta_paths=input.fa \ --max_template_date=2022-03-12 \ --db_preset=full_dbs \ --model_preset=multimer \ --data_dir=${PREFIX}/data \ --bfd_database_path=${PREFIX}/data/bfd/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt \ --mgnify_database_path=${PREFIX}/data/mgnify/mgy_clusters.fa \ --template_mmcif_dir=${PREFIX}/data/pdb_mmcif/mmcif_files \ --obsolete_pdbs_path=${PREFIX}/data/pdb_mmcif/obsolete.dat \ --uniclust30_database_path=${PREFIX}/data/uniclust30/uniclust30_2018_08/uniclust30_2018_08 \ --uniref90_database_path=${PREFIX}/data/uniref90/uniref90.fasta \ --uniprot_database_path=${PREFIX}/data/uniprot/uniprot.fasta \ --pdb_seqres_database_path=${PREFIX}/data/pdb_seqres/pdb_seqres.txt \ --hhblits_binary_path=/usr/bin/hhblits \ --hhsearch_binary_path=/usr/bin/hhsearch \ --jackhmmer_binary_path=/usr/bin/jackhmmer \ --kalign_binary_path=/usr/bin/kalign 補足事項
ライセンスAlphaFoldのソースコードのライセンスは Apache License, Version 2.0 です。モデルパラメータのライセンスは Creative Commons Attribution 4.0 International (CC BY 4.0) で商用利用も可能になりました。 関連ページ
|