PreDom Help

Predict 3D structure of multi-domain proteins

操作手順

予測対象データの種類の指定を行います。"Input type"において、構造予測を行うタンパク質のデータ形式の種類を選択してください。

    FASTA
    FASTA形式のアミノ酸配列をもとにマルチドメインタンパク質の立体構造予測を行います。
    PDB
    ドメインのPDB形式の立体構造データをもとに、それらから成るマルチドメインタンパク質の立体構造予測を行います。

FASTA形式のアミノ酸配列を用いる場合

  1. アミノ酸配列データの指定
    1. "Amino acid sequence in FASTA format"または"FASTA format file"を選択します。
    2. "Amino acid sequence in FASTA format"を選択した場合は、テキスト入力欄に立体構造を予測したいタンパク質のFASTA形式のアミノ酸配列データを入力します。
    3. "FASTA format file"を選択した場合は、立体構造を予測したいタンパク質のFASTA形式のアミノ酸配列データが含まれるファイルを指定します。
  2. 予測の実行

    アミノ酸配列が入力/指定できたら、[Start Prediction]のボタンをクリックします。

  3. 予測結果の表示
    1. 問い合わせ配列とほぼ同じ(配列一致度が95%以上の)立体構造既知タンパク質がある場合  → 3-1
    2. 問い合わせ配列と全長に渡って類似した(配列一致度が25%以上の)アミノ酸配列を持つ立体構造既知タンパク質がある場合  → 3-2
    3. 問い合わせ配列において、立体構造既知のドメイン、もしくはホモロジーモデリングにより立体構造予測可能なドメインが2つある場合  → 3-3
    4. 問い合わせ配列において、立体構造既知のドメイン、もしくはホモロジーモデリングにより立体構造予測可能なドメインが3つ以上ある場合  → 3-4

    1. 問い合わせ配列とほぼ同じ(配列一致度が95%以上の)立体構造既知タンパク質がある場合

      問い合わせ配列とそのタンパク質のBLASTによるアラインメントと、そのタンパク質の立体構造を表示します。
      なお、立体構造ビューアはJmol HTML5オブジェクト(JSmol)を使用しています。画像の上で右クリックすると、各種操作が可能です。詳しい操作法は「Jmolにおけるマウスを使った分子操作のマニュアル(http://wiki.jmol.org/index.php/Mouse_Manual/ja)」をご覧ください。

    2. 問い合わせ配列と全長に渡って類似した(配列一致度が25%以上の)アミノ酸配列を持つ立体構造既知タンパク質がある場合

      そのタンパク質を鋳型としてMODELLERによりホモロジーモデリングを行います。なお、これにはMODELLERのライセンスキーが必要です。

      1. 問い合わせ配列と鋳型タンパク質のBLASTによるアラインメントと、鋳型タンパク質の立体構造は[Show]ボタンをクリックすることにより表示されます。
      2. "Status"の行にある[Click here]をクリックすると、ホモロジーモデリングをする際のJob名、メールアドレス、MODELLERのライセンスキーを入力するウィンドウが表示されます。
      3. 必要事項を入力し、[Run prediction]をクリックするとホモロジーモデリングを開始します。
      4. ホモロジーモデリングが終了すると、実行時に入力したメールアドレスにメールが届きます。メールには予測された立体構造を表示するページのURLが書かれています。
      5. 結果のページにアクセスすると、鋳型タンパク質の情報、予測された立体構造(5種類)、問い合わせ配列と鋳型タンパク質のMODELLERによるアラインメントが表示されます。
      6. 予測された立体構造についてのmolpdf、DOPE score、GA341 scoreが表示されるため、それらの値を参考に予測された立体構造をダウンロードすることができます。
    3. 問い合わせ配列において、立体構造既知のドメイン、もしくはホモロジーモデリングにより立体構造予測可能なドメインが2つある場合

      立体構造予測が可能なドメインについてMODELLERにより立体構造予測を行い、得られたドメインの立体構造を用いてDINEスコアによりそれらの全体構造を予測します。

      1. [Show]ボタンをクリックすることにより、問い合わせ配列と立体構造既知ドメインとのアラインメント、および、立体構造既知ドメインの立体構造が表示されます。もし立体構造予測が可能なドメインの場合は、問い合わせ配列と鋳型タンパク質のアラインメント、および、鋳型タンパク質の立体構造が表示されます。
      2. "Status"の行にある[Click here]ボタンをクリックすると、2つのドメイン共に立体構造既知である場合は、Jobの名前とメールアドレス、DINEスコアのパラメータを入力するウインドウが表示されます。なお、DINEスコアのパラメータについては後述「PDB形式の立体構造データを用いる場合」の「パラメータの設定」を参照してください。
      3. いずれかのドメインについてホモロジーモデリングにより立体構造を予測する場合は、Jobの名前とメールアドレスに加えてMODELLERのライセンスキーの入力が必要です。
      4. 必要事項を入力し、[Run prediction]をクリックすると、ホモロジーモデリングおよびDINEスコアによる全体構造予測を開始します。
      5. 予測が終了すると、実行時に入力したメールアドレスにメールが届きます。メールには予測された立体構造を表示するページのURLが書かれています。
      6. 結果のページにアクセスすると、ホモロジーモデリングによりドメインを予測した場合は予測されたドメインの構造をダウンロードすることができます。また、DINEスコアによる2つのドメインの全体構造予測結果も表示されます。なお、DINEスコアによる全体構造予測結果の見方については後述「DINEスコアによる2ドメインタンパク質の構造予測結果の見方」を参照してください。
    4. 問い合わせ配列において、立体構造既知のドメイン、もしくはホモロジーモデリングにより立体構造予測可能なドメインが3つ以上ある場合

      立体構造予測可能なドメインに対してMODELLERを適用し、各ドメインの構造予測を行います。

      1. [Show]ボタンをクリックすることにより、問い合わせ配列と立体構造既知ドメインとのアラインメント、および、立体構造既知ドメインの立体構造が表示さ れます。もし立体構造予測が可能なドメインの場合は、問い合わせ配列と鋳型タンパク質のアラインメント、および、鋳型タンパク質の立体構造が表示されます。
      2. "Status"の行にある[Click here]ボタンをクリックすると、Jobの名前とメールアドレス、MODELLERのライセンスキーの入力を行うウィンドウが表示されます。
      3. 必要事項を入力し、[Run prediction]をクリックすると、ホモロジーモデリングを開始します。
      4. 予測が終了すると、実行時に入力したメールアドレスにメールが届きます。メールには予測された立体構造を表示するページのURLが書かれています。
      5. 結果のページにアクセスすると、ホモロジーモデリングにより予測したドメインの立体構造をダウンロードすることができます。ドメインが3つ以上の場合の結果の見方については後述「3ドメイン以上のタンパク質の構造予測結果の見方」を参照してください。

PDB形式の立体構造データを用いる場合

  1. 予測対象データの指定
    1. "PDB format file" のいずれかの [ファイルを選択]ボタンをクリックし、元となるドメインの PDB データファイルを指定します。ドメインは10個まで指定できます。
    2. 隣の[Find chains] ボタンをクリックすると、指定したデータに含まれるチェーンのリストがその横のプルダウンメニューに生成されるので、その中から対象とするチェーンの ID を選択します。
    3. 2つ目以降のドメインのデータファイルも、同様に上記の操作で指定します。ただし、複数ファイルのチェーンIDを一度に指定することはできません。また、アップロードする際は、必ずアミノ酸配列のN末側のドメインが上から順に並ぶようにPDBファイルを指定してください。順番通りに入力されていない場合、予測エラーとなります。
    4. 全体構造のアミノ酸配列がわかっている場合は、[Whole amino acid sequence]追加ボタンを押すと、配列を記述することができます。配列はファイルで指定することもできます。
  2. パラメータの設定(Parameters 欄)
    • 以下のパラメータを必要に応じて変更します。
      • Parameters for KIP method
        Threshold of sequence identity(①)
        配列一致度の閾値。配列の一致度がこの値以上のドメインを参照してドメイン間相互作用部位を求めます。
        Threshold of sequence coverage(②)
        配列の被覆率の閾値。被覆率(配列長の比)がこの値以上のドメインを参照してドメイン間相互作用部位を求めます。
        Threshold of BLAST E-value(③)
        BLAST実行時のe-valueの閾値。BLASTのe-valueがこの値よりも小さいドメインを参照してドメイン間相互作用部位を求めます。

        ①と②の値は100%に近く設定するほど、③の値は0に近く設定するほど、より類似したドメインを参照することになり、予測されたドメイン間相互作用部位の信頼性は高くなります。しかし、条件が厳しすぎて参照できるドメインがない場合、予測精度の低いIP methodを用いて予測されたドメイン間相互作用部位を用いることになります。

      • Parameters for IP method
        Threshold of IP score
        IPスコアの閾値。出現傾向値(ドメイン間相互作用部位での各アミノ酸残基の使われやすさ)にもとづいて計算されるIPスコアが、この値よりも大きいアミノ酸残基をドメイン間相互作用残基の候補とします。この値が大きいほど、ドメイン間相互作用残基の可能性がより高いものを候補としますが、候補の数は減少します。
        Threshold of residue contact
        ドメイン間相互作用残基候補どうしの接触の閾値。ドメイン間相互作用残基の候補を構成する原子間の距離がこの値未満の場合に、それらの候補残基は接触していると見なします。この値が大きいほど、予測されるドメイン間相互作用部位が多くなる傾向がありますが、偽陽性も多くなります。
        Minimum size of interface
        ドメイン間相互作用部位の最小の大きさ。接触しているドメイン間相互作用残基の候補の数がこの値よりも小さい場合は、それらをドメイン間相互作用部位とは見なしません。この値が小さいほど、予測されるドメイン間相互作用部位が多くなる傾向がありますが、偽陽性も多くなります。
  3. メール送信設定(Mail 欄)
    • 予測の実行には時間がかかるため、終了したらここで指定されたメールアドレスにメールを送信して通知します。
      "Job name" には実行するジョブを識別する適当な名称、"E-Mail" には送信先のメールアドレスを入力します。
  4. 実行
    • [Start Prediction] ボタンをクリックして 2ドメインタンパクの立体構造の予測を実行します。

DINEスコアによる2ドメインタンパク質の構造予測結果の見方

    画面上部の表:予測結果リスト
    以下の式で表されるDINEスコアの高い方から10個の候補構造を表示します。

    DINE = wdock * Sdock + wint * Sint + wete * Sete

    Sdock,Sint,Seteはそれぞれドメイン間相互作用部位の物理化学的相補性の良さ、予測ドメイン間相互作用部位の使われている割合、統計的なドメイン末端間距離への当てはまり具合に基づいたスコアです。
    wdock,wint,weteのデフォルトの値はそれぞれ7、8、1となっていますが、この領域の中で変更することで、どのような特徴を重視して構造予測を行うかを決めることができます。

予測結果リストの下の領域では、予測結果リストのラジオボタンで選択された候補構造の情報を表示します。

    画面中央左(Result欄):候補構造の配列
    予測されたドメイン間相互作用残基にマウスオーバーすると、下のinteraction residue 欄に残基名及び残基番号が表示されます。また、ドメイン間相互作用残基に関する数値データが凡例中に表示されています。
    画面下部の表(interaction residue欄):候補構造に含まれるドメインのリスト
    項目名 内容
    domain numberドメインの番号
    residue numberドメインの範囲(残基番号)
    show表示/非表示の切り替え(チェックを外すと非表示)
    scheme of predicted interface residuesドメイン間相互作用残基の表示形式の切り替え
    画面中央右(立体構造表示部):候補構造の立体構造表示
    灰色がドメインリンカー、濃い色が予測されたドメイン間相互作用残基です。左の配列でドメイン間相互作用残基にマウスオーバーすると、その残基が白色に変わって立体構造上の位置を確認できます。
    画面中央右(立体構造表示の下):予測構造の数値データとダウンロード
    予測構造のZRANKによる評価結果と、ドメイン末端の距離を表示します。
    また、[Download PDB]をクリックすると表示されている予測構造のPDB ファイルがダウンロードされます。

3ドメイン以上のタンパク質の構造予測結果の見方

3ドメイン以上のタンパク質の構造予測結果では、アミノ酸配列上隣り合う2つのドメインの構造をDINEスコアにより予測し、中央のドメインを重ね合わせた時にドメイン間のぶつかりがないものの組み合わせを選んで、それらのDINEスコアの調和平均の高い方から10個の予測構造を表示します。
画面左上プルダウンメニューで選択された候補構造の情報を表示します。

    画面左(Result欄):候補構造の配列
    予測されたドメイン間相互作用残基にマウスオーバーすると、下の interaction residue 欄に残基名及び残基番号が表示されます。また、ドメイン間相互作用残基に関する数値データが凡例中に表示されています。
    画面下部の表(interactionresidue欄):候補構造に含まれるドメインのリスト
    項目名 内容
    domain numberドメインの番号
    residue numberドメインの範囲(残基番号)
    show表示/非表示の切り替え(チェックを外すと非表示)
    scheme of predicted interface residuesドメイン間相互作用残基の表示形式の切り替え
    画面右(立体構造表示部):候補構造の立体構造表示
    灰色がドメインリンカー、濃い色が予測されたドメイン間相互作用残基です。左の配列で予測されたドメイン間相互作用残基にマウスオーバーすると、その残基が白色に変わって立体構造上の位置を確認できます。
    [Download PDB]をクリックすると表示されている予測構造のPDB ファイルがダウンロードされます。