PreDom Help

DiD (View interface)

操作手順

  1. 立体構造分類データベースの選択(Database 欄)
    • ラジオボタンをクリックして使用する立体構造分類データベースを選択します。
  2. 閲覧対象データの指定(Data ID 欄)
    1. "[PDB ID]" に閲覧したい構造データの PDB ID を入力します。
    2. [Find chains] ボタンをクリックすると、指定した PDB ID のデータに含まれるチェーンのリストが隣のプルダウンメニューに生成されるので、その中から対象とするチェーンの ID を選択します。
      (チェーンのリストをクリアするには [Reset] ボタンをクリックします。その際 [PDB ID] 欄も同時にクリアされます。)
  3. 実行
    • [View] ボタンをクリックして実行します。

結果の見方

【左下の表】
指定した ID のデータに含まれるドメインのリストです。
項目名 内容
domainドメイン番号
show表示/非表示の切り替え(チェックを外すと非表示)
scheme of interface residuesドメイン間相互作用残基の表示形式の切り替え
residue numberドメインの範囲(残基番号)
interface area ドメイン間相互作用面の面積(単位:Å2
total:ドメイン間相互作用残基全体
core:コア相互作用残基のみ
【左上領域】
指定したデータの配列です。各ドメインで最も濃い色がコア相互作用残基、中間の色が周辺相互作用残基、最も薄い色が相互作用しない残基です。相互作用残基にマウスオーバーすると、下の interaction residue 欄に残基名及び残基番号が表示されます。
【右図】
指定したデータの立体構造です。最も濃い色がコア相互作用残基、中間の色が周辺相互作用残基です。左の配列で相互作用残基にマウスオーバーすると、その残基が白色に変わって立体構造上の位置を確認できます。
【右図下枠内】
左上の配列の各残基をクリックすると、ここにその残基の情報を表示します。

DiD (Predict interface)

操作手順

  1. 立体構造分類データベースの選択(Database 欄)
    • ラジオボタンをクリックして使用する立体構造分類データベースを選択します。
  2. 予測対象データの指定(Input 欄)
    1. "[PDB format file]" の [選択…] ボタンをクリックし、ドメイン間相互作用部位を予測したい立体構造の PDB データファイルを指定します。
    2. [Find chains] ボタンをクリックすると、指定したデータに含まれるチェーンのリストが隣のプルダウンメニューに生成されるので、その中から対象とするチェーンの ID を選択します。
      (チェーンのリストをクリアするには [Reset] ボタンをクリックします。その際 [PDB ID] 欄も同時にクリアされます。)
  3. パラメータの設定(Parameters 欄)
    • KIP methodの以下のパラメータを必要に応じて変更します。

      Threshold of sequence identity
      配列一致度の閾値。予測対象ドメインとの配列の一致度がこの値以上の既知ドメインを用いてドメイン間相互作用部位を予測します。この値が高くなるほど、結果が進化的により近い類縁関係の既知ドメインに絞られます。
      Threshold of sequence coverage
      配列の被覆率の閾値。予測対象ドメインによる被覆率(配列長の比)がこの値以上の既知ドメインを用いてドメイン間相互作用部位を予測します。この値が高くなるほど、結果が予測対象ドメインと配列長がより近い既知ドメインに絞られます。
      Threshold of sequence coverage
      BLAST実行時のE-valueの閾値。BLAST実行時のパラメータであるE-valueの値が、この値よりも小さい既知ドメインを用いてドメイン間相互作用部位を予測します。この値が小さいほど、より偶然では得られない配列類似性を持つ既知ドメインに絞られます。
    • IP methodの以下のパラメータを必要に応じて変更します。

      Threshold of IP score
      IPスコアの閾値。出現傾向値(ドメイン間相互作用部位での各アミノ酸残基の使われやすさ)にもとづいて計算されるIPスコアが、この値よりも大きいアミノ酸残基をドメイン間相互作用残基の候補とします。この値が大きいほど、ドメイン間相互作用残基の可能性がより高いものを候補とします。
      Threshold of residue contact
      ドメイン間相互作用残基候補どうしの接触の閾値。ドメイン間相互作用残基の候補を構成する原子間の距離がこの値未満の場合に、それらの候補残基は接触していると見なします。この値が大きいほど、予測されるドメイン間相互作用部位が多くなる傾向がありますが、偽陽性も多くなります。
      Minimum size of interface
      ドメイン間相互作用部位の最小の大きさ。接触しているドメイン間相互作用残基の候補の数がこの値よりも小さい場合は、それらをドメイン間相互作用部位とは見なしません。この値が小さいほど、予測されるドメイン間相互作用部位が多くなる傾向がありますが、偽陽性も多くなります。
  4. 実行
    • [Start Prediction] ボタンをクリックしてドメイン間相互作用部位の予測を実行します。

結果の見方

【左下の表】
予測結果リストです。先に KIP 法による結果、その後に IP 法による結果を表示します。
項目名 内容
method予測手法(KIP/IP)
homologous domain相同ドメインID(KIP のみ)。リンクをクリックすると別ウィンドウでそのデータの立体構造及び配列を表示。(配列は予測対象ドメインと比較表示)
Identity/coverage配列一致度/被覆率(KIP のみ)
【左上領域】
予測対象ドメインの配列です。左下表の左端のラジオボタンで選択された予測結果でドメイン間相互作用部位と判定された残基を水色で表示します。水色の残基にマウスオーバーすると、下の interaction residue 欄に残基名及び残基番号が表示されます。
【右図】
予測対象ドメインの立体構造です。ドメイン間相互作用部位を水色 cpk で表示します。左の配列でドメイン間相互作用部位の残基にマウスオーバーすると、その残基が白色に変わって立体構造上の位置を確認できます。
ラベル 操作
[cartoon][cpk]ドメイン間相互作用部位以外の領域の表示形式を切り替える。
[spin]チェックすると構造が自動で回転し、チェックを外すと停止する。
【上端チェックボックス(Definition of interface residues)】
ドメイン間相互作用部位の表示範囲を選択します。
チェックがない場合:
既知ドメインのドメイン間相互作用部位に対応する全ての残基を相互作用部位として表示します。
チェックした場合:
既知ドメインのドメイン間相互作用部位に対応する残基のうち、残基名が既知ドメインと一致した残基のみを相互作用部位として表示します。

DiD (Statistics)

表示内容

2種類の立体構造分類データベース(SCOP、CATH) の代表ドメイン群に関する以下の統計データを掲載しています。

Predict 3D structure of multi-domain proteins

操作手順

予測対象データの種類の指定を行います。"Input type"において、構造予測を行うタンパク質のデータ形式の種類を選択してください。

    FASTA
    FASTA形式のアミノ酸配列をもとにマルチドメインタンパク質の立体構造予測を行います。
    PDB
    ドメインのPDB形式の立体構造データをもとに、それらから成るマルチドメインタンパク質の立体構造予測を行います。

FASTA形式のアミノ酸配列を用いる場合

  1. アミノ酸配列データの指定
    1. "Amino acid sequence in FASTA format"または"FASTA format file"を選択します。
    2. "Amino acid sequence in FASTA format"を選択した場合は、テキスト入力欄に立体構造を予測したいタンパク質のFASTA形式のアミノ酸配列データを入力します。
    3. "FASTA format file"を選択した場合は、立体構造を予測したいタンパク質のFASTA形式のアミノ酸配列データが含まれるファイルを指定します。
  2. 予測の実行

    アミノ酸配列が入力/指定できたら、[Start Prediction]のボタンをクリックします。

  3. 予測結果の表示
    1. 問い合わせ配列とほぼ同じ(配列一致度が95%以上の)立体構造既知タンパク質がある場合  → 3-1
    2. 問い合わせ配列と全長に渡って類似した(配列一致度が25%以上の)アミノ酸配列を持つ立体構造既知タンパク質がある場合  → 3-2
    3. 問い合わせ配列において、立体構造既知のドメイン、もしくはホモロジーモデリングにより立体構造予測可能なドメインが2つある場合  → 3-3
    4. 問い合わせ配列において、立体構造既知のドメイン、もしくはホモロジーモデリングにより立体構造予測可能なドメインが3つ以上ある場合  → 3-4

    1. 問い合わせ配列とほぼ同じ(配列一致度が95%以上の)立体構造既知タンパク質がある場合

      問い合わせ配列とそのタンパク質のBLASTによるアラインメントと、そのタンパク質の立体構造を表示します。
      なお、立体構造ビューアはJmol HTML5オブジェクト(JSmol)を使用しています。画像の上で右クリックすると、各種操作が可能です。詳しい操作法は「Jmolにおけるマウスを使った分子操作のマニュアル(http://wiki.jmol.org/index.php/Mouse_Manual/ja)」をご覧ください。

    2. 問い合わせ配列と全長に渡って類似した(配列一致度が25%以上の)アミノ酸配列を持つ立体構造既知タンパク質がある場合

      そのタンパク質を鋳型としてMODELLERによりホモロジーモデリングを行います。なお、これにはMODELLERのライセンスキーが必要です。

      1. 問い合わせ配列と鋳型タンパク質のBLASTによるアラインメントと、鋳型タンパク質の立体構造は[Show]ボタンをクリックすることにより表示されます。
      2. "Status"の行にある[Click here]をクリックすると、ホモロジーモデリングをする際のJob名、メールアドレス、MODELLERのライセンスキーを入力するウィンドウが表示されます。
      3. 必要事項を入力し、[Run prediction]をクリックするとホモロジーモデリングを開始します。
      4. ホモロジーモデリングが終了すると、実行時に入力したメールアドレスにメールが届きます。メールには予測された立体構造を表示するページのURLが書かれています。
      5. 結果のページにアクセスすると、鋳型タンパク質の情報、予測された立体構造(5種類)、問い合わせ配列と鋳型タンパク質のMODELLERによるアラインメントが表示されます。
      6. 予測された立体構造についてのmolpdf、DOPE score、GA341 scoreが表示されるため、それらの値を参考に予測された立体構造をダウンロードすることができます。
    3. 問い合わせ配列において、立体構造既知のドメイン、もしくはホモロジーモデリングにより立体構造予測可能なドメインが2つある場合

      立体構造予測が可能なドメインについてMODELLERにより立体構造予測を行い、得られたドメインの立体構造を用いてDINEスコアによりそれらの全体構造を予測します。

      1. [Show]ボタンをクリックすることにより、問い合わせ配列と立体構造既知ドメインとのアラインメント、および、立体構造既知ドメインの立体構造が表示されます。もし立体構造予測が可能なドメインの場合は、問い合わせ配列と鋳型タンパク質のアラインメント、および、鋳型タンパク質の立体構造が表示されます。
      2. "Status"の行にある[Click here]ボタンをクリックすると、2つのドメイン共に立体構造既知である場合は、Jobの名前とメールアドレス、DINEスコアのパラメータを入力するウインドウが表示されます。なお、DINEスコアのパラメータについては後述「PDB形式の立体構造データを用いる場合」の「パラメータの設定」を参照してください。
      3. いずれかのドメインについてホモロジーモデリングにより立体構造を予測する場合は、Jobの名前とメールアドレスに加えてMODELLERのライセンスキーの入力が必要です。
      4. 必要事項を入力し、[Run prediction]をクリックすると、ホモロジーモデリングおよびDINEスコアによる全体構造予測を開始します。
      5. 予測が終了すると、実行時に入力したメールアドレスにメールが届きます。メールには予測された立体構造を表示するページのURLが書かれています。
      6. 結果のページにアクセスすると、ホモロジーモデリングによりドメインを予測した場合は予測されたドメインの構造をダウンロードすることができます。また、DINEスコアによる2つのドメインの全体構造予測結果も表示されます。なお、DINEスコアによる全体構造予測結果の見方については後述「DINEスコアによる2ドメインタンパク質の構造予測結果の見方」を参照してください。
    4. 問い合わせ配列において、立体構造既知のドメイン、もしくはホモロジーモデリングにより立体構造予測可能なドメインが3つ以上ある場合

      立体構造予測可能なドメインに対してMODELLERを適用し、各ドメインの構造予測を行います。

      1. [Show]ボタンをクリックすることにより、問い合わせ配列と立体構造既知ドメインとのアラインメント、および、立体構造既知ドメインの立体構造が表示さ れます。もし立体構造予測が可能なドメインの場合は、問い合わせ配列と鋳型タンパク質のアラインメント、および、鋳型タンパク質の立体構造が表示されます。
      2. "Status"の行にある[Click here]ボタンをクリックすると、Jobの名前とメールアドレス、MODELLERのライセンスキーの入力を行うウィンドウが表示されます。
      3. 必要事項を入力し、[Run prediction]をクリックすると、ホモロジーモデリングを開始します。
      4. 予測が終了すると、実行時に入力したメールアドレスにメールが届きます。メールには予測された立体構造を表示するページのURLが書かれています。
      5. 結果のページにアクセスすると、ホモロジーモデリングにより予測したドメインの立体構造をダウンロードすることができます。ドメインが3つ以上の場合の結果の見方については後述「3ドメイン以上のタンパク質の構造予測結果の見方」を参照してください。

PDB形式の立体構造データを用いる場合

  1. 予測対象データの指定
    1. "PDB format file" のいずれかの [ファイルを選択]ボタンをクリックし、元となるドメインの PDB データファイルを指定します。ドメインは10個まで指定できます。
    2. 隣の[Find chains] ボタンをクリックすると、指定したデータに含まれるチェーンのリストがその横のプルダウンメニューに生成されるので、その中から対象とするチェーンの ID を選択します。
    3. 2つ目以降のドメインのデータファイルも、同様に上記の操作で指定します。ただし、複数ファイルのチェーンIDを一度に指定することはできません。また、アップロードする際は、必ずアミノ酸配列のN末側のドメインが上から順に並ぶようにPDBファイルを指定してください。順番通りに入力されていない場合、予測エラーとなります。
    4. 全体構造のアミノ酸配列がわかっている場合は、[Whole amino acid sequence]追加ボタンを押すと、配列を記述することができます。配列はファイルで指定することもできます。
  2. パラメータの設定(Parameters 欄)
    • 以下のパラメータを必要に応じて変更します。
      • Parameters for KIP method
        Threshold of sequence identity(①)
        配列一致度の閾値。配列の一致度がこの値以上のドメインを参照してドメイン間相互作用部位を求めます。
        Threshold of sequence coverage(②)
        配列の被覆率の閾値。被覆率(配列長の比)がこの値以上のドメインを参照してドメイン間相互作用部位を求めます。
        Threshold of BLAST E-value(③)
        BLAST実行時のe-valueの閾値。BLASTのe-valueがこの値よりも小さいドメインを参照してドメイン間相互作用部位を求めます。

        ①と②の値は100%に近く設定するほど、③の値は0に近く設定するほど、より類似したドメインを参照することになり、予測されたドメイン間相互作用部位の信頼性は高くなります。しかし、条件が厳しすぎて参照できるドメインがない場合、予測精度の低いIP methodを用いて予測されたドメイン間相互作用部位を用いることになります。

      • Parameters for IP method
        Threshold of IP score
        IPスコアの閾値。出現傾向値(ドメイン間相互作用部位での各アミノ酸残基の使われやすさ)にもとづいて計算されるIPスコアが、この値よりも大きいアミノ酸残基をドメイン間相互作用残基の候補とします。この値が大きいほど、ドメイン間相互作用残基の可能性がより高いものを候補としますが、候補の数は減少します。
        Threshold of residue contact
        ドメイン間相互作用残基候補どうしの接触の閾値。ドメイン間相互作用残基の候補を構成する原子間の距離がこの値未満の場合に、それらの候補残基は接触していると見なします。この値が大きいほど、予測されるドメイン間相互作用部位が多くなる傾向がありますが、偽陽性も多くなります。
        Minimum size of interface
        ドメイン間相互作用部位の最小の大きさ。接触しているドメイン間相互作用残基の候補の数がこの値よりも小さい場合は、それらをドメイン間相互作用部位とは見なしません。この値が小さいほど、予測されるドメイン間相互作用部位が多くなる傾向がありますが、偽陽性も多くなります。
  3. メール送信設定(Mail 欄)
    • 予測の実行には時間がかかるため、終了したらここで指定されたメールアドレスにメールを送信して通知します。
      "Job name" には実行するジョブを識別する適当な名称、"E-Mail" には送信先のメールアドレスを入力します。
  4. 実行
    • [Start Prediction] ボタンをクリックして 2ドメインタンパクの立体構造の予測を実行します。

DINEスコアによる2ドメインタンパク質の構造予測結果の見方

    画面上部の表:予測結果リスト
    以下の式で表されるDINEスコアの高い方から10個の候補構造を表示します。

    DINE = wdock * Sdock + wint * Sint + wete * Sete

    Sdock,Sint,Seteはそれぞれドメイン間相互作用部位の物理化学的相補性の良さ、予測ドメイン間相互作用部位の使われている割合、統計的なドメイン末端間距離への当てはまり具合に基づいたスコアです。
    wdock,wint,weteのデフォルトの値はそれぞれ7、8、1となっていますが、この領域の中で変更することで、どのような特徴を重視して構造予測を行うかを決めることができます。

予測結果リストの下の領域では、予測結果リストのラジオボタンで選択された候補構造の情報を表示します。

    画面中央左(Result欄):候補構造の配列
    予測されたドメイン間相互作用残基にマウスオーバーすると、下のinteraction residue 欄に残基名及び残基番号が表示されます。また、ドメイン間相互作用残基に関する数値データが凡例中に表示されています。
    画面下部の表(interaction residue欄):候補構造に含まれるドメインのリスト
    項目名 内容
    domain numberドメインの番号
    residue numberドメインの範囲(残基番号)
    show表示/非表示の切り替え(チェックを外すと非表示)
    scheme of predicted interface residuesドメイン間相互作用残基の表示形式の切り替え
    画面中央右(立体構造表示部):候補構造の立体構造表示
    灰色がドメインリンカー、濃い色が予測されたドメイン間相互作用残基です。左の配列でドメイン間相互作用残基にマウスオーバーすると、その残基が白色に変わって立体構造上の位置を確認できます。
    画面中央右(立体構造表示の下):予測構造の数値データとダウンロード
    予測構造のZRANKによる評価結果と、ドメイン末端の距離を表示します。
    また、[Download PDB]をクリックすると表示されている予測構造のPDB ファイルがダウンロードされます。

3ドメイン以上のタンパク質の構造予測結果の見方

3ドメイン以上のタンパク質の構造予測結果では、アミノ酸配列上隣り合う2つのドメインの構造をDINEスコアにより予測し、中央のドメインを重ね合わせた時にドメイン間のぶつかりがないものの組み合わせを選んで、それらのDINEスコアの調和平均の高い方から10個の予測構造を表示します。
画面左上プルダウンメニューで選択された候補構造の情報を表示します。

    画面左(Result欄):候補構造の配列
    予測されたドメイン間相互作用残基にマウスオーバーすると、下の interaction residue 欄に残基名及び残基番号が表示されます。また、ドメイン間相互作用残基に関する数値データが凡例中に表示されています。
    画面下部の表(interactionresidue欄):候補構造に含まれるドメインのリスト
    項目名 内容
    domain numberドメインの番号
    residue numberドメインの範囲(残基番号)
    show表示/非表示の切り替え(チェックを外すと非表示)
    scheme of predicted interface residuesドメイン間相互作用残基の表示形式の切り替え
    画面右(立体構造表示部):候補構造の立体構造表示
    灰色がドメインリンカー、濃い色が予測されたドメイン間相互作用残基です。左の配列で予測されたドメイン間相互作用残基にマウスオーバーすると、その残基が白色に変わって立体構造上の位置を確認できます。
    [Download PDB]をクリックすると表示されている予測構造のPDB ファイルがダウンロードされます。

Evtrace

操作手順

  1. BLAST による相同配列の検索 (Search for homologous sequences by BLAST)

    対象となるデータを入力して BLAST を実行します。

    1. まず、Input 欄の入力データフォーマットを選択します。入力可能なデータフォーマットはPDB ID、PDB 形式のファイル、FASTA 形式の配列データ、FASTA形式のファイルのいずれかです。
    2. PDB ID
      PDBのIDを小文字でテキスト入力欄に入力します。該当するPDB IDがあれば、そのPDBに含まれるchain IDのリストが表示されるので該当するchain IDを選択します。
      PDB format file
      ファイル選択ダイアログを使ってPDB形式の立体構造データのファイルを選択します。
      FASTA format file
      ファイル選択ダイアログを使ってFASTA形式のアミノ酸配列データのファイルを選択します。
      FASTA format text
      FASTA形式のアミノ酸配列データをテキスト入力欄に入力します。
    3. BLAST Parameters 欄で以下の BLAST オプションの設定を行います。
      Database
      検索するデータベース
      E-value
      相同配列の E-value 閾値
    4. [BLAST] ボタンをクリックして BLAST を実行します。
      実行するコマンド: blastp -query (input in FASTA format) -db (database name) -evalue (E-value)
  2. 相同配列に対する進化トレース法の実行 (Homologous sequences to query data)

    画面下部の表に BLAST の検索結果が表示されます(ID のリンクをクリックするとBLASTによるアラインメントを表示)。これらの相同配列のマルチプルアラインメントから近隣結合法に基づいて系統樹を作成し、さらに系統樹上で配列のグルーピングを行います。

    1. 進化トレースの対象とする相同配列を選択します。初期状態では identity・coverage のデフォルトの条件(identity: 20(%), coverage: 90(%))を満たす配列が赤で表示され、左端のチェックボックスで選択されています。identity、coverage の条件を表のプルダウンメニューで変更するか、チェックボックスで個々の配列を選択/選択解除することにより対象とする配列を指定します。
    2. Evtrace parameters 欄で設定を行います。
      Multiple alignment method
      マルチプルアラインメントに使用するプログラムを選択する。使用可能なプログラムは clustalW2、MAFFT のいずれか。
      clustalW2 実行時オプション: -align -infile -outfile
      MAFFT 実行時オプション: --auto --clustalout
    3. [Exec trace] ボタンをクリックして進化トレースを実行します。
  3. 進化トレース法の結果表示 (Results of evtrace)

    進化トレース法の実行結果が表示されます。

  4. 【Parameters】
    配列グルーピング及びトレース残基クラスタリングのパラメータを変更します。
    Tident
    系統樹上の配列グルーピングの閾値。ある枝に含まれる配列間の一致度が全てこの値以上の場合はそれらの配列を同一グループと判定する。ラジオボタンで値を選択すると下の結果表示がこの値に対する結果に切り替わる。
    Tdist
    トレース残基のクラスタリングの閾値。クラスター間の距離がこの値より小さい場合はクラスターを統合する。入力後 [Change] ボタンをクリックするとクラスタリングが再実行される。※[Clustering TRs] 表示時のみ有効
    Tresnum
    トレース残基のクラスタリングの閾値。クラスタリング完了後、含まれる残基数がこの値未満のクラスターは除外する。入力後 [Change] ボタンをクリックするとクラスタリングが再実行される。※[Clustering TRs] 表示時のみ有効

結果の見方

以下の情報をタブクリックで入れ替えて表示します。

【Sequence group】
前画面で指定した配列のグルーピングの結果を配列リストで表示します。
【Multiple alignment (group)】
前画面で選択したプログラムによるマルチプルアラインメントの結果から各配列グループのコンセンサス配列及び入力配列を並べて表示します。下の [Download raw data] ボタンをクリックするとこのアラインメントがファイルとしてダウンロードできます。
【Multiple alignment (sequence)】
前画面で選択したプログラムによるマルチプルアラインメントの結果を表示します。アミノ酸配列は各グループごとに色分けされます。下の [Download the multiple alignment] ボタンをクリックするとこのアラインメントがファイルとしてダウンロードできます。
【Trace residues(TR)】
入力データのアミノ酸配列と立体構造上にトレース残基を表示します。ピンクに色分けされたアミノ酸残基はすべての配列で変化していない部位を、灰色に色分けされたアミノ酸残基はクラス特異的に保存されている部位を示します。
【Clustering TRs】
トレース残基に対して最短距離法によるクラスタリングを行った結果を表示します。クラスタリングされたアミノ酸残基はオレンジで、クラスタリングされなかったアミノ酸残基は青で色付けしています。また、surface accessibility が0.1未満のアミノ酸残基はタンパク質の内部に存在するとして黄色で示し、クラスタリングを行うトレース残基から除外しています。
【Tree】
グルーピングの結果を2つの形式の系統樹で表示します。