中級者向け - ディープラーニング実装経験必須

タンパク質構造予測のためのディープラーニング

受講料 ¥385,000
残席数 4
タンパク質構造予測のためのディープラーニング

プログラム内容

学習内容

  • 週1-3:タンパク質データの取得と前処理パイプライン構築
  • 週4-6:CNNによる二次構造予測モデルの実装
  • 週7-10:注意機構と接触マップ予測
  • 週11-14:トランスフォーマーモデルの構築と訓練
  • 週15-18:三次元構造生成とエネルギー最小化
  • 週19-24:独自モデルの設計と最終プロジェクト
技術スタック
PyTorch、Biopython、NumPy、PyMOL
計算環境
提供されるクラウドGPU(Tesla V100相当)
コミット時間
週12-15時間

詳細説明

AlphaFoldの登場で構造生物学は大きく変わりました。でも、モデルの中身を理解せずにただ使うだけでは限界があります。このコースでは、注意機構、畳み込みニューラルネットワーク、そしてトランスフォーマーアーキテクチャを使った構造予測の実装を学びます。

PyTorchを使って、配列から二次構造、接触マップ、そして三次元座標を予測するモデルを段階的に構築します。PDB(Protein Data Bank)のデータを前処理し、特徴量エンジニアリングを行い、モデルの訓練から評価までの一連のパイプラインを作ります。

実際に手を動かす時間が中心です。週ごとに小さなモデルを実装し、性能を改善していきます。最終的には、ProteinNet データセットを使って、自分で設計した構造予測モデルを訓練します。計算リソースはクラウドGPU環境を提供します。

前提知識:Pythonでのニューラルネットワーク実装経験、線形代数の基礎、タンパク質化学の基本的な理解。GPUプログラミングの経験は不要です。