1. なぜ「抗体・バイオロジクス×AI」は低分子と違うのか
第3回では、低分子創薬におけるAI活用を見てきました。第4回では、抗体・バイオロジクス(抗体、二重特異抗体、抗体薬物複合体、融合タンパク質など)に焦点を当てます。低分子とは前提条件が大きく異なり、AIに求められる役割も変わってきます。
抗体・バイオロジクスには、例えば次のような特徴があります。
- 構造の複雑さ:数百アミノ酸からなる立体構造・多量体構造・修飾(糖鎖など)
- 「配列」と「立体構造」と「機能」が強く結びつく:わずかな変異で親和性や特異性、安定性が大きく変わる
- 開発しやすさ(developability)の重要性:凝集・粘度・免疫原性・発現性など、製造・製剤まで含めた制約が厳しい
- データ構造が主に「配列」と「構造」:低分子のような「化学構造グラフ」とは異なる表現を取る
AIは、これらの特徴を踏まえながら、配列設計・アフィニティ成熟・特異性制御・developability予測といったタスクを支援します。一方で、実験系・製造プロセス・規制要件との結びつきが強いため、「使い方」を慎重に設計する必要があります。
2. 抗体・バイオロジクス創薬のフローとAIの入りどころ
まず、典型的な抗体・バイオロジクス創薬の流れを簡単に整理し、どこにAIが入ってくるのかを俯瞰します。
- ① ターゲット選定・エピトープ戦略の策定
- ② 抗体取得(ハイブリドーマ、ファージディスプレイ、B細胞スクリーニング等)
- ③ アフィニティ成熟・特異性最適化(配列エンジニアリング)
- ④ Developabilityエンジニアリング(凝集性・粘度・免疫原性・発現性など)
- ⑤ CMC・製造スケールアップ・製剤開発
AIは主に②〜④で活用されますが、近年は①(エピトープ戦略)や⑤(プロセス最適化)にも応用が広がりつつあります。
2-1. 抗体取得(②)でのAI活用
抗体取得の段階では、AIは次のような役割を担います。
- ファージディスプレイやB細胞リパートリーの配列データをクラスタリングし、有望なクローンを絞り込む
- エピトープ情報・構造モデルと組み合わせて、標的に対する結合様式が多様なクローンを選抜する
- 既知の抗体データベースと比較し、新規性やIPリスクを把握する
「とりあえず多数のクローンを評価してから考える」やり方から、「AIで情報量の高いクローンを選び、評価を集中させる」方向へのシフトが進んでいます。
2-2. アフィニティ成熟・特異性最適化(③)
この段階が、AIの寄与が最も分かりやすい領域の一つです。
- CDR領域に導入する変異の候補をAIが提案し、アフィニティと特異性の両方を意識した変異設計を行う
- 配列からアフィニティ・交差反応性・多特異性(polyspecificity)リスクを予測する
- 複数エピトープ候補を比較し、「どのエピトープにフォーカスするか」をAIのスコアリングで支援
従来は「大規模な変異ライブラリを作り、ひたすらスクリーニング」していた部分が、AIによる変異の絞り込み+フォーカスライブラリ設計に置き換わりつつあります。
2-3. Developabilityエンジニアリング(④)
抗体・バイオロジクスでは、開発しやすさ(developability)が極めて重要です。AIは、次のような特性の予測に使われます。
- 凝集性、粘度、液中安定性
- 発現量、精製のしやすさ
- 免疫原性リスク(T細胞エピトープなど)
- 非特異的結合、自己反応性(self-reactivity)
これらをあらかじめ配列段階でスコアリングし、開発しにくい抗体を早期に排除していくことが、実務上の大きな価値になっています。
3. 抗体・バイオロジクスに特有なデータタイプとAIモデル
抗体・バイオロジクスでは、低分子とは異なるデータが中心になります。
3-1. 配列データ(アミノ酸配列)
抗体の場合、重鎖・軽鎖の配列が基本データです。
- フレームワーク領域(FR)とCDR(Complementarity Determining Regions)
- V(D)J再構成パターン、アイソタイプ、サブクラス
- ポジションごとのアミノ酸の頻度・変異許容度
AIモデルとしては、配列を入力とするディープラーニングモデル(LSTM、Transformer、蛋白質専用言語モデルなど)が用いられます。大量の抗体配列で事前学習されたモデルを、個別プロジェクトにファインチューニングする形も増えています。
3-2. 構造・立体情報(3D構造)
抗体・抗原の3D構造情報は、エピトープ・パラトープ解析に不可欠です。
- 抗体単体の構造(Fab、scFvなど)
- 抗原との複合体構造
- 糖鎖や他の修飾、柔軟性・コンフォメーション変化
近年は構造予測手法の進歩により、配列から立体構造の近似モデルを生成し、そこから特徴量を抽出する流れが一般化しつつあります。AIは、これらの構造情報から結合エネルギーや接触パターンを学習し、アフィニティや特異性の予測に活用されます。
3-3. Developability実験データ
開発しやすさに関わる実験データは、AIモデルにとって貴重な教師データになります。
- 熱安定性(Tm)、凝集開始温度
- 高濃度製剤での粘度・粒子数
- 発現量・精製歩留まり
- in vitro/in vivo のクリアランスや分布
これらを配列・構造情報と紐づけて学習させることで、「開発しにくい抗体の特徴」をAIに覚えさせることができます。ただし、社内にしか存在しないデータが多く、データ量が限られる・偏りが大きいという課題があります。
4. 代表的なAI活用パターン:抗体・バイオロジクス編
抗体・バイオロジクスでよく見られるAI活用パターンを、いくつかの軸で整理します。
4-1. 抗体配列の生成と最適化
生成モデルや蛋白質言語モデルを用いて、配列空間を探索・最適化するアプローチです。
- 既存抗体のCDR配列を学習し、その分布から「自然な」変異をサンプリング
- アフィニティ・developabilityを条件として付与した条件付き生成
- 「ヒトらしさ(human-likeness)」を高める方向への配列変換(ヒト化・脱免疫原性)
生成モデルが出力する配列は膨大なため、予測モデルと組み合わせた多段階フィルタリングが実務上のポイントになります。
4-2. アフィニティ・特異性の予測
アフィニティ成熟では、実験で探索可能な変異数に限りがあるため、AIによる優先順位付けが有効です。
- 配列のみからアフィニティを予測するモデル
- 構造情報(抗体単独・抗原複合体)を組み込んだモデル
- オフターゲット結合・交差反応性のリスクスコアリング
現状では「絶対値を完璧に当てる」ことは難しいものの、変異案同士の相対比較には十分使えるケースが増えています。
4-3. Developability予測と設計
Developabilityに関しては、「よくない挙動を早く見抜く」ことにAIの強みがあります。
- 高凝集性・高粘度になりやすい配列の特徴を学習し、事前にフラグを立てる
- 特定のポジションのアミノ酸変異が、安定性や発現性に与える影響を推定
- 免疫原性予測モデルと組み合わせ、T細胞エピトープを減らす方向への配列修正を提案
「開発候補として選んでから、後になって大きな問題に気づく」のを避けるため、候補選定前後でのAIによるスクリーニングが増えています。
4-4. 複雑モダリティ:二重特異抗体・ADC・融合タンパク質
二重特異抗体やADC、サイトカイン・受容体融合タンパク質などの複雑モダリティでは、AIは次のような観点で使われます。
- リンカー部位や構造の設計(ADC、融合タンパク質)
- 各アームのアフィニティ・特異性バランス(二重特異抗体)
- 免疫シグナルの強度・持続性と安全性のバランス
こうしたモダリティでは、パーツ数が多く設計変数も膨大なため、AIによる設計空間の整理とルール抽出が有効です。ただし、データ量の制約がより厳しく、物理モデル・専門家知見とのハイブリッド設計が不可欠です。
5. 抗体・バイオロジクスにおける「できること」と「まだ難しいこと」
ここまで見てきたように、抗体・バイオロジクス領域でもAIの活用余地は大きい一方で、低分子とは異なる限界も存在します。
5-1. できること:配列空間の探索と「悪い候補」を捨てること
現時点で比較的安定して成果が出やすい領域は、次のようなものです。
- 既存クローン周辺の配列空間を、効率的に探索・ランキングする
- 明らかにdevelopabilityリスクが高い配列を早期に除外する
- ヒト化・脱免疫原性の候補案を提案し、実験の試行回数を減らす
低分子と同様、「完璧な最適解をAIが一発で出す」というより、探索空間を絞り、失敗を早く認識することが主戦場になっています。
5-2. まだ難しいこと:エピトープ戦略・免疫複合系の完全なモデリング
一方で、次のようなタスクは、現時点ではまだ人間の知見と物理モデル依存のウェイトが大きい領域です。
- どのエピトープを標的にすべきか(生物学的・臨床的に意味のあるエピトープ戦略)
- 免疫複合体形成やFc機能、エフェクター細胞との相互作用まで含めた統合モデリング
- 希少イベント(重篤な免疫関連有害事象など)の高精度予測
今後、構造予測・マルチスケールシミュレーション・大規模臨床データの統合が進めば、この領域にもAIが深く入ってくる可能性はありますが、短期的には「完全自動化」を期待しすぎない方が現実的です。
5-3. データバイアスと外挿性
抗体データベースには、特定の標的やエピトープに偏ったデータが多く、モデルが「見たことのない標的」にどこまで外挿できるかは常に課題です。また、社内のdevelopabilityデータは特定プラットフォーム・特定フォーマットに偏りがちで、他プロジェクトへの適用には注意が必要です。
6. 抗体・バイオロジクス×AIのKPIと期待値
最後に、抗体・バイオロジクス領域でAIの価値をどう測るか、立場別に整理します。
- 研究現場(抗体エンジニアリングチーム)
・アフィニティ成熟1ラウンドあたりに必要な変異候補数・合成数の削減
・developability問題で「やり直し」になる頻度の低下
・同じ人数・期間で探索できる配列空間の広がり - 本社機能・CMC・製造
・開発中止理由の内訳における「developability起因」の比率変化
・開発後期での製剤・製造上の問題検出のタイミングの前倒し
・プラットフォーム化された抗体エンジニアリング・ developability評価フレームの普及度 - 投資家・コンサル
・単に「AIを使っているか」ではなく、「プラットフォームとして再利用可能な抗体データとモデル」をどれだけ持つか
・二重特異抗体・ADCなど複雑モダリティで、AIを設計思想に組み込めているか
・開発パイプライン全体で、抗体プロジェクトの成功率・スループットがどう変化しているか
KPIを具体的に定めておくことで、「AIのためのAI」ではなく、「開発パイプライン全体の質を上げるためのAI」として投資効果を測りやすくなります。
私の考察と今後の展望
抗体・バイオロジクスの領域では、AIのポテンシャルは非常に大きい一方で、低分子以上に「実験系・製造・規制」と密接に結びついているため、現場の期待値と乖離しやすいと感じています。AIが得意とするのは、配列空間の探索やdevelopabilityリスクの早期検知など、定量化しやすい部分ですが、エピトープ戦略や免疫系全体の制御といった高次の設計は、依然として人間の仮説構築力に大きく依存しています。両者の役割分担を早い段階で整理しておくことが、チーム内の不信感や「AI疲れ」を防ぐうえで重要になっていくでしょう。
今後、蛋白質言語モデルや構造予測・シミュレーション技術がさらに進化すると、「配列→構造→機能→臨床」のチェーンをより一貫した形でモデリングできる可能性が広がります。そのとき、鍵を握るのは、個々のアルゴリズムの優劣ではなく、抗体・バイオロジクスの実験データや製造データをどれだけ体系的に蓄積・統合できているかだと思います。次回以降は、核酸医薬・細胞・遺伝子治療など、さらに複雑なモダリティに目を向けながら、「AIがどこまで共通の設計原理として機能しうるのか」を一緒に考えていきたいと思います。
本記事は、Morningglorysciencesチームによって編集されています。
関連記事







コメント