1. なぜ「低分子×AI」がAI創薬の実験場になっているのか
AI創薬の事例や論文を眺めると、まず目につくのが低分子創薬での応用です。これは単に「歴史が長いから」というだけでなく、次のような理由があります。
- 化合物構造をSMILESやグラフとして扱えるため、機械学習の入力として扱いやすい
- HTSやプロファイリングなど、過去数十年分の大量の活性データが蓄積されている
- QSARなどの「前AI時代」の手法がすでに定着しており、AIの延長線として導入しやすい
- 合成・測定の自動化と相性がよく、Design–Make–Test–Analyze(DMTA)サイクルを高速化しやすい
つまり、低分子領域は「データがあり、表現方法が確立しており、AIによる効率化余地が大きい」という意味で、AI創薬の実験場になりやすい領域です。本稿では、その中でもヒット探索〜リード最適化にフォーカスします。
2. 低分子創薬の典型的フローとAIが入るポイント
まず、低分子創薬の典型的な流れを簡単におさらいし、どこにAIが入りうるかを整理します。
- ① ターゲット選定・標的バリデーション
- ② 化合物ライブラリ設計
- ③ ヒット探索(HTS / バーチャルスクリーニング)
- ④ ヒット・シリーズ選択(Hit-to-Lead)
- ⑤ リード最適化(MPO、ADMET最適化、候補選定)
①のターゲット探索は、第1回・第2回で扱ったオミクスやネットワーク解析の領域と重なります。ここでは、②〜⑤でのAI活用に絞ります。
2-1. 化合物ライブラリ設計
ライブラリ設計では、AIは次のような役割を担います。
- 既存ライブラリのケミカルスペースのカバレッジ評価
- 過去の成功/失敗データに基づいた「良いケミストリー」「避けるべき構造」の学習
- ターゲットやモダリティを意識したフォーカスライブラリ設計
単純な「多様性重視」から、「疾患・標的を意識した情報量重視」のライブラリへ移行していく中で、AIによるスペース解析やクラスタリングが活きてきます。
2-2. ヒット探索:HTSとバーチャルスクリーニング
ヒット探索では、AIは次のような形で使われています。
- HTSの前に、ライブラリからスクリーニング候補を事前に絞り込む(バーチャルスクリーニング)
- HTS後に、ノイズを含むデータから「本物らしいヒット」をリスコアリングする
- 構造ベースのドッキング結果にAIを組み合わせ、物理モデル+学習ベースでスコアリング精度を上げる
ここでのAIの主な価値は、「ヒット数を増やす」というより、スクリーニングのコストと時間を削減しつつ、見落としを減らすことにあります。
2-3. ヒット・シリーズ選択(Hit-to-Lead)
ヒットが見つかった後の段階では、AIは次のような問いに答えるために使われます。
- どのシリーズ(スキャフォールド)を戦略的に深掘りすべきか
- 類似シリーズ間で、どちらが中長期的な最適化余地が大きいか
- 早い段階で、毒性・ADMETリスクの高いシリーズを捨てるべきか
これは、単にIC50の良し悪しで比較するのではなく、「将来のMPOを加味したポテンシャル評価」としてAIを使うイメージです。
2-4. リード最適化とMPO
リード最適化では、AIはDesign–Make–Test–Analyze サイクルの「Design」と「Analyze」を強化します。
- 次に合成すべき候補構造を提案(生成モデル+予測モデル)
- 活性・選択性・ADMET・合成容易性などを統合したスコアリング
- シリーズ内の構造–活性相関(SAR)の可視化と仮説生成
ポイントは「AIが勝手に最適な分子を見つけてくる」のではなく、人間が持つ戦略・制約条件を反映させながら探索を加速することにあります。
3. 低分子のための代表的なAIアプローチ
ここでは、低分子向けに使われる代表的なAIアプローチを、目的別に整理します。
3-1. 「QSAR再発明」:予測モデルの高度化
QSARの枠組み自体は古くからありますが、近年は
- 分子記述子+古典的機械学習(Random Forest, XGBoost など)
- 分子グラフ+GNN
- SMILESや自己回帰モデル+Transformer
などを用いて、より柔軟・高精度な予測が可能になっています。
タスクは多岐にわたり、
- ターゲット活性予測
- オフターゲット活性・安全性フラグの予測
- 溶解性・透過性・クリアランスなどのADMET予測
など、ヒット〜リード最適化の各段階で使われます。
3-2. 構造ベース手法:ドッキング+AI
タンパク質構造がわかっている場合、ドッキングやMD(分子動力学)にAIを組み合わせるアプローチが取られます。
- ドッキングスコアをAIでリスコアリングし、バーチャルスクリーニングの精度を上げる
- タンパク質–リガンド複合体の3D情報から、結合親和性や選択性を学習する
- ポケット特性のクラスタリングから、新しい結合様式やアロステリックサイトを示唆する
物理ベースと学習ベースを組み合わせることで、両者の弱点(物理モデルの近似とデータ駆動モデルの外挿問題)を相殺しようとする試みです。
3-3. デ・ノボ分子設計と生成AI
生成モデルは、新しい構造を提案する役割を担います。代表的な使い方は次の通りです。
- 既存シリーズ周辺の局所探索(SARを踏まえた「もう一歩先」の案)
- 化学空間のギャップを埋めるスキャフォールドホッピング
- 特定のターゲット・物性制約を付けた条件付き生成
実務では、生成された分子のうちごく一部しか合成・評価されないため、化学的妥当性・合成容易性・安全性リスクを事前にフィルタリングする手順が重要になります。
3-4. レトロシンセシスと合成容易性予測
AIは、「その分子をどう作るか」という問いにも活用されます。
- レトロシンセシスモデルによる合成ルート提案
- 合成容易性スコア(SAスコア)による候補の事前フィルタリング
- 保護基戦略やスケールアップを意識したルートのランキング
これにより、「理論上は魅力的だが、現実には作れない(あるいはコストが見合わない)」分子をあらかじめ避けることで、DMTAサイクル全体を効率化できます。
4. 実務での活用シナリオ:具体的なユースケース
ここでは、実際のプロジェクトを想定したユースケースをいくつか列挙します。
- ユースケース1:HTS前の「プレ・バーチャルスクリーニング」
公開データと社内アッセイを学習したモデルでライブラリをスコアリングし、HTS対象を絞り込む。
→ HTSプレート数を削減しつつ、ヒットの多様性を確保。 - ユースケース2:Hit-to-Lead段階でのシリーズ選択
活性だけでなく、予測ADMET・オフターゲット・合成容易性を含めたスコアリングでシリーズを比較。
→ 「短期的にきれいな数字が出るシリーズ」ではなく、「中長期でMPOしやすいシリーズ」を選べる。 - ユースケース3:MPOのナビゲーション
累積データから、構造–特性の傾向を可視化し、「この方向に構造変換すると溶解性が落ちやすい」「このポジションの改変は毒性リスクにつながりやすい」などのヒントを提示。
→ ケミストの直感を補完し、試行錯誤の無駄打ちを減らす。 - ユースケース4:安全性フラグの早期検知
過去の毒性データやオフターゲットプロファイルから学習し、危険シグナルが強い構造を早期にフラグ。
→ 後工程での「大きなやり直し」を減らすことに貢献。 - ユースケース5:パテントスペースとケミカルスペースの両方を意識したデザイン
特許情報と構造情報を統合し、「既存特許から距離がありつつ、有望な領域」をAIで探索。
→ IP戦略と創薬戦略の接続にAIを活用。
5. 低分子AIの「できること」と「まだ難しいこと」
低分子領域はAIの成功例が多い一方で、限界もはっきりしています。
5-1. 「化合物を早く捨てる」には強い
現時点でのAIの強みは、どちらかというと「良いものを当てる」より「悪いものを早く捨てる」ことにあります。
- 明らかに毒性リスクが高い構造
- ADMET的に無理筋なプロファイル
- 既に何度も失敗しているスキャフォールド
これらを早い段階でふるい落とし、研究リソースをより有望な候補に集中させることは、短期的にも中長期的にもROIが高い戦略です。
5-2. 「まったく新しいメカニズムを発想する」ことは、まだ人間側の役割が大きい
一方で、「誰も考えていなかったターゲットと、誰も見ていなかった結合様式を、AIが勝手に見つけてくる」という段階にはまだ達していません。現実には、
- 人間が仮説を立て(例:このタンパク質のこの部位を狙いたい)
- AIがその仮説空間の中で探索・最適化を行う
という役割分担が主流です。
「仮説空間の設計」と「探索空間の優先順位付け」という2つの仕事のうち、後者はAIが得意ですが、前者はまだ人間の創造性と生物学の深い理解が必要です。
5-3. 合成・スケールアップ・製剤など、下流の現実
たとえAIが魅力的な分子を設計しても、
- 実際の合成ルートが現場のケミストにとって現実的か
- スケールアップしても安定性・不純物プロファイルが許容範囲か
- 製剤化・製造コストの観点で持続可能か
といった「下流の現実」が立ちはだかります。ここを考慮せずにAIを運用すると、「コンピュータの中では理想的だが、現場では回らない」設計が量産されてしまいます。
6. KPIと期待値の置き方:R&D・本社機能・投資家の視点
低分子×AIの成功・失敗は、立てるKPIによって評価が大きく変わります。
- R&Dチーム:
・DMTAサイクル1周あたりの時間短縮
・合成・アッセイされた化合物数あたりの「意味のある学び」の増加
・候補化合物に到達するまでの総合コスト - 本社機能(経営企画・DX):
・パイプライン全体で、AI導入領域と未導入領域の生産性差
・複数プロジェクトへの横展開度(再利用可能なプラットフォームかどうか)
・人材ポートフォリオ(ケミスト×データサイエンティストの構成) - 投資家・コンサル:
・競合と比べた「AI活用の深さ」だけでなく、「データ資産の質とユニークさ」
・AI企業の場合は、「アルゴリズム」以上に「データアクセスと統合の優位性」
・製薬の場合は、AI投資が具体的なプロジェクト成果にどの程度結びついているか
こうしたKPIを最初から明確にしておかないと、「AIを使っていること自体」が目的化し、数年後に「結局何が変わったのか」がよくわからない、という状況に陥りがちです。
私の考察と今後の展望
低分子×AIの現場感として強く感じるのは、「AIができること」と「AIがやるべきでないこと」を早い段階で切り分けた組織ほど、着実に成果を積み上げているという点です。AIは、探索空間の優先順位付けや「悪い候補を早く捨てる」ことに非常に向いていますが、ターゲット選定やメカニズムの発想まで丸ごと代替できるわけではありません。むしろ、人間の仮説構築能力とAIの探索能力をどう組み合わせるかが、チームごとの差になってきているように思います。
今後は、生成モデルやファンデーションモデルが進化するにつれて、「構造を作るAI」と「合成や製造の現実」をどうつなぐか、という課題がますます重要になります。合成・製剤・製造の現場との距離が近いAIプラットフォームほど、中長期的には優位に立つ可能性があります。本シリーズの次回以降では、抗体やペプチド、核酸、細胞・遺伝子治療など他モダリティにも視野を広げつつ、低分子で学んだ教訓がどこまで通用し、どこから設計思想を変える必要があるのかを、一つひとつ検証していきたいと思います。
本記事は、Morningglorysciencesチームによって編集されています。
関連記事






コメント