1. なぜ「核酸・RNA医薬×AI」が重要なのか
mRNAワクチン、siRNA、アンチセンス(ASO)、saRNA、CRISPRガイドRNAなど、核酸・RNA医薬はここ数年で一気に存在感を増しました。このモダリティでは、設計空間の多くが「配列」で表されるため、AIとの相性が非常に良い一方で、次のような独特の難しさがあります。
- 標的 mRNA のアイソフォーム・スプライシング多様性を考慮する必要がある
- オンターゲットだけでなく、全トランスクリプトームレベルでのオフターゲット効果を抑える必要がある
- 二次構造・修飾・キャップ・ポリA など、多数の設計パラメータが絡み合う
- デリバリー(LNP・コンジュゲートなど)が薬効と安全性のボトルネックになりやすい
AIはこれらの多変量な要素を統合し、配列設計・標的選定・デリバリー最適化・安全性予測を支援します。一方で、データの質・量・偏りが結果を大きく左右するため、「何をAIに任せるのか」「どこから先は実験と人間の判断なのか」を慎重に分ける必要があります。
2. 核酸・RNA医薬のバリューチェーンとAIの入りどころ
まず、核酸・RNA医薬の代表的なバリューチェーンを整理し、AIの活用ポイントを俯瞰します。
- ① 疾患・標的遺伝子の選定
- ② モダリティ選択(mRNA, siRNA, ASO, saRNA, CRISPR など)
- ③ 配列設計(オンターゲット活性・オフターゲット抑制)
- ④ 化学修飾・構造要素の設計(修飾・キャップ・UTR・ポリAなど)
- ⑤ デリバリーシステム(LNP, GalNAc, ペプチドコンジュゲートなど)
- ⑥ 安全性・免疫応答の評価
- ⑦ CMC・製造・品質管理
AIは特に③〜⑥で力を発揮しつつ、①②⑦でも徐々に活用が広がっています。
2-1. 標的選定・モダリティ選択(①②)
遺伝子発現データやオミクス情報を統合し、
- どの遺伝子・スプライシングアイソフォームを標的にするか
- siRNA/ASO/mRNA/CRISPR のどのモダリティが合理的か
を評価する段階で、AIは次のように使われます。
- 多次元オミクス(RNA-seq, proteomics, single-cell など)のクラスタリング・因子抽出
- 疾患サブタイプごとの標的のドライバー性・ドラッガビリティの推定
- 既存治療薬・開発パイプラインとのポジショニング評価
この段階では、「AIが標的を決める」というより、複雑なデータから標的候補を絞り込み、仮説の優先順位をつける役割が中心です。
2-2. 配列設計(③):オンターゲット活性とオフターゲットの両立
siRNA・ASO・CRISPRガイドなどでは、配列設計が中核です。AIは次のようなタスクを担います。
- 標的 mRNA 上でのアクセスしやすい部位(開いた二次構造)の予測
- オンターゲットのノックダウン効率・編集効率の予測
- ゲノム・トランスクリプトーム全体に対するオフターゲット結合・編集リスクの予測
ここでは、従来のルールベースなスコアリングに加え、機械学習・深層学習モデルが導入され、配列コンテキストや二次構造情報も取り込んだ精度向上が試みられています。
2-3. 化学修飾・構造要素の設計(④)
mRNA や ASO の世界では、
- 2’修飾(2′-O-Me, 2′-F など)
- バックボーン修飾(ホスホロチオエートなど)
- キャップ構造、5’/3′ UTR、ポリAテールの長さ
といった要素が、安定性・翻訳効率・免疫刺激性に大きく影響します。AIは、
- 修飾パターンと安定性・翻訳効率・免疫応答の関係を学習し、条件に応じた設計案を提案
- UTR 配列と翻訳効率・組織特異性との関係をモデル化
することで、膨大な組み合わせ空間から有望なパターンを絞り込みます。
2-4. デリバリー(⑤)と安全性(⑥)
LNP や GalNAc コンジュゲートなどのデリバリーシステムでは、AIは次のような観点で活用されます。
- 脂質組成・粒径・表面電荷と、組織分布・細胞内取り込み・毒性との関係モデリング
- マルチパラメータ実験(DoE)と組み合わせた最適配合探索
- in vitro/in vivo データを統合した、ヒト外挿モデル構築
安全性では、
- インターフェロン応答などの免疫刺激性の予測
- 肝毒性や補体活性化などのリスクシグナル検知
など、複数の readout を統合して総合リスクスコアを算出する試みが増えています。
3. 核酸・RNA医薬ならではのデータタイプとAIモデル
核酸・RNA医薬では、他モダリティと異なるデータ構造が中心になります。
3-1. 配列・二次構造・モチーフ
基本となるのは DNA/RNA 配列ですが、配列そのものだけでなく、
- 二次構造(ヘアピン、ステムループ、内部ループなど)
- モチーフ(CpG モチーフ、miRNA seed 領域など)
- 局所的な GC 含量、熱力学的安定性
といった情報がオンターゲット活性・オフターゲット・免疫刺激性に直結します。AIモデルには、
- 配列ベースの CNN / Transformer / 言語モデル
- 二次構造情報を組み込んだハイブリッドモデル
などが使われます。
3-2. トランスクリプトーム・オミクスデータ
siRNA/ASO/CRISPR では、オフターゲット評価のために RNA-seq や single-cell RNA-seq などのトランスクリプトームデータが重要です。
- 標的遺伝子と相関する遺伝子ネットワーク
- 治療前後での発現変化パターン
- 細胞型・組織特異的な発現プロファイル
これらを AI に学習させることで、配列設計が細胞レベル・組織レベルでどのような影響を及ぼすかの予測精度向上が期待されます。
3-3. 製剤・製造データ
LNP や製造プロセスから得られるデータも、AIの重要な教師データです。
- 脂質比率・製造条件・粒径・ポリ分散度・表面電位
- バッチごとの安定性・分解プロファイル
- スケールアップ時の歩留まり・品質変動
これらを学習させることで、「ラボスケールでは良かったが、GMP 製造では再現できない」というギャップを早期に察知・回避することができます。
4. 代表的なAI活用パターン:核酸・RNA医薬編
実務の中でよく見られる活用パターンを、いくつかのユースケースとして整理します。
4-1. siRNA/ASO の配列設計
- オンターゲット活性の予測
過去のノックダウンデータを学習し、塩基ごとのミスマッチ許容度やコンテキスト依存性を取り込んだモデルで、候補配列をスコアリングします。 - オフターゲット予測
ゲノム・トランスクリプトームと照合し、seed 領域の部分相補性などを考慮してリスクを推定します。AIは単なるマッチングにとどまらず、「どの程度のミスマッチがどの細胞型で問題になりやすいか」といったコンテキストも学習します。
4-2. mRNA ワクチン・mRNA医薬の設計
mRNA では、AIは次のような点で利用されます。
- コドン最適化:単純な「宿主に多いコドンを使う」だけではなく、翻訳速度・フォールディング・免疫刺激性を総合的に考慮したコドン使用パターンの設計。
- UTR・ポリA の設計:5’/3′ UTR 配列と翻訳効率、組織特異性、mRNA 安定性との関係をモデル化し、目的に応じた UTR パターンを提案。
- 抗原設計:構造モデル・免疫エピトープ情報と組み合わせた抗原配列の最適化。
4-3. CRISPR ガイドRNAの設計
CRISPR では、オンターゲット編集効率とオフターゲットの両方を同時に最適化する必要があります。
- 配列と周辺コンテキストからオンターゲット編集効率を予測
- ゲノム全体に対するオフターゲット候補サイトを列挙し、編集リスクをスコアリング
- 複数のガイド候補を比較し、「効率が高く、かつオフターゲットリスクが低い」ガイドを選択
モデルは、in vitro データに加え、細胞種や染色体コンテキストに依存する要素も取り込もうとする方向に進化しています。
4-4. LNP・デリバリー配合の最適化
脂質組成や製造条件を変えた多数の実験データから、AIが次のような関係を学習します。
- 脂質比率と粒径・PDI・表面電位
- 粒子特性と in vivo 分布・臓器選択性・毒性
- 製造パラメータと再現性・スケールアップ性能
これにより、DoE(実験計画法)+AI で探索空間を圧縮し、限られた実験で有望な配合に到達しやすくなります。
5. 核酸・RNA医薬における「できること」と「まだ難しいこと」
5-1. できること:配列と条件の組み合わせ空間を整理する
現時点でAIが比較的得意なのは、次のような領域です。
- 膨大な配列候補から、「明らかにダメな候補」を落とし、「有望な候補」にリソースを集中させる
- 修飾・UTR・デリバリー条件など、多数のパラメータの組み合わせ空間を圧縮する
- オンターゲット・オフターゲット・免疫刺激性といった複数指標を多目的最適化する
つまり、AIは「探索空間を構造化し、優先順位をつける」ことで価値を出しやすいと言えます。
5-2. 難しいこと:全身レベルの薬理・安全性を事前に「当てる」こと
一方で、次のようなことを高精度で予測するのは、まだ困難です。
- 個体差・免疫状態・併用薬などを含む中での、全身レベルの薬物動態と薬力学
- 人間での稀な重篤有害事象(例:希少な免疫関連合併症)
- 長期投与時の慢性的な安全性リスク
in vitro/in vivo データとヒトデータの「ギャップ」を埋めるモデル開発は進んでいますが、短期的には、AIの予測はリスクを分類・層別化するための補助情報として扱う方が現実的です。
5-3. データバイアスとプラットフォーム依存性
核酸・RNA医薬のデータは、企業ごとのプラットフォーム(特定のLNP、修飾セット、製造設備など)に大きく依存することが多く、他社・他プロジェクトへの外挿には注意が必要です。
- 自社データで高精度に見えるモデルが、他条件では性能低下する
- データ収集が一部条件に偏り、モデルが特定範囲外では誤った自信を示す
このため、「どの範囲ならモデルを信頼できるのか」という適用範囲(domain of applicability)の明示が重要になります。
6. R&D・本社機能・投資家から見たKPIと期待値
核酸・RNA医薬×AIの価値を測るには、立場ごとに異なるKPIが必要です。
- R&Dチーム
・設計→合成→評価までの1ループに必要な配列数・実験数の削減
・同じ時間・人員で探索できる配列・条件空間の拡大度合い
・探索初期の段階で、オンターゲット・オフターゲット・免疫刺激性に関する主要な失敗要因をどれだけ潰せているか - 本社機能・CMC・製造
・スケールアップ・製造上のトラブルが発生するタイミングの前倒し(早期検知)
・モデルを複数プロジェクトで再利用できる「プラットフォーム」としてどこまで整備できているか
・製造コスト・歩留まり・品質変動と AI 活用の相関 - 投資家・コンサル
・アルゴリズムだけでなく、「核酸・RNA医薬に特化したデータ資産」のユニークさと量
・LNP・GalNAc・修飾ライブラリなど、プラットフォームとして再利用できる知識の厚み
・他社と比べたときの、「配列→製剤→ヒト」の一貫したモデリング力
KPIが曖昧なまま「AI投資」だけが先行すると、数年後に「結局なにが改善したのか」が見えにくくなります。核酸・RNA医薬のような新しいモダリティほど、最初からKPIと期待値を言語化しておくことが重要です。
私の考察と今後の展望
核酸・RNA医薬は、配列設計という意味ではAIと非常に相性が良い一方で、「トランスクリプトーム全体への影響」や「デリバリー・免疫応答を含む全身レベルのふるまい」まで視野に入れると、一気に難易度が上がるモダリティです。現状、AIが安定して価値を発揮しやすいのは、オンターゲット・オフターゲット・免疫刺激性・LNP配合など、多数の設計変数を整理し、探索空間を圧縮する領域です。一方で、ヒトでの長期安全性や個体差の問題は、まだデータとモデルの両面でギャップが大きく、注意深い解釈が欠かせません。
今後、より大規模なトランスクリプトーム・リアルワールドデータ・製造データが整備されれば、「配列→細胞→臓器→個体」というスケールをまたぐモデリングが現実味を帯びてくるはずです。そのとき、優位性を決めるのは特定アルゴリズムではなく、いかに早い段階からデータ設計とAI設計を一体で考えてきたか、という組織の姿勢そのものだと考えています。次回以降は、細胞・遺伝子治療など、さらに複雑なモダリティに進みながら、「AIでどこまで統合的な設計を狙うのか」を一緒に整理していきたいと思います。
本記事は、Morningglorysciencesチームによって編集されています。
関連記事








コメント