細胞治療の効力試験(ポテンシーアッセイ)設計
細胞治療プロセス解説

細胞治療の効力試験(ポテンシーアッセイ)設計

低分子でも抗体でも、出荷の可否を決める試験のなかで「効くこと」の証明は、たいてい最後まで悩みの種になる。ところが細胞治療では、それが桁違いに難しい。何しろ製品が生きていて、患者ごとに顔つきが違い、しかも保存期間は数時間ということも珍しくないからだ。

先に結論を言う。細胞治療の効力試験(ポテンシーアッセイ)は、「一発で効力を測る魔法の指標」を探す作業ではない。作用機序を分解し、そのどこを測れば効力を代表できるかを設計し、複数の指標を組み合わせて出荷判断に耐える形にまとめ上げる——そういう設計の仕事だ。この記事では、その勘所を実務の順番でたどる。

そもそも、なぜ細胞の「効力」は測りにくいのか

まず素朴な問いから。抗体なら「抗原にどれだけ強く結合するか」を測れば効力の大半が説明できる。ではなぜ、細胞では同じようにいかないのか。

理由は、細胞が「単一の分子」ではなく「振る舞う主体」だからだ。抗体は構造が決まれば機能もほぼ決まる。ところが細胞は、投与された先の環境に応じて増える・移動する・別の物質を出す・他の細胞に指令を送る、といった複数の役者を同時に演じる。効力が一本の軸で表せない。

しかも、その役者たちは互いに絡み合っている。たとえばCAR-T細胞なら、がん細胞を「見つける(結合)」→「殺す(細胞傷害)」→「増える(増殖)」→「疲弊せず続ける(持続性)」という連鎖で効いていく。どれか一つを測れば足りる、とは言いにくい。ここが最初の壁だ。

そして製品そのものがばらつく。自家(患者本人由来)の細胞治療では、原料が患者の細胞そのものだから、ロットごとに出発点が違う。健康なドナー由来の医薬品原薬とは根本的に前提が異なる。自家と同種の設計思想の違いは自家・同種細胞治療の製造で整理したとおりで、効力試験の作りやすさにも直結する。

最後に時間。多くの細胞治療は凍結せず、あるいは解凍後すぐに投与される。出荷判定に使える時間が極端に短い場合、「何日もかけて答えが出る試験」はそもそも成立しない。つまり細胞の効力試験は、生物学の難しさと、時間の制約と、原料のばらつきという三つの重石を同時に背負っている。

出発点は「作用機序」——効力の地図を描く

では、どこから手をつけるか。答えは一つ、作用機序(MoA)から始める、だ。効力試験の設計は指標選びから入ってはいけない。まず「この製品はどういう理屈で効くのか」を言葉で書き切ることから始まる。

なぜ機序が先か。指標を先に選ぶと、「測りやすいから測る」に流れてしまうからだ。測れることと、効力を代表することは別物だ。機序を地図にして初めて、「この道(指標)は効力の本筋を通っているか、それとも脇道か」を判断できる。

機序を書くときは、効力を段階に分解するのがコツだ。細胞治療なら、おおむね次のような役者に分けられる。

  • 標的を認識する(結合・ホーミング)
  • 直接はたらく(細胞傷害、あるいは分泌物による作用)
  • 増える・生き延びる(増殖・持続性)
  • 周囲を動かす(サイトカインなどによる免疫調節・組織修復の指令)

たとえば免疫を活性化して効くCAR-Tと、逆に免疫や炎症を鎮めることで効く間葉系幹細胞(MSC)とでは、測るべき「効力の本筋」が正反対になる。MSCの効力を細胞傷害で測ってもナンセンスだし、CAR-Tの効力を抗炎症サイトカインで測っても的外れだ。だから機序の地図が要る。この地図づくりは重要品質特性を洗い出す作業と地続きで、細胞治療の重要品質特性(CQA)の考え方とセットで進めると筋が通る。

規制の側も、この順番を強く推している。効力は作用機序に関連づけて評価すべし、という考え方は各極のガイダンスに共通する土台だ。裏を返せば、機序と無関係な指標をいくら並べても「効力を測った」とは認めてもらいにくい、ということでもある。

機序と指標をつなぐ——何を測れば効力を代表できるか

地図が描けたら、次の問い。その各段階を、どんな測定でとらえるか。

ここで指標を大きく三つの層に分けて考えると整理しやすい。

一つ目は生物学的機能を直接みる層。CAR-Tなら実際にがん細胞株を殺す割合(細胞傷害活性)、樹状細胞ワクチンならT細胞を活性化する能力、といった「効力そのものに近い」試験だ。効力の代表性は高い。ただし手間と時間、ばらつきも大きい。生きた標的細胞を使う試験は、標的側のコンディションでも数字が動くからだ。

二つ目は分泌物や表現型をみる層。細胞が出すサイトカインの量、表面マーカーの発現量、遺伝子発現のパターンなど。機能そのものではないが、機能とよく相関する「効力の足跡」を測る。フローサイトメトリーやイムノアッセイで比較的速く、定量的に取れるのが強みだ。

三つ目は組成・生存をみる層。目的の細胞がどれだけの割合いるか(純度・同一性)、生きているか(生存率)。これは効力の前提条件であって効力そのものではない。生きた細胞が十分な純度でいなければ効きようがない、という土台の確認だ。

ここで注意したいのが、この三層の役割の違いだ。生存率や純度は「効力に必要だが、それだけでは効力を保証しない」。生きていても機能していなければ意味がないからだ。効力試験は、機能に踏み込んだ指標(一つ目・二つ目の層)を必ず含む——ここを外すと、いくら試験項目が並んでいても「効力を測っていない」ことになる。純度や生存率がなぜ効力の前提にとどまるのかは、純度とは何かや不純物の考え方とあわせて押さえておきたい。

実務では、速くて安定な指標(二つ目・三つ目)を日常の出荷試験に据えつつ、機能の直接測定(一つ目)を要所で担保する、という組み合わせに落ち着くことが多い。次の二つの節で、その「組み合わせ方」を掘り下げる。

代替指標(サロゲート)という現実解——ただし橋渡しが要る

正直に言おう。機能を直接測る効力試験は、しばしば重すぎる。時間がかかり、ばらつき、標的細胞という「もう一つの生きもの」を管理し続けねばならない。凍結しない製品では、答えが出る前に投与時刻が来てしまう。

そこで登場するのが代替指標(サロゲートマーカー)だ。機能そのものではなく、機能と強く結びついた速い指標——たとえば特定サイトカインの分泌量や、活性化マーカーの発現——を効力の代理として使う。

ここで多くの人がつまずく。「代替指標に切り替えれば楽になる」と考えてしまうことだ。ところが話は逆で、代替指標を使うほうがむしろ立証の負荷は増える。なぜか。

代替指標は「それ自体が効力である」わけではないからだ。だから「その指標が動けば効力も動く」という橋渡しを、データで示さないといけない。この橋渡しがサロゲートの肝だ。具体的には、機能を直接測る試験(レファレンスとなる強い効力試験)と代替指標を並行して走らせ、両者が相関することを示す。

  • 効力が高い試料では代替指標も高い、効力が低ければ代替指標も低い、という関係を実データで確認する
  • できれば、意図的に効力を落とした試料(熱処理などで壊した細胞)でも相関が崩れないことを見る
  • 相関が確認できて初めて、日常試験では速い代替指標に置き換えてよい、という論理が立つ

要するに代替指標は「近道」ではなく、「橋を架けたうえで通る速い道」だ。橋の建設(相関の立証)を省くと、規制当局から「それは本当に効力を測っているのか」と必ず問われる。ここを甘く見ないことが、後戻りを避ける最大のポイントになる。

一本で足りないなら束ねる——マトリクスアプローチ

ここまでで、勘のいい読者はこう思ったはずだ。「機序が複数の役者からなるなら、指標も一本では足りないのでは?」——そのとおり。ここでマトリクスアプローチが出てくる。

マトリクスアプローチとは、単一の効力試験にこだわらず、機序の各段階をそれぞれ別の指標でカバーし、それらを組み合わせて全体として効力を担保する考え方だ。一枚の完璧な写真の代わりに、複数のアングルから撮った写真を束ねて全体像を再構成する、と考えるとつかみやすい。

なぜこれが理にかなうのか。理由は二つある。

まず、細胞の効力はそもそも多面的だった。結合・傷害・増殖・持続、あるいは分泌・免疫調節。一本の指標でこの全部を代表するのは無理がある。ならば各面を分担させたほうが、効力の実像に近づく。

もう一つは頑健さだ。単一指標に全てを賭けると、その試験が不調のときに出荷判断が止まる。生きた標的を使う試験は、ときに理由不明で数字が暴れる。複数の指標で支えておけば、全体としての判断がぶれにくい。

ただし、束ねれば束ねるほどいい、という話ではない。ここに落とし穴がある。

  • 指標を増やすほど、各指標の規格(合否ライン)の設定と、複数結果をどう統合して合否を出すかの論理が複雑になる
  • 相関の弱い指標や機序と関係の薄い指標を混ぜると、「たくさん測っている」だけで効力の代表性はむしろ薄まる
  • 各指標が独立に何を保証しているのかを説明できないと、規制側に「なぜこの組み合わせなのか」を問われて答えに詰まる

だから実務では、「機序の地図」に立ち返って、各指標がどの段階を担当し、なぜその束で効力全体を代表できるのかを一枚のロジックで説明できる状態を目指す。指標の数ではなく、機序をどれだけ抜けなく覆えているかで設計する。これはCAR-Tのように機序が明快な製品ほど組み立てやすく、CAR-T細胞の製造プロセスの各工程とひもづけて考えると、どの段階の効力をどこで担保するかが見えてくる。

出荷判定と安定性——数値化・規格・時間との戦い

効力を「測れる」ようにしたら、最後の関門は「合否を出せる」ようにすることだ。ここで質が変わる。研究の効力測定と、出荷を左右する効力試験の決定的な違いは、定量性にある。

なぜ定量が必須か。出荷判定は「効いた/効かなかった」の二択ではなく、「規格の範囲に入っているか」の判断だからだ。そのためには、効力を数値で、しかも再現よく出せなければならない。ここで効いてくるのが標準品(レファレンス)の存在だ。試料の効力を毎回ゼロから絶対値で測るのは難しいので、「基準となる試料に対して何%の効力か」という相対値で表す。ものさしを持つ、ということだ。

このとき欠かせないのがアッセイのバリデーション(妥当性確認)だ。具体的には次を押さえる。

  • 直線性・範囲——効力が高い試料も低い試料も、測定値がちゃんと比例して動くか(頭打ちや底打ちしない範囲はどこか)
  • 精度——同じ試料を繰り返し測って、どれだけばらつくか(生細胞を使う試験は本質的にばらつきやすいので、許容範囲の設定が現実的か)
  • 頑健性——オペレーターや日、標的細胞のロットが変わっても結果が安定するか

分析法バリデーションの土台となる考え方(直線性・精度・特異性など)は、分析法バリデーションにも通じる汎用の枠組みで、効力試験もその例外ではない。むしろ生細胞ゆえに、ばらつきの管理がいっそう重くのしかかる。

そして規格。合否ラインは「なんとなくの下限」で決めてはいけない。臨床で効いた製品がどのくらいの効力値だったか(できれば臨床効果と結びつく範囲)を根拠に、下限を設定していくのが筋だ。開発初期はデータが薄いので暫定的な範囲から始まり、ロットが積み上がるにつれて規格を締めていく。効力試験の規格は「最初から完成品」ではなく「育てるもの」だと捉えるほうが実態に合う。

最後に安定性、そして時間の壁だ。効力は保存や輸送で落ちる。だから安定性試験では、期間を通じて効力が規格内にとどまることを確認し、有効期間を裏づける。ここで凍結しない製品の宿命がのしかかる。有効期間が数時間・数日という世界では、時間のかかる効力試験は出荷判定に間に合わない。だからこそ、前の節で述べた「速い代替指標+橋渡しの立証」や「マトリクスの中で速い指標に日常判定を担わせる」という設計が、机上論ではなく死活問題になる。効力試験の設計は、生物学だけでなく、コールドチェーンと時計との戦いでもある。品質と時間の両立という点で、細胞の凍結保存とコールドチェーンの制約とも表裏一体だ。

まとめ

細胞治療の効力試験は、「効力を一発で測る指標を探す」作業ではなく、「効力を代表できる測定系を設計する」仕事だ。要点を短くまとめる。

  • 出発点は指標ではなく作用機序。効力を段階(認識・作用・増殖持続・免疫調節など)に分解し、地図を描いてから測定を割り当てる。
  • 指標は「機能を直接みる/分泌物・表現型でみる/組成・生存でみる」の三層。効力試験は機能に踏み込んだ指標を必ず含む。純度・生存率は前提であって効力そのものではない。
  • 重い機能試験の代わりに代替指標を使うなら、機能試験との相関を実データで示す「橋渡し」が必須。近道ではなく、橋を架けて通る速い道。
  • 機序が多面的ならマトリクスアプローチで各段階を分担させる。ただし指標の数ではなく、機序をどれだけ抜けなく覆えるかで設計する。
  • 出荷判定には定量性・標準品・バリデーション・規格が要る。規格は育てるもの。そして凍結しない製品では、効力試験は時間との戦いでもある。

生きた製品の効力を、時間と原料のばらつきのなかで、数値として保証する——この設計をやり切れるかどうかが、細胞治療の品質を支える背骨になる。

目次・関連閉じる
編集メモ:この記事はProglenth編集部が、細胞治療に関する基礎的な情報を、はじめての方にも分かるように整理したものです。実際の製造方法・管理戦略・品質基準は、製品や企業、各国の規制によって異なります。本記事は一般的な解説であり、特定製品の推奨や規制・医療上の助言ではありません。実務で判断される際は、各極の薬局方・ガイドライン(ICH/GMP等)やメーカーの一次情報を必ずご確認ください。内容に誤りやご指摘があればお問い合わせからお知らせください。
Newsletter

バイオプロセスの最新を、メールで。

新着の解説記事と製品ニュースを、月数回お届けします。実務に役立つ一次情報を、日本語で。いつでも解除できます。

登録によりプライバシーポリシーに同意したものとみなします。