DNAエンコードライブラリ(DEL)のスクリーニング原理
DNAエンコードライブラリ(DEL=DNA-Encoded Library)は、一つひとつの低分子に固有のDNA配列(バーコード)をつなぎ、どの化合物がどのバーコードに対応するかを記録した化合物ライブラリです。数億から数十億、場合によってはそれ以上の分子を一本のチューブにまとめ、標的タンパク質への結合を一度の実験で問うことができます。

従来のハイスループットスクリーニング(HTS)は、化合物を一つずつウェルに分けて測ります。DELはこの発想を逆転させ、化合物を混ぜたまま標的に結合させ、結合したものだけを回収して、その正体をDNA配列から読み解きます。標的タンパク質の消費量が少なく、アッセイ開発の負担も小さいことが、難しい標的で採用が広がっている背景です。
一方で、混ぜて選ぶという仕組みには固有の弱点もあります。非特異的な結合や、合成過程で混じる副生成物、そしてDNAそのものが引き起こす見かけの濃縮などが、シグナルにノイズとして重なります。本稿では、DELの作り方から選択・解読の流れ、そして得られた候補(ヒット)をどこまで信じてよいかを判断するための考え方を整理します。
split-and-poolでバーコードを付ける
DELの土台は、split-and-pool(分割と統合)と呼ばれる組み合わせ合成です。反応容器を複数に分け(split)、それぞれに異なる構成要素(ビルディングブロック)と、それを示すDNA配列を結合させ、その後すべてを一つにまとめ(pool)ます。この分割・統合を繰り返すたびに、化合物の多様性とバーコードの記録が同時に積み上がります。
数が膨らむのは組み合わせのためです。1サイクルあたりの分岐数を掛け合わせるので、化合物数はサイクル数に対しておおむね指数的に増えます。
| サイクル数 | 1サイクルの分岐数の目安 | 到達しうるライブラリ規模の目安 |
|---|---|---|
| 2サイクル | 概ね10³ | 概ね10⁶ |
| 3サイクル | 概ね10³ | 概ね10⁸〜10⁹ |
たとえば各サイクルで1,000種類ずつ分岐させ、3サイクル回すと、単純計算で10億規模の化合物に届きます。少ない反応工程で桁違いの多様性を得られる点が、split-and-poolの核心です。
DELの規模はサイクル数に対して指数的に増えます。3サイクルで概ね10⁸〜10⁹規模に届くため、少数の反応工程から膨大な化学空間へアクセスできます。
アフィニティ選択:結合するものだけ残す
作ったライブラリは、標的タンパク質に結合させて選別します。標的をビーズなどに固定し、そこへライブラリを混ぜて結合させ、洗浄で結合しなかった大多数を洗い流し、残った分子を回収します。この一連を アフィニティ選択 と呼びます。
選択の設計にはいくつか勘どころがあります。
- 洗浄の強さ:弱すぎると非特異結合が残り、強すぎると弱い真の結合まで失います。
- 標的の固定法:固定に使うタグやビーズの種類は、それ自体に結合する分子(マトリクス結合体)を拾う原因になります。
- 対照条件:標的を入れない選択や、無関係なタンパク質での選択を並走させ、標的依存でない濃縮を見分けます。
- 選択の回数:複数ラウンド回すと真の結合体が濃縮されやすくなりますが、偏りも増幅されます。
選択はふつう複数の条件を並行して走らせ、後段の解析で条件間を比べます。対照との差こそが、標的に本当に効いた分子を浮かび上がらせる手がかりになります。
PCR増幅とNGSカウント:正体を数える
回収された分子はごく微量です。そこで結合体につながったDNAバーコードをPCRで増幅し、次世代シーケンサー(NGS)で配列を大量に読み取ります。各バーコードが何回読まれたか(カウント)を集計すると、どの化合物が選択で濃縮されたかが見えてきます。
ここで重要なのは、カウントの多さがそのまま結合の強さを意味しない点です。読み取り回数は、合成時の反応収率のばらつき、PCRのバイアス、シーケンスの読み取り誤差など、結合親和性以外の要因にも左右されます。そこで生のカウントを直接比べるのではなく、期待される出現割合に対する濃縮度(fold enrichment)や、それを標準化した指標に置き換えて評価します。
3サイクルのライブラリでは、統計的な取り扱いのために合成単位を階層で見ることがあります。
| 集計の階層 | 内容 | 特徴 |
|---|---|---|
| モノシントン | 1サイクル分の構成要素ごとに集計 | 読み取り数が多く、ノイズに強い |
| ダイシントン | 2サイクル分の組み合わせで集計 | 統計的な確からしさと分解能の中間 |
| トライシントン | 3サイクルすべての組み合わせ(=個々の分子) | 分解能は最も高いが、しばしば著しくアンダーサンプリングされ不確かさが大きい |
個々の分子(トライシントン)は読み取り数が少なく、偶然だけで観測されることも多いため、モノシントンやダイシントンで濃縮の傾向を確かめてから、分子単位の解釈に進むのが安全です。カウントは親和性の代理指標にすぎず、濃縮度への変換と階層的な集計で読み解くのが基本 です。
NGSのカウントは合成収率・PCR・読み取り誤差の影響を受けます。生のカウントではなく、期待割合に対する濃縮度と、モノ/ダイ/トライシントンの階層で評価します。
DEL特有のノイズをどう扱うか
DELのシグナルには、HTSにはない種類のノイズが重なります。混ぜて選ぶ仕組みと、DNAが常に付いていることに由来する問題です。
- 非特異結合・マトリクス結合:標的ではなく、固定用のビーズやタグに結合する分子。対照選択との比較で切り分けます。
- DNA由来の見かけの濃縮:バーコードのDNA自体が固相や標的に相互作用し、化合物の性質とは無関係に濃縮することがあります。
- 合成の副生成物・未完成物:split-and-poolでは、DNA結合した中間体や副生成物をライブラリから取り除けません。目的化合物のふりをした不完全な分子が、シグナルに紛れ込みます。
- 選択・シーケンスの偶然:低頻度の分子ほど、偶然のばらつきで濃縮して見えたり消えたりします。
これらのノイズは、対照条件との比較、複数ラウンド間の再現性、そして階層的な集計で見当をつけられます。ただし配列データの解析だけでは、真の結合体と紛れ込みを完全には区別しきれません。DELの濃縮データは有力な手がかりですが、最終的な結論は配列の外側で確かめる必要があります 。
off-DNAの確認合成でヒットを確かめる
DELで濃縮した化合物は、あくまでDNAが付いた状態での挙動です。実際の創薬に進めるには、バーコードを外した本来の分子(off-DNA)を改めて合成し、独立したアッセイで結合や活性を確認します。この段階を確認合成、あるいはヒット確認(hit confirmation)と呼びます。
off-DNAでの確認には、いくつかの独立した測定を組み合わせます。
| 手法 | 見るもの |
|---|---|
| 表面プラズモン共鳴(SPR) | 結合の速度定数・親和性 |
| 熱シフト・示差走査蛍光(DSF) | 標的の熱安定化から結合を推定 |
| マイクロスケール熱泳動(MST) | 溶液中での結合親和性 |
| 生化学・細胞アッセイ | 実際の活性(阻害など) |
なかでもSPR・BLIによる結合速度・親和性の測定は、ラベルなしに結合の強さと速さを切り分けられるため、off-DNAヒットの一次確認でよく使われます。off-DNAで確認できずに脱落する候補は珍しくありません。時間と資源がかかるため、DNAが付いたまま再合成して結合を確かめる(on-DNAでの再確認)中間ステップを挟み、有望なものだけをoff-DNA合成に回す運用も広がっています。ここで得た結合の強さは、分子の大きさに見合っているかという観点でも評価します。結合の効率を分子サイズで割り引いて見るリガンド効率(LE・LLE)の考え方は、DELヒットを次の最適化へ進めるかどうかの判断にも役立ちます。
DELは膨大な化学空間を安価に探索できる強力な入口ですが、その出力はノイズを含む確率的なシグナルです。配列データで候補を絞り、off-DNAの独立した測定で裏を取る——この二段構えが、DELを実際のリード創出につなげる筋道になります。
まとめ
DELは、低分子にDNAバーコードを付け、split-and-poolで巨大なライブラリを組み立て、アフィニティ選択・PCR増幅・NGSカウントで結合体を読み解く手法です。カウントは親和性の代理指標にすぎず、濃縮度への変換と階層的な集計、対照条件との比較でノイズを見当づけます。そして最終的な確からしさは、off-DNAの確認合成と独立したアッセイで裏付けます。配列で絞り、実物で確かめる。この流れを外さないことが、DELを机上の多様性から実際のヒットへつなぐ鍵です。