ザッカーバーグとチャンのバイオハブが構造を予測し、治療用タンパク質を開発する強力な AI を発表

Mark Zuckerberg

Mark Zuckerberg - 写真Field / Shutterstock.com

マーク・ザッカーバーグとプリシラ・チャンによって設立された会社 Biohub は、新しい高度な人工知能モデルの発売を発表しました。このテクノロジーは、治療においてより有用かつ正確な分子構造を設計することを目的として、タンパク質の生物学を深く研究するために注意深く訓練されています。この取り組みの公式発表は同社の Web サイトで直接行われ、生物医学研究における重要な一歩を示しました。

タンパク質は生命にとって不可欠な成分であり、酸素を体中に運び、ウイルスの侵入者と戦うなど重要な役割を果たします。それらはまた、筋肉の形成、細胞の調節、免疫システムの強化の基礎であり、幅広い生物学的プロセスを調整します。しかし、複雑な構造の予測が進歩したにもかかわらず、多くのタンパク質はいまだ完全には研究されておらず、その特定の機能は科学の謎のままです。

新世代の進化的ラダー モデル (ESM)

同社は、「進化的スケール モデル」の頭字語である新世代の進化的スケール モデル (ESM) を導入しています。この革新的なシステムは、自然進化をシミュレートするプロセスを通じてタンパク質配列から学習します。この固有の知識は、タンパク質をデジタル的に表現、マッピング、予測し、さらに重要なことに、より正確に設計するために使用されます。

    ESM システムは 3 つの主要な成果物を中心に構成されており、それぞれが特定の補完的な機能向けに設計されています。
  • ESMFold2: タンパク質の三次元構造の予測に優れた最先端のモデルであり、望ましい特性を備えた新しいタンパク質を設計するための基礎となります。
  • ESM アトラス: 68 億のタンパク質配列と、以前に予測された 11 億の構造をカタログ化し、膨大な生物学的データベースを作成する包括的なマップ。
  • ESMC: 生命の多様性全体から収集された約 28 億のタンパク質配列を基に細心の注意を払ってトレーニングされた最先端のタンパク質言語モデルで、分子の理解を強化します。

Biohub が発表した情報によると、この AI モデルは、特定の分子標的に結合できるタンパク質の開発を大幅に支援する機能を備えています。この技術は、革新的な治療法を成功させるために不可欠な特性である、高い結合親和性を備えたタンパク質を設計することができます。最初の結果は、腫瘍学と免疫学の分野で関連性の高い 5 つの標的に対して検証されました。同社は、これがタンパク質設計の分野における変革の瞬間であり、医薬品の開発方法に革命をもたらす可能性があると強く信じています。

ESMCモデルの動作メカニズム

ESMC は、その起源は 2019 年に遡る、進行中の研究プログラムの最新の集大成です。当時、科学者チームは、タンパク質配列の分析に特化して設計された初のトランスフォーマー アーキテクチャ ベースの言語モデルの開発に成功しました。このモデルの集中的なトレーニング プロセスは、タンパク質の複雑な生物学を支配する固有の基本特性を内部化することを目指します。

これらの特性には、タンパク質がどのように折り畳まれて特定の三次元形状になるか、またタンパク質が細胞環境内で他の分子とどのように相互作用するかを決定する重要な規則が含まれています。さらに、このモデルは、これらのタンパク質が重要な生物学的機能をどのように実行するかを理解しようとします。これらのメカニズムを予測して理解する能力は、治療や産業用途に向けた新しいタンパク質の操作と設計に向けた決定的な一歩となります。

タンパク質は複雑な高分子であり、その基本構造はアミノ酸の直鎖で構成されています。これらのアミノ酸が特定の配列で集まると、ほぼ無制限の広大な範囲の構造の組み合わせを形成することができます。鎖内のこれらのアミノ酸の特定の順序は、分子の折り畳みを独特で高度に特異的な三次元配置に導く決定要因となります。

この特定の三次元構造は、タンパク質が生物体内で実行する正確な生物学的機能を正確に定義するものです。研究の初期段階で、研究者らは関連する発見をした。開発されたモデルは、単なるアミノ酸配列を超えた情報を学習および処理できるというものだ。彼らは、これまで明示的に実証されなかった、またはトレーニング中にモデルに教えられたことのない特性を含む、タンパク質の構造と生物学的機能をコード化する能力を実証しました。

治療の可能性と精密医療

タンパク質の複雑な生物学的パターンを徹底的に学習した後、人工知能モデルは、これらの分子の三次元形状を高精度で予測する驚くべき能力を実証しました。彼は構造の予測に加えて、その重要な生物学的機能を解読し、さらに革新的なことに、新しいタンパク質を生成することに成功しました。このプロセス全体は計算環境内で完全に行われるため、研究が大幅にスピードアップします。

これらの高度な機能は、将来の医療用途に大きな変革をもたらす可能性を秘めています。モデルの助けを借りて、強度と選択性の理想的な組み合わせで特定の分子標的に結合するタンパク質の設計がより現実に近づきます。これは、時間と労力がかかる古典的な生化学的アプローチよりも大幅に迅速な方法で、より大きな治療の可能性を開発できる可能性を意味します。

この技術の進歩は、特にがんに対して使用される抗体などのタンパク質に基づく治療法を開発するという現在のシナリオを考慮する場合、非常に重要です。現在、科学者は、どの特定のタンパク質が正しい標的に結合するかを特定し、さらにこの結合が正確かつ効果的に起こることを確認するためにかなりの時間を費やさなければなりません。これは、高度に個別化された治療を追求する、いわゆる「プレシジョン・メディシン」の基礎です。

しかし、タンパク質の発見と検証の従来のプロセスは、非常にコストがかかり、多くの場合時間がかかることが広く知られています。 Biohub の人工知能を使用すると、短時間で膨大な数のタンパク質を仮想的にシミュレートすることができます。このテクノロジーは、特定の標的に対してどれが最も効果的であるかを予測し、新薬の研究開発にかかるリソースと時間を大幅に最適化します。

腫瘍学および免疫学における検証と試験

開発されたシステムの機能と有効性を経験的に検証するために、バイオハブの研究者は、がん、腫瘍増殖、免疫系の複雑な機能に直接関連する一連のタンパク質を選択しました。 EGFR、PD-L1、CTLA-4などの臨床的に関連するターゲットが選択されました。これらは、いくつかの腫瘍学的および免疫学的病理において重要なバイオマーカーであり、重大な課題を表しています。

次に、人工知能は数万の候補タンパク質を生成するように指示されました。この大規模なプロセスは約 2 日で完了し、主な目的は、これらのタンパク質のどれが、以前に選択した特定の標的に対して最良の相互作用と親和性を示すかをテストすることでした。続いて、計算システムは、生成されたタンパク質のうちどれが最も安定しており、実行可能で安全な治療法に発展する可能性が最も高いかを計算しました。

詳細な研究結果は、人工知能に適用される計算能力の向上により、タンパク質設計の成功率が大幅に向上したことを示しています。この最適化は、従来のアプローチを使用すると、必要な精度でそれぞれの標的に結合することがより困難であると考えられている抗体の場合に特に注目に値し、重要でした。これは、計算によるアプローチに固有のスケーラビリティと有効性を示しています。

その後、人工知能によって設計および選択された最高のパフォーマンスを発揮するタンパク質が、実際の生物学的条件をシミュレートする厳密な実験室テストを受けました。それらの中には、定義されたターゲットに正しく結合する効果的な能力が証明されているものもあります。さらに、それらは望ましい安定性を示し、具体的な治療可能性と将来の薬剤候補としての実行可能性を証明しました。

Biohub は、病気は共通の生物学的パターンに従いますが、その大部分には個別の特徴があり、個別のアプローチが必要であることを強調しています。がんや希少疾患などの特定の疾患に対して、この技術を直ちに適用できる可能性は非常に大きく、有望です。同社は、ESM モデルが臨床的に関連する 5 つの標的に対して実験室で検証されたタンパク質リガンドを数日で設計できることを実証しました。この取り組みにより、医薬品開発プロセスの初期段階の速度が大幅に変わり、高度なツールへのアクセスが民主化されます。

こちらも参照