سال گذشته دیپ مایند، زیرمجموعه آلفابت یک مخزن داده با دسترسی آزاد از ساختارهای سه‌بعدی صدها هزار پروتئین از جمله ۲۰هزار پروتئین شناخته شده در بدن انسان را ارائه کرد. حالا این شرکت با ارائه آپدیت جدیدی از مخزن داده خود که شامل حدود ۲۱۴میلیون ساختار پروتئین مربوط به یک میلیون گونه است، گام جدید در مسیر تحول این پروژه برداشته است. این مخزن تقریبا شامل هرنوع پروتئین شناخته‌شده در علم است و به تحقیقات درباره درمان بیماری، تولید واکسن، حفظ محیط زیست، مقابله با مقاومت در برابر آنتی بیوتیک و حتی آلودگی پلاستیکی نیز کمک شایانی می‌کند. حجم کل مخزن داده ساختار پروتئین بیش از ۲۵ترابایت است که از طریق google cloud public datasets  قابل دانلود است. پروتئین‌ها در حقیقت جورکش سلول‌های زنده هستند و تعدادی از فرآیندهای ناشناخته زیست شناختی حیاتی را انجام می‌دهند. آنها از زنجیره آمینواسیدهایی تشکیل شده‌اند که به اشکال سه بعدی درهم پیچیده شده‌اند و همین امر عملکرد آنها را تعیین می‌کند.

ردیابی ساختارهای پروتئین برای درک شیوه عملکرد آنها و شیوه ایجاد اشتباه در فعالیت آنها برای تحقیقات درباره موارد مختلف از جمله داروها و درمان‌های جدید گرفته تا بهبود محصولات کشاورزی و حفظ حیوانات کارآمد است. البته ردیابی تعداد دقیق ساختارهای پروتئین براساس آمینواسیدهای تشکیل‌دهنده آن کار سختی است. این امر نیازمند قدرت رایانشی فوق‌العاده و ساعت‌های متمادی فعالیت انسانی است. بنابراین پیشرفت در این زمینه طی دهه‌های قبل بسیار اندک بوده است. اما هنگامی که آلفابت سیستم هوش مصنوعی قدرتمند دیپ مایند را ایجاد کرد، امیدی برای حل چالش به‌وجود آمد. این سیستم در اصل روی ۱۰۰ هزار ساختار پروتئین شناخته‌شده آموزش دید. این سیستم توانایی پیش‌بینی ساختار میلیون‌ها پروتئین دیگر را یافت.

با کمک دیپ مایند مدت زمان شناسایی این ساختار‌ها به جای چند ماه و سال به چند دقیقه یا ثانیه رسید. در ژوئیه ۲۰۲۱میلادی نخستین مخزن «AlphaFold Protein Structure»  به‌طور عمومی برای محققان ارائه شد. این مخزن در اصل شامل ۳۵۰هزار ساختار پروتئین بود که حدود ۵/ ۹۸درصد پروتئین‌های بدن انسان و همچنین پروتئین‌های موجود در مگس‌های میوه، موش‌ها، مخمر و باکتری ای کولای نیز جزء آن بودند. پس از آن نیز این مخزن به حدود یک‌میلیون ساختار پروتئین از ۱۰هزار گونه حیوان، گیاه، باکتری، قارچ و ارگانیسم‌های دیگر توسعه یافت.