Оригиналът е на Bert Hubert. Статията излезе на 25 декември 2020 година и стана толкова популярна, че само за една седмица бе преведена на немски, италиански, френски, руски, румънски и още много други езици.
Добре дошли! В този пост символ по символ ще разгледаме сорс кода на ваксината на BioNTech/Pfizer срещу новия коронавирус SARS-CoV-2.
Навярно тези думи ще ви учудят. Нали ваксината е просто течност, която се инжектира обикновено в ръката на човека. Какво общо има тук някакъв сорс код?
Добър въпрос. Да започнем с малка част на именно този сорс код на ваксината BioNTech/Pfizer, известна и като BNT162b2, а и като Tozinameran и още като Comirnaty.

Ядрото на mRNA ваксината BNT162b е съставено именно от този цифров код с дължина 4284 символа, който може да се събере само в няколко туита! Навярно в началото на производство на тази ваксина някой е заредил този код в един ДНК принтер (да-да!), който е превърнал байтовете в ДНК молекули.

Устройствата от този вид произвеждат съвсем малко количество ДНК молекули, които след интензивна химическа и биологическа обработка се превръщат в РНК (ще се спрем по-късно) за създаването на една ампула с ваксина. Една доза ваксина с надпис 30 микрограма ДНК, наистина съдържа 30 микрограма ДНК. Но в течността на ампулата е добавена специална липидна (мастна) обвивка, която всъщност доставя тази mRNA (иРНК) в нашите клетки.
РНК е нещо като непостоянна версия на ДНК, сякаш записана в „работната памет“. ДНК е нещо като флаш диск в биологията. ДНК е надеждна, издръжлива и може да съхранява много информация. По принцип компютрите също не изпълняват кода директно от флаш стика – преди всичко да започне, кодът се копира в по-бърза и гъвкава, но по-крехка и ненадеждна памет.
При компютрите това е RAM, а в биологията – РНК. Приликите са потресаващи. За разлика от флаш паметта, оперативната памет бързо деградира, ако не бъдат положени специални грижи. Това е и причината РНК-ваксината на Pfizer/BioNTech да бъде съхранявана при много ниска температура – биологичната RAM памет има нужда от по-специални грижи – РНК по принцип е едно много крехко цвете.
Всеки РНК символ тежи около 0,53×10-21 грама – тоест, в една доза ваксина с тегло 30 микрограма се съдържат 6×1016 символа. Ако превърнем тази информация в байтове, то ще се получат приблизително 25 петабайта, въпреки че на практика ваксината е съставена от 2000 милиарда повторения на една и съща последователност от 4284 символа. Реалният информационен обем на ваксината е малко над един килобайт. Самият вирус SARS-CoV-2 е с информационна сложност около 7,5 KB.
Малко пояснения
Може да се каже, че ДНК е един цифров код. За разлика от компютрите, в които се използват нули и единици, в биологията животът е съставен от A, C, G и U/T – нуклеотиди и нуклеозиди с различни азотни основи.
При компютрите ние записваме 0 и 1 като липсата или наличието на електричен заряд, на магнитен преход, напрежение или модулация на сигнал. С други думи, нулите и единиците не са някаква абстракция – те реално съществуват във вид на електронни или други физични явления.
В природата, A, C, G и U/T са молекули, които са записани във вид на вериги в ДНК или РНК.
При компютрите ние групираме 8 бита в един байт и използваме байта като стандартна единица за измерване на обработваната информация. Данните в компютрите се обработват предимно във вид на байтове.
В биологията природата групира три нуклеотида в кодон – тринуклеотид, който се използва като основна единица за генетична информация. В един кодон очевидно се съдържат шест бита информация – по два бита на един ДНК символ, а три символа са шест бита. Това означава че кодонът може да има 26 = 64 различни значения.
Дотук всичко изглежда съвсем познато (и цифрово). Ако имате някакви съмнения, можете да прегледате официалната документация на СЗО с цифровия код на ваксината и самостоятелно да проверите всичко това.
Ако тази тема ви интересува, можете да се запознаете с този материал. А ако предпочитате да гледате видео, то ето тук има цели два интересни часа.
Какво все пак върши този код?
Смисълът на ваксинацията е в това, да обучи имунната система да се бори с патогена по такъв начин, че да не се разболеем тежко. В близкото минало за тази цел в организма се инжектираше отслабен или обездвижен вирус заедно с някои допълнителни препарати, които принуждават имунната система да се задейства. Този процес може да се оприличи със стара аналогова технология, при който се използваха милиарди яйца (или насекоми). Необходим бе голям късмет и много време. Понякога за постигането на имунен отговор се използваше съвсем друг вирус.
mRNA постига същият резултат (обучаване на имунната система), но по много по интелигентен начин – с хирургическа точност, тясно фокусиран и мощен.
Ето как работи всичко това. В лекарствения препарат се съдържа нестабилен генетичен материал, описващ знаменитият вече протеин във вид на шип на вируса SARS-CoV-2. Чрез сложни химически методи ваксината вмъква тази информация в нашите клетки, които след това послушно започват да възпроизвеждат същият този протеинов шип на коронавируса SARS-CoV-2 в количества, достатъчни за активиране на нашата имунна система. След като нашата имунна система забележи растящото количество враждебни протеини, както и признаци за това че клетките са атакувани от вирус, тя дава мощен имунен отговор на шиповидните протеини и на процеса на тяхното размножаване.
Сорс кодът
Да започнем от най-доброто място – от самото начало. В документацията на СЗО е включено следното полезно изображение:
Да започнем с пункта „cap“, който тук е показана вид на малко кепе (cap означава малка шапка, кепе).
Както и в компютъра не може просто така да се запишат кодовете на програмата в един файл, който да се стартира, съвсем по същия начин в биологичната операционна система са необходими заглавия, линкери и свои правила за задаване имена на промеливите.
Кодът на ваксината започва със следните два нуклеотида:
GA
Това е съвсем същото, както е при всеки изпълним файл за DOS и Windows, който започва със символите „MZ“, или Linux скрипт, който започва с „#!“. Нито в биологията, нито в операционните системи, тези два символа не се изпълняват. Но те трябва да са там, защото иначе нищо няма да се получи.
„Шапката“ на mRNA върши няколко неща. Тя отбелязва, че кодът произтича от ядрото, но в нашия случай това не е така – разбира се, кодът идва от ваксината. Но клетката няма откъде да знае това. Тази шапка придава работоспособност на кода и го защитава от унищожаване.
Регионът, който не подлежи на транслация
Малко жаргон. РНК молекулите могат да се четат само в едната посока. Малко е объркващо, че четенето започва от частта, която се нарича 5`, а четенето приключва на частта 3′.
Биологичният живот се състои от протеини (и различни елементи и органи, които са направени от тях). Тези протеини са описани в РНК. Превръщането на РНК в протеин се нарича транслиране.
По-долу е показана зона, която не се транслира (untranslated region, UTR) 5′ – тоест, тази част не се прехвърля към протеин:
GAAΨAAACΨAGΨAΨΨCΨΨCΨGGΨCCCCACAGACΨCAGAGAGAACCCGCCACC
Тук се сблъскваме с първата изненада. Стандартните символи на РНК са A, C, G и U. При ДНК молекулата U е известна като Т. Но тук се появява символът Ψ. Какво става?
Това е едно от най-интелигентните свойства на ваксината. В нашето тяло работи мощна антивирусна система. Благодарение на нея клетките са изключително скептични към чужди РНК и по всякакъв начин се стараят да ги унищожат, докато не се е случило нещо лошо в организма.
За ваксината това е проблем – тя трябва някак да заобиколи нашата имунна система. За дългите години експерименти от подобен род се разбра, че ако в РНК U се замени с леко променена молекула, нашата имунна система губи какъвто и да било интерес към нея. Напълно.
Ето защо във ваксината на BioNTech/Pfizer всеки U се заменя с 1-метил-3′-псведоуоридин, който е обозначен с Ψ. Хитрото тук е, че тази молекула въпреки че успокоява имунната система, от обикновените клетки се приема като стандартна U.
В сферата на компютърната безопасност този трик е добре известен. Понякога се подава леко изкривен вариант на вирусната информация, който обърква защитните стени и антивирусните програми, но се приема от сървърите. След което те могат да бъдат атакувани,
Прилагайки този подход ние използваме плодовете на десетилетия научни изследвания. Учените, които откриха Ψ методът, трябваше да се борят за финансиране, а след това и за приемане на резултатите от техните изследвания. Трябва да сме много благодарни, а аз съм сигурен че те скоро ще получат Нобеловата награда.
Много хора си задават въпроса, не могат ли вирусите да използват Ψ метода, за да се справят с нашата имунна система? Казано накратко, това е твърде малко вероятно. Животът просто няма възможност за създаването на 1-метил-3`-псевдоуридин нуклеотиди. Вирусите използват съвсем опростени биологични механизми за размножаване. Ваксините от типа mRNA бързо се разлагат в човешкото тяло и няма възможност за размножаване на РНК заедно с Ψ.
ОК, нека да се върнем отново към 5′ UTR (untranslated region). Каква е ролята на тези символи, които са 51 на брой? Както почти всичко в природата, те нямат само една единствена точно определена функция.
Когато на клетките се наложи да транслират РНК в протеини, те използват рибозоми. Грубо казано рибозомата е своеобразен 3D принтер за протеини. Тя поглъща РНК нишките и на тяхната база изгражда верига от аминокиселини, които се сгъват във вид на протеин.
Видеото показано по-горе, демонстрира как става това. Черната линия в долната част е РНК. Подобната на нея черна линия, постепенно израстваща нагоре е формиращият се протеин. Сините обекти, които летят в различните части на кадъра са аминокиселините и адаптерите, които им дават възможност да се поместват на РНК.
За да може рибозомата да работи, и е необходим физически допир до съответния отрязък на РНК. След това тя може да започне формирането на протеини на базата на информацията, постъпваща от следващите отрязъци на РНК. Тоест, тя не може да прочете тази част, към която се е присъединила в самото начало. Това насочване се извършва именно от UTR (untranslated region), който предоставя „началната точка“.
И още, в UTR се съдържат и метаданни. Като например кога точно трябва да протече транслацията и каква да бъде нейната продължителност. За нуждите на ваксините се използва най краткотрайния от всички UTR, открити от учените. Този UTR (untranslated region) е взет от гена на алфа глобина. В близкото минало учените откриха възможност още по-силно да се оптимизира този UTR и във ваксината на BioNTech/Pfizer вече не се използва UTR от алфа глобин, а нещо по-добро.
Край на първа част. Във втората част ще продължим с биологичните аналогии на RAM и ROM паметите, ролята на които в природата е поета от РНК и ДНК. Ще разгледаме и „сорс кода“ на протеиновия шип на новия коронавирус.