Реверсивно инженерство на сорс кода на ваксината на BioNTech/Pfizer – втора част

Оригиналът е на Bert Hubert

5
3280

В първата част се спряхме предимно на ядрото на ваксината BNT162b, създадена от компаниите BioNTech и Pfizer. Тук ще продължим с биологичните аналогии на RAM и ROM паметите, ролята на които в природата е поета от РНК и ДНК. Ще разгледаме и „сорс кода“ на протеиновия шип на новия коронавирус.

Сигналният пептид на S-гликопротеина

Както отбелязахме миналия път, целта на ваксината е да накара клетката да произвежда протеина-шип на новия коронавирус SARS-CoV-2 в промишлени мащаби. Дотук разглеждахме предимно метаданните и различните наименования и термини за сорс-кода на тази ваксина. Нека сега да стъпим на територията на самия вирусен протеин.

Преди това ще трябва да разгледаме още един слой метаданни. След като рибозомата (от интересния клип в края на първата част), изготви протеина, то този протеин трябва да бъде насочен по такъв начин, че да попадне където трябва. Това се кодира с помощта на сигнални пептиди (сигнални последователности) на S-гликопротеинa.

Представете си, че в началото на протеина се намира маркер с адрес, криптиран в самия протеин. В този случай сигналният пептид нарежда този протеин да напусне клетката с помощта на
ендоплазмен ретикулум, наричан още ендоплазмена мрежа. Хм, дори и във филма „Стар Трек“ няма подобен интересен жаргон!

Сигналният пептид не е много дълъг, но на показания по-долу код се вижда разликата между РНК на вируса и на ваксината. За да могат по-лесно да бъдат сравнени, аз замених символа Ψ с обикновения U на РНК:

 

           3   3   3   3   3   3   3   3   3   3   3   3   3   3   3   3
Virus:   AUG UUU GUU UUU CUU GUU UUA UUG CCA CUA GUC UCU AGU CAG UGU GUU
Vaccine: AUG UUC GUG UUC CUG GUG CUG CUG CCU CUG GUG UCC AGC CAG UGU GUU
               !   !   !   !   ! ! ! !     !   !   !   !   !    

Съвсем не е случайно това, че групирам РНК с по три символа. Тези символи формират кодони. А във всеки кодон е кодирана конкретна аминокиселина. Сигналният пептид на ваксината се състои от същите аминокиселини, от които е съставен и самият вирус.

Но защо тогава РНК е по-различна?

Кодоните могат да бъдат 43=64, понеже РНК има четири символа, три от които съставят кодон. При това различните аминокиселини са само 20. Получава се така, че няколко различни кодона кодират една и съща аминокиселина.

В биологията се използва следната, на практика универсална таблица за съпоставяне на РНК- кодоните с аминокиселините:

В тази таблица се вижда, че модификациите на ваксината (UUU -> UUC) са синонимни. РНК-кодът на ваксината се различава, но в крайна сметка се получават съвсем същите аминокиселини и протеини.

При по-внимателно вглеждане се вижда, че най-много промени се съдържат в третия кодон, който е отбелязан с цифрата 3. След като проверим универсалността на кодоните в таблицата, ще видим, че тази трета позиция почти не влияе на това, каква аминокиселина в крайна сметка ще се получи.

Но ако тези промени са синонимни, за какво са необходими? Ако се вгледаме още по-внимателно, ще забележим че всички промени, освен една, увеличават количеството и на C и G.

За какво е необходимо това? Както вече казахме по-рано, нашата имунна система е твърде скептична към външни РНК – тоест, към кода, който е дошъл извън клетката. За да избегнем неговото откриване, ние вече заменихме U със Ψ.

Медицинските изследвания направени преди това показаха, че РНК с по-големи количества G и C по-често и по-ефективно се превръща в протеини. Именно с тази цел в  РНК на ваксината редица символи бяха заменени със G и C във всички възможни места, които позволяват това.

Реалният протеин-шип

Следващите 3777 символа на РНК на ваксината по същия начин са „оптимизирани по кодони“ с цел да бъдат добавени повече C и G. Няма да публикувам тук целия код, но ще изучим един от неговите най-особени фрагменти. Именно благодарение на този фрагмент ваксината работи – точно тази част ни помага да се върнем към нормалния живот:

                  *   *
          L   D   K   V   E   A   E   V   Q   I   D   R   L   I   T   G
Virus:   CUU GAC AAA GUU GAG GCU GAA GUG CAA AUU GAU AGG UUG AUC ACA GGC
Vaccine: CUG GAC CCU CCU GAG GCC GAG GUG CAG AUC GAC AGA CUG AUC ACA GGC
          L   D   P   P   E   A   E   V   Q   I   D   R   L   I   T   G
           !     !!! !!        !   !       !   !   !   ! !     

Тук отново се виждат синонимните и обикновените промени на РНК. Така например, в първия кодон CUU е заменен на CUG. Това добавя още един G към ваксината, което засилва производството на протеини. CUU и CUG кодират аминокиселината L – левцин и това е причината в протеина нищо да не се променя.

Сравнявайки протеина-шип с ваксината, веднага ще забележим, че всички промени по сходен начин са синонимни – освен две. Това добре се вижда в дадения фрагмент.

Третият и четвъртият кодон включват реални промени. Аминокиселините K и V са заменени с P или пролин. Във случая с К се е наложило да бъдат направени три промени (!!!), а в случая с V – две (!!). Оказа се, че именно тези две промени невероятно засилват въздействието на ваксината.

Какво все пак се случва? Ако разгледаме една реална частица на вируса ще видим, че протеинът-шип всъщност не е един – това са няколко шипа на едно място.

Шиповете излизат от тялото на вируса, но нашата ваксина генерира само шипове, които не са закрепени към каквито и да било вирусни тела.

Оказа се, че свободните и отделно съществуващи протеини-шипове колапсират в съвършено друга структура. Ако те бъдат вмъкнати в състава на ваксината, то нашите тела биха създали имунитет към тях – но само към този колапсиран вид. Реалният коронавирус има прави и остри шипове и е очевидно, че в подобен вид ваксината срещу новия коронавирус няма да работи.

И какво трябва да направим в този случай? През 2017 година бе описано как двойната замяна на пролина в необходимото място принуждава протеините на SARS-CoV-1 и MERS S да приемат своята първоначална форма, дори и без да съединение към вируса. Това става благодарение здравината на пролина. Тази аминокиселина работи като шина, стабилизираща протеина в състоянието, в което трябва да бъде представен на имунната система.

Направилите това открития хора към днешен ден имат пълното морално право да бъдат изключително горди за своя принос в създаването на ваксините и непрекъснато да се усмихват от щастие. Това е напълно заслужено.

След публикацията на първия вариант на тази статия, аз говорих със специалистите от лабораторията на Маклилън, които казаха че усмивките бързо са угаснали, заради разразилата се пандемия. Но те са горди със своя принос към създаването на тази ваксина.

Краят на протеина и последни стъпки

Ако разгледаме сорс-кода до края, то ще видим неголеми промени и в самия край на протеина-шип:

          V   L   K   G   V   K   L   H   Y   T   s             
Virus:   GUG CUC AAA GGA GUC AAA UUA CAU UAC ACA UAA
Vaccine: GUG CUG AAG GGC GUG AAA CUG CAC UAC ACA UGA UGA 
          V   L   K   G   V   K   L   H   Y   T   s   s          
               !   !   !   !     ! !   !          ! 

В края на протеина се намира кодонът, който отбелязва, че това наистина е краят на протеина и тук е отбелязан с буквата s. Това е един вежлив начин да се укаже, че се намираме в края на протеина. Самият вирус в качеството на спиране на протеина използва кодона UAA, а ваксината два кодона UGA. Предполагам, че това е направено за по-голяма надеждност и за всеки случай.

Регионът 3′, който не подлежи на транслация

Точно както в края на 5′ ние открихме региона untranslated region, UTR, Който се използва за насочване на рибозомата, в края на този протеин намираме подобна конструкция – 3′ UTR.

За тази конструкция може да бъдат написани много думи, но аз предпочитам да цитирам Уикипедия. „3′ UTR играе критично важна роля в генната експресия, влияейки на локализацията, стабилността, експорта и ефективността на транслиране на mRNA. Въпреки всички наши днешни знания за 3′ UTR, тяхната работа до голяма част за всички все е още загадъчна“.

Но все пак ние знаем, че определени 3′ UTR изключително успешно осигуряват експресията на протеините. Според документацията на СЗО, 3′ UTR, съдържащ се във ваксината на BioNTech/Pfizer, е подбрана от „амино-терминалния усилвател на разделена (AES) mRNA и кодираната в митохондрията 12S рибозома за осигуряване стабилността на РНК и високата експресия на общия протеин“. Няма какво друго да им кажа на тези хора, освен едно голямо браво.

В самия край има само AAAAAAAAAAAAAAAAAAAAAA

Самият край на mRNA е полиаденилиран. Това е един витиеват начин да се каже, че всичко приключва с една купчина последователности AAAAAAAAAAAAAAAAAAA. По всичко личи че 2020 година бе трудна и омръзна дори на mRNA.

mRNA може да бъде използвана многократно, но при този процес и тя по губи няколко „А“ от своя край. След като тези „А“, свършат mRNA престава да работи и се изхвърля от клетката. В този смисъл, опашката от поли-А я защитава от деградация. Бяха направени специални научни изследвания какъв да бъде оптималният брой „А“ в тази mRNA ваксина. В различните материали в интернет открих, че техният брой е около 120 бройки.

Ваксината BNT162b2 приключва със следния код:

                                     ****** ****
UAGCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAGCAUAU GACUAAAAAA AAAAAAAAAA 
AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA

Това са 30 „А“, след което идва „нуклеидният линкер-10“ (GCAUAUGACU), след което има още 70 „А“.

Според мен това е една фирмена оптимизация, която подобрява експресията на протеините.

Изводи

Сега вече знаем какъв е сорс-кода на ваксината BNT162b2 срещу новия коронавирус и до голяма част разбираме, защо е направен именно такъв:

  • Шапката CAP, благодарение на което РНК прилича и се разпознава като обикновена mRNA
  • Известният, многократно тестван и оптимизиран 5’ untranslated region (UTR)
  • Използва се сигнален пептид с оптимизирани кодони, който изпраща протеина-шип в необходимото място (протеинът е копиран от самия вирус)
  • Използва се малко по-различен вариант от оригиналния протеин във вид на шип с оптимизирани котлони, с две замени на пролин, които осигуряват правилната форма на шипа
  •  Известният, успешно тестван и оптимизиран 3′-UTR регион
  • Малко загадъчна опашка с многобройни „А“ с неизвестно какъв „линкер“. Но това навярно са фирмени технологии, които не бива да се разпространяват

Оптимизацията на кодона добавя в mRNA голям брой G и C.Използването на Ψ (1-метил-3′-псведоуоридин) вместо U помага да бъде измамена нашата имунна система. Благодарение на него mRNA съществува достатъчно дълго, за да успее да тренира нашата имунна система.

4.3 17 гласа
Оценете статията
Абонирай се
Извести ме за
guest
5 Коментара
стари
нови оценка
Отзиви
Всички коментари