N-4. Módosított bázisok, cukrok vagy foszfátok a polinukleotidokban

N-4.1. A nukleobázisok szubsztituenseinek jelölése

Hosszú szekvenciákban, mint pl. a transzfer RNS-ekben, ahol kívánatosabb, hogy ne legyen egynél több nagybetű nukleotidegységenként, a nukleozidok standard megjelölései [pl., A, U, G, C, stb. (lásd az N-3.2.1 szabályt)] módosíthatók kisbetűkre, melyeket közvetlenül az első nagybetű elé kell elhelyezni. A leggyakoribb módosításokhoz ajánlott jelölések listája alább található (a helyzetszámok és sokszorozó előtagokról lásd az N-4.4 szabályt; a szokásostól eltérő cukorrészekről lásd az N-3.2.2 és N-3.2.3 szabályt:

m, e, acmetil, etil, acetil
n, oamino (N helyettesíti a H-t), dezamino (O helyettesíti az N-t)
z, caza (N helyettesíti a C-t), dezaza (C helyettesíti a N-t)
hdihidro (hU = dihidrouridin; lásd még az N-3.2.1 és N-4.4 szabályt)
hm, ho (vagy oh)hidroximetil, hidroxi
aaaminoacil
fformil (mint a konvencionális fMet a formilmetionilnál)
faformilaminoacil
iizopentenil (=[gamma],[gamma]-dimetilallil)
stio vagy merkapto (sU = tiouridin; lásd még az N-3.2.1 és N-4.4 szabályt)
fl, cl, br, iofluor, klór, bróm, jód (természetes polinukleotidokban nem találhatók; lásd még az N-3.2.1 és N-4.4 szabályt).

Néhány, szintetikus munkáknál használatos N-védőcsoport rövidítése [4, 9] :

bz, bzl/bn(3), tos/ts(4)benzoil, benzil, tozil
tr, an, bhtritil, anizoil, benzhidril (difenilmetil)
mmtmonometoxitritil (p-anizildifenilmetil)
dmtdimetoxitritil (di-p-anizilfenilmetil)
thp, dnstetrahidropiranil, danzil
cmcN-ciklohexil-N'[[beta]-(4-metilmorfolino) amidino](a megfelelő karbodiimidből keletkező reakciótermék) [16].

Egyszerűbb esetekben, ahol az egy részegységben található több nagybetű elkerülése nem tűnik szükségesnek, a standard kémiai szimbólumok (Me, Br, stb.) használhatók. Ilyen esetekben nem szükséges írásjeleket tenni a módosító és a nukleozid jelei közé, pl., 6Me2A, 5BrU. A "di" előtagot nem kell használni; a számok az alsó indexben elegendők (vö. az N-4.4 szabállyal).

Magyarázatok

i) További védőcsoportok jelölései alkothatók az itt leírt és az Aminosavak és peptidek [9] 6. fejezetében leírt elveknek megfelelően.

ii) Amennyiben szigorúan korlátozott hely áll rendelkezésre, ezen megjelöléseknek a nukleozidok jele fölé kell kerülniük (lásd az N-4.4 szabályt) [3, 4, 7, 8], pl., az acC esetében.

iii) Bifunkciós adduktumok jelöléseinek a lánc (vagy láncok) fölé vagy alá kell kerülniük (lásd az elágazó peptidekre vonatkozó konvenciókat [5] és [9]), ezért használható bármilyen alkalmas megjelölés. Így például két adenozin közötti metilénhíd [17] az alábbiak szerint írható le:

a láncok közötti, intermolekuláris (előbbi) vagy az egyazon láncon belüli, intramolekuláris (utóbbi) esetekben.

N-4.2. A cukorrészek szubsztituenseinek jelölése

N-4.2.1. Láncközi módosítások. A láncközi módosított cukrok szimbólumai kisbetűk; melyek közvetlenül a nukleozid jobb oldalára írandók és 2'-(láncközi) szubsztitúciót jeleznek, hacsak nincs más megjelölés. Ezért az -Am- jelölés egy 2'-O-metiladenozin részegységet jelöl [7, 8] (lásd még a N-4.4 szabályt).

N-4.2.2. Láncvégi csoportok. A szokásos természetes láncvégi csoportok, a foszfát és a hidroxil szükség esetén jelölhetők p betűvel (N-3.1 szabály) és oh vagy ho jelekkel (N-4.1 szabály); az utóbbiak csak akkor szükségesek, ha ki szeretnénk hangsúlyozni a csoport jelenlétét, mivel a nukleotid jele azt már magában foglalja.

Egyéb láncvégi csoportokra (hidroxil-szubsztituensek) a standard kémiai szimbólumok és rövidítések alkalmazhatók. Zárójelbe kell tenni őket (a megfelelő nukleozid szimbóluma elé vagy azt követően, l. fent). Javasolt rövidítések (eltekintve a normál kémiai szimbólumoktól) [4, 9]:

(EtOEt), (EtOMe)1-etoxietil, etoximetil
(Ph2CH), (Bn), (Tr)benzhidril, benzil, tritil
(MeOTr), [(MeO)2Tr]monometoxitritil, dimetoxitritil
(Me), (Et), (Ac), (Tos/Ts(4))metil, etil, acetil, tozil
(Tp), F3CCO-tetrahidropiranil, trifluoracetil
(AA), (Gli), (Leu) stb.aminoacil, glicil, leucil, stb.

A láncvégi, 2' és 3' hidroxilokat összekötő (bifunkciós) diol védőcsoport, hacsak nincs más megjelölés, a következők szerint írhatók le:

(>CMe2)izopropilidén; pl., -C-C-A(>CMe2)
(>BOH), (>CO)borát, karbonát
>p vagy >2':3'-foszfát (ciklikus)(5) (vö. N-3.1)

N-4.3. Foszforsav védőcsoportok

Mivel ezen védőcsoportok a láncvégeken találhatók, a standard kémiai szimbólumok használandók. Ezek kötőjellel kapcsolódnak a megfelelő oldalon (foszfátoknál; vö. az N-3.1 szabállyal). A fentieken túli további példák [4]:

(CNEt)-; -(CNEt)5'-cianoetil; 3'(vagy 2')-cianoetil
(MeOPh), (Bzl/Bn(3)), (Ph)anizil, benzil, fenil, kötőjellel a megfelelő oldalon.

N-4.4. Helyzetszámok és sokszorozó előtagok

Ha szükség van sokszorozó előtagokra, akkor azok a szokásos módon, alsó indexben jelölendők [3, 8, 11]; így -m2A- egy dimetiladenozin részt jelöl és nem metilt a 2'-O pozícióban (lásd az N-4.2.1 szabályt). A helyzetszámok felső indexszel jelölendők; így az egy N6-dimetiladenozin [ribozil-6-(dimetilamino)purin] részt jelöl, az -ac4C egy N4-acetilcitidint, az vagy m1m6A egy 1,N6-dimetiladenozint, stb. [3, 8, 11]. Az N-4.2.1 konvenciót alkalmazva, a 2'-O- metil-N6-dimetiladenozint -nek írhatjuk. Egyéb példák: s2U a 2-tiouridin, a az 5,6-dihidrouridin rövidítése (lásd még a lehetséges alternatívákat az N-3.2.1 és N-4.1 szabálynál, nevezetesen rendre 2S, és hU vagy D; a helyzetszámokat és/vagy sokszorozó előtagokat a definíció már magában foglalhatja). A "di" előtag, melynek nincs helye a kémiai szimbolikában, nem használandó; helyette alsó indexbe írt szám szükséges. A 2'-O-Me előtag legjobban az m toldalékkal helyettesíthető (lásd az N-4.2.1 szabályt), különösen ha a nukleozid jele elé más, egyéb szubsztituenseket kell tenni. Így 2'OMe6Me2A-t a jobban leírja; hasonlóan, 2MeS6iPeA helyett ms2i6A.

Több homolog szekvencia megjelenítésénél gyakran kívánatos, hogy a nukleotidokat jelölő nagybetűk egymás alá és fölé kerüljenek. A módosításokra utaló jelölések jelenléte zavarhatja az ilyesféle megjelenítést. Egy lehetséges megoldás erre az esetre, ha az előtagokat (helyzetszámokat és többszöröző előtagokat) közvetlenül a módosított nagybetű fölé, a toldalékokat pedig (rendszerint m a 2'-O-metilnél) a módosított nagybetű jobb felső indexébe helyezzük (lásd még 2. magyarázatot az N-4.1 szabálynál), pl. , Cm.

Ezen használatra vonatkozóan léteznek példák [3, 7, 8]. Ilyen elhelyezéseknél, ha előnyös, kisebb betűk és/vagy számok is használhatók [4, 8]. Az ilyen elhelyezések összhangban vannak a peptidek funkciós csoportjaira és szubsztituenseire vonatkozó szabályokkal [5, 9].