N-4. Módosított bázisok, cukrok vagy foszfátok a polinukleotidokban
N-4.1. A nukleobázisok szubsztituenseinek jelölése
Hosszú szekvenciákban, mint pl. a transzfer RNS-ekben, ahol kívánatosabb, hogy ne legyen egynél több nagybetű nukleotidegységenként, a nukleozidok standard megjelölései [pl., A, U, G, C, stb. (lásd az N-3.2.1 szabályt)] módosíthatók kisbetűkre, melyeket közvetlenül az első nagybetű elé kell elhelyezni. A leggyakoribb módosításokhoz ajánlott jelölések listája alább található (a helyzetszámok és sokszorozó előtagokról lásd az N-4.4 szabályt; a szokásostól eltérő cukorrészekről lásd az N-3.2.2 és N-3.2.3 szabályt:
m, e, ac | metil, etil, acetil |
n, o | amino (N helyettesíti a H-t), dezamino (O helyettesíti az N-t) |
z, c | aza (N helyettesíti a C-t), dezaza (C helyettesíti a N-t) |
h | dihidro (hU = dihidrouridin; lásd még az N-3.2.1 és N-4.4 szabályt) |
hm, ho (vagy oh) | hidroximetil, hidroxi |
aa | aminoacil |
f | formil (mint a konvencionális fMet a formilmetionilnál) |
fa | formilaminoacil |
i | izopentenil (= |
s | tio vagy merkapto (sU = tiouridin; lásd még az N-3.2.1 és N-4.4 szabályt) |
fl, cl, br, io | fluor, klór, bróm, jód (természetes polinukleotidokban nem találhatók; lásd még az N-3.2.1 és N-4.4 szabályt). |
Néhány, szintetikus munkáknál használatos N-védőcsoport rövidítése [4, 9] :
bz, bzl/bn(3), tos/ts(4) | benzoil, benzil, tozil |
tr, an, bh | tritil, anizoil, benzhidril (difenilmetil) |
mmt | monometoxitritil (p-anizildifenilmetil) |
dmt | dimetoxitritil (di-p-anizilfenilmetil) |
thp, dns | tetrahidropiranil, danzil |
cmc | N-ciklohexil-N'[ |
Egyszerűbb esetekben, ahol az egy részegységben található több nagybetű elkerülése nem tűnik szükségesnek, a standard kémiai szimbólumok (Me, Br, stb.) használhatók. Ilyen esetekben nem szükséges írásjeleket tenni a módosító és a nukleozid jelei közé, pl., 6Me2A, 5BrU. A "di" előtagot nem kell használni; a számok az alsó indexben elegendők (vö. az N-4.4 szabállyal).
Magyarázatok
i) További védőcsoportok jelölései alkothatók az itt leírt és az Aminosavak és peptidek [9] 6. fejezetében leírt elveknek megfelelően.
ii) Amennyiben szigorúan korlátozott hely áll rendelkezésre, ezen megjelöléseknek a nukleozidok jele fölé kell kerülniük (lásd az N-4.4 szabályt) [3, 4, 7, 8], pl., az acC esetében.
iii) Bifunkciós adduktumok jelöléseinek a lánc (vagy láncok) fölé vagy alá kell kerülniük (lásd az elágazó peptidekre vonatkozó konvenciókat [5] és [9]), ezért használható bármilyen alkalmas megjelölés. Így például két adenozin közötti metilénhíd [17] az alábbiak szerint írható le:
a láncok közötti, intermolekuláris (előbbi) vagy az egyazon láncon belüli, intramolekuláris (utóbbi) esetekben.
N-4.2. A cukorrészek szubsztituenseinek jelölése
N-4.2.1. Láncközi módosítások. A láncközi módosított cukrok szimbólumai kisbetűk; melyek közvetlenül a nukleozid jobb oldalára írandók és 2'-(láncközi) szubsztitúciót jeleznek, hacsak nincs más megjelölés. Ezért az -Am- jelölés egy 2'-O-metiladenozin részegységet jelöl [7, 8] (lásd még a N-4.4 szabályt).
N-4.2.2. Láncvégi csoportok. A szokásos természetes láncvégi csoportok, a foszfát és a hidroxil szükség esetén jelölhetők p betűvel (N-3.1 szabály) és oh vagy ho jelekkel (N-4.1 szabály); az utóbbiak csak akkor szükségesek, ha ki szeretnénk hangsúlyozni a csoport jelenlétét, mivel a nukleotid jele azt már magában foglalja.
Egyéb láncvégi csoportokra (hidroxil-szubsztituensek) a standard kémiai szimbólumok és rövidítések alkalmazhatók. Zárójelbe kell tenni őket (a megfelelő nukleozid szimbóluma elé vagy azt követően, l. fent). Javasolt rövidítések (eltekintve a normál kémiai szimbólumoktól) [4, 9]:
(EtOEt), (EtOMe) | 1-etoxietil, etoximetil |
(Ph2CH), (Bn), (Tr) | benzhidril, benzil, tritil |
(MeOTr), [(MeO)2Tr] | monometoxitritil, dimetoxitritil |
(Me), (Et), (Ac), (Tos/Ts(4)) | metil, etil, acetil, tozil |
(Tp), F3CCO- | tetrahidropiranil, trifluoracetil |
(AA), (Gli), (Leu) stb. | aminoacil, glicil, leucil, stb. |
A láncvégi, 2' és 3' hidroxilokat összekötő (bifunkciós) diol védőcsoport, hacsak nincs más megjelölés, a következők szerint írhatók le:
(>CMe2) | izopropilidén; pl., -C-C-A(>CMe2) |
(>BOH), (>CO) | borát, karbonát |
>p vagy > | 2':3'-foszfát (ciklikus)(5) (vö. N-3.1) |
N-4.3. Foszforsav védőcsoportok
Mivel ezen védőcsoportok a láncvégeken találhatók, a standard kémiai szimbólumok használandók. Ezek kötőjellel kapcsolódnak a megfelelő oldalon (foszfátoknál; vö. az N-3.1 szabállyal). A fentieken túli további példák [4]:
(CNEt)-; -(CNEt) | 5'-cianoetil; 3'(vagy 2')-cianoetil |
(MeOPh), (Bzl/Bn(3)), (Ph) | anizil, benzil, fenil, kötőjellel a megfelelő oldalon. |
N-4.4. Helyzetszámok és sokszorozó előtagok
Ha szükség van sokszorozó előtagokra, akkor azok a szokásos módon, alsó indexben jelölendők [3, 8, 11]; így -m2A- egy dimetiladenozin részt jelöl és nem metilt a 2'-O pozícióban (lásd az N-4.2.1 szabályt). A helyzetszámok felső indexszel jelölendők; így az egy N6-dimetiladenozin [ribozil-6-(dimetilamino)purin] részt jelöl, az -ac4C egy N4-acetilcitidint, az
vagy m1m6A egy 1,N6-dimetiladenozint, stb. [3, 8, 11]. Az N-4.2.1 konvenciót alkalmazva, a 2'-O- metil-N6-dimetiladenozint
-nek írhatjuk. Egyéb példák: s2U a 2-tiouridin, a
az 5,6-dihidrouridin rövidítése (lásd még a lehetséges alternatívákat az N-3.2.1 és N-4.1 szabálynál, nevezetesen rendre 2S, és hU vagy D; a helyzetszámokat és/vagy sokszorozó előtagokat a definíció már magában foglalhatja). A "di" előtag, melynek nincs helye a kémiai szimbolikában, nem használandó; helyette alsó indexbe írt szám szükséges. A 2'-O-Me előtag legjobban az m toldalékkal helyettesíthető (lásd az N-4.2.1 szabályt), különösen ha a nukleozid jele elé más, egyéb szubsztituenseket kell tenni. Így 2'OMe6Me2A-t a
jobban leírja; hasonlóan, 2MeS6iPeA helyett ms2i6A.
Több homolog szekvencia megjelenítésénél gyakran kívánatos, hogy a nukleotidokat jelölő nagybetűk egymás alá és fölé kerüljenek. A módosításokra utaló jelölések jelenléte zavarhatja az ilyesféle megjelenítést. Egy lehetséges megoldás erre az esetre, ha az előtagokat (helyzetszámokat és többszöröző előtagokat) közvetlenül a módosított nagybetű fölé, a toldalékokat pedig (rendszerint m a 2'-O-metilnél) a módosított nagybetű jobb felső indexébe helyezzük (lásd még 2. magyarázatot az N-4.1 szabálynál), pl. , Cm.
Ezen használatra vonatkozóan léteznek példák [3, 7, 8]. Ilyen elhelyezéseknél, ha előnyös, kisebb betűk és/vagy számok is használhatók [4, 8]. Az ilyen elhelyezések összhangban vannak a peptidek funkciós csoportjaira és szubsztituenseire vonatkozó szabályokkal [5, 9].