N-3. Egybetűs jelölések
N-3.1. Foszforsavmaradékok. A monoszubsztituált (láncvégi) foszforsavmaradék kis p betűvel jelölendő. A foszforsav diészter (láncközi) a 3'-5' kapcsolatban kötőjellel (-) jelölendő, amennyiben a szekvencia ismert, vagy vesszővel, amennyiben a szekvencia ismeretlen. Ismert szekvenciákkal szomszédos ismeretlen szekvenciákat zárójelbe kell tenni, amely helyettesíti ezen helyeknél a szükséges egyéb pontozást. Mindezek a jelölések helyettesítik a klasszikus 3'-5' vagy 3'p5' szimbólumokat (vesd össze az N-3.3.1 és N-3.3.2 szabállyal). A 2':3'-ciklikus foszfátrészek jelölhetők a > vagy >p módon [lásd még a Kiegészítést].
Megjegyzés.
i) A láncvégi p-ket jelölni kell, hacsak a jelenlétük nem ismert, bizonytalan vagy nincs jelentősége.
ii) "Polaritás" (a 3' 5'-tól eltérő irányok) esetében lásd az N-3.3.2 szabályt.
iii) Linkages A 3' és 5' kötésektől eltér kapcsolatok más módon jelölendők (lásd az N-3.3.1 szabályt).
iv) Egy kódhármas, melyben a balról jobbra meghatározott sorrend és 3'-5' kapcsolatok feltételezettek, valamint a végződésnek nincs jelentősége, jelölhetők pontozás nélkül, pl. AGC.
N-3.2.1. Ribonukleozidok. A egyedülálló nukleobázisok és nukleozidok rövidítéseit lásd az N-2.2 szabálynál.
A szokásos ribonukleozid maradékok a következő nagybetűkkel jelölendők:
Ado | Adenozin | Thd | Riboziltimidin/ribotimidin (nem timidin) |
A | adenozin | T | riboziltimin |
G | guanozin | C | citidin |
I | inozin | U | uridin |
X | xantozin | pszeudouridin | |
R | bármilyen purin nukleozid | Y | bármilyen pirimidin nukleozid |
N | meg nem határozott vagy nem ismert nukleozid (X, P vagy a fentiek bármelyike nem használható). |
Megjegyzés. Számítógépes munkáknál a (pszí) helyettesíthető Q-val.
Ritka nukleozidok. Hosszú szekvenciák összehasonlításánál gyakran előnyösebb minden nukleozidrészt egy betűvel jelölni, mint betűk és számok csoportjával. Az olyan nagybetűk, melyek nincsenek hozzárendelve a fenti szokásos nukleozidokhoz önkényesen definiálhatók és használhatók. A következő jelöléseket javasoljuk fenntartani az alábbi anyagoknak: (vesd össze az N-4.4 szabállyal):
D | 5,6-dihidrouridin | B | 5-brómuridin |
S | tiouridin (a helyzetszámokhoz, lásd az N-4.4 szabályt) | O | orotidin (lásd az N-1.1 szabályt) |
Ezekhez és további módosításokhoz tartozó jelölések listája az N-4 szabálynál található.
Megjegyzés
i) Amennyiben szükség van a kiegészítő jelölésre, akkor használni kell az r (ribo) előtagot.
ii) A további és módosított cukrokra vonatkozó megfontolások az N-3.2.2, N-3.2.3 és N-4.2 szabálynál találhatók.
N-3.2.2. Dezoxiribonukleozidok
A szokásos 2'-dezoxiribonukleozidok a fenti szimbólumokkal jelölendők a következő módosítások egyikével:
a) Ha van elegendő hely és nincs egyéb előtag, akkor a d előtag az alábbiak szerint használandó: (i) dA-dG-dC ... vagy d(A-G-C...); (ii) poli[d(G-C)] vagy poli(dG-dC) (megegyező vegyületek); a d alkalmazástól függően megelőzhet minden egyes részegységet vagy a teljes láncot.
b) Ha van elegendő hely, de más félreértést okozó előtag is szerepel, akkor a d alsó indexben használandó az alábbiak szerint: mmtTd-bzAd-Td-anCd egy védett tetradezoxinukleotidnál [4]. (Az előtagok az N-4.1 szabálynál vannak definiálva.)
N-3.2.3. Nem szoványos cukorrészek
A riboziltól vagy 2'-dezoxiriboziltól eltérő cukorrészek a fenti, N-3.2.2 szabályban leírtakhoz hasonlóan, a bázismódosító előtagoktól (N-4.1 szabály) és a rendelkezésre álló helytől függően pentozil cukorrészeknél az a, x és l betűkkel (lásd az N-2.3.2 szabályt), egyéb esetekben egyedileg definiált ad hoc betűkkel jelölhetők. Így például: az arabinozilcitozin részre -aC- vagy -Ca- használható. A cukor részen található szubsztituensek jelölései a N-4.2 szabályban vannak megadva (lásd még az N-4.4 szabályt).
N-3.3. Oligo- és polinukleotidok
A kötőjellel, vesszővel vagy zárójellel jelölt, kétszeresen észteresített foszfátrészeket (vesd össze az N-3.1 szabállyal) úgy tekintjük, hogy a foszfátrész bal oldalán a 3' szén oxigén atomjához, jobb oldalán pedig az 5' szénhez kapcsolódik. Egyéb típusú foszfodiészter kapcsolatoknál az egyszerű kötőjelet a számokkal ellátott formákra kell cserélni, mint például: 2'-5' (vagy 2'p5'), 5'-5', stb. [6], illetve G3'p5'A2'p5'A vagy G3'-5'A2'-5'A. Ezen helyzetszámok megelőzhetnek egy láncot vagy egy polimert, amennyiben abban végig egyféle internukleotid kötés található, pl.: (2'-5')A-U-G-C a megfelelő tetranukleotid esetében [lásd még a Kiegészítést].
N-3.3.2. A foszfodiészter kötés iránya
A kötőjel a jobbra nyíl () rövidítéseként használatos ismert szekvenciákban azzal a feltételezéssel, hogy a foszfodiészter kötés 5' vége felé mutat (hacsak nincsenek egyéb számjelölések, mint pl. az N-3.3.1 szabálynál). Amennyiben nem a balról jobbra mutató irányról van szó, akkor jelezni kell az irányt a megfelelő helyzetszámmal a lánc előtt vagy nyíllal kell mutatni a 3'
5' irányt, mint a peptidekre vonatkozó szabályoknál [9]. Így a hidrogénkötésekkel asszociált szegmensek (lásd az N-3.4.2 szabályt) például az alábbiak szerint jelölhetők:
(3'-5')A-C-A-C-A-C stb. . . . . . . (5'-3')U-G-U-G-U-G stb.
vagy
Egy másik eszköz a "fordított polaritás" jelölésére a szimbólumok elforgatása [10, 11]. Ezáltal a fenti asszociált polimerek a következőképpen mutatnak:
Az ilyen reprezentációkban a balról jobbra 3'-5' konvenciót feltételezzük, amikor a betűk jobbra olvasva, felfelé állva jelennek meg.
A-G-Up (ApGpUp); 3'5' trinukleotid, láncvégi 3' foszfáttal.
A-G-U>p; ugyanaz, csak láncvégi 2':3'-ciklikus(5) foszfáttal.
pA-G-U; ugyanaz, csak 5' foszfáttal kezdődően, 2' és 3' szubsztituálatlan hidroxilokat tartalmazó uridinnel a láncvégen.
pppG-G...Ap; ennek a nukleotidnak (nem meghatározott hossz és szekvencia) egy 5'-trifoszfát része van a G-n az egyik (az 5') végén és egy 3'-foszfát az A-n a másik (a 3') végén.
pG-A-(C2,U)T-C-C-A; egy dekanukleotid, mely egy 5'-foszfáttal kezdődik (5' vég), a
és T között egy nem ismert trinukleotid szekvenciát tartalmaz, és 2' és 3' szubsztituálatlan hidroxil csoportokat tartalmazó adeninnel záródik a láncvégen (3' vég).
d(pG-A-C-T); tetranukleotid (mind dezoxi), 5' terminális foszfáttal a G-n.
(TC
A
Gp); ugyanaz (a nyilak jelölik az 5'
3' irányt).
pGd-Ad-C-T; ugyanaz, de két dezoxi és két ribo cukorrésszel (lásd N-3.2.2b szabályt).
(2'-5')pG-A-C-T; ugyanaz, az összes ribo, az összes 2'-5' kapcsolat.
pG2'-5'A-C-T; ugyanaz, csak van benne egy 2'-5' kapcsolat (a G és az A között).
AGC; egy kodon (triplett) (Megjegyzés: a foszforsavrészek jelei elhagyhatók a kodonok leírásánál. Ez egy kivétel az N-3.1 szabályhoz).
N-3.4. Polimerizált nukleotidok
Ismétlődő vagy nem ismert szekvenciákat tartalmazó polinukleotidok kétféle rendszerrel is leírhatók, melyek megegyeznek az IUPAC Makromolekuláris Nevezéktani Bizottsága és az Amerikai Kémiai Társaság Polimer Nevezéktani Bizottsága által kidolgozott ajánlásokkal (lásd még: Szintetikus polipeptidek [5]).
a) Az ismétlődő egységek előtt a "poli" előtagot használjuk a "polimer" jelentéssel. Így, polinukleotid vagy poli(N); poliadenilát vagy poli(A); poli(adenilát-citidilát) vagy poli(A-C) (váltakozó); poli(adenilát, citidilát) vagy poli(A,C) (véletlenszerű).
b) Az ismétlődő egység (összetett esetben zárójelben megadva) után egy alsó indexben adjuk meg az ismétlődések hosszát, például egy számmal (A-C)50, egy átlagos számmal vagy egy tartománnyal (A-C)40-60, ha szükséges. Amennyiben az ismétlődések száma nem meghatározott és mégis ez a forma kívánatos a szövegkörnyezetben, akkor az "n" használható az alsó indexben (mint az [5] referenciában). Két n azonban nem jelenhet meg ugyanabban a képletben, hacsak nem jelölnek azonos hosszúságot. Ha nincs szó azonos hosszúságról, akkor további betűket kell használni, mint például m, k, j stb.
A szimbólumok bármelyik esetben hordozhatnak előtagokat vagy alsó indexeket, ha azok szükségesek a megfelelően részletes leíráshoz. Megjegyzendő, hogy a poli előtag nem használandó a második rendszerben.
Példák
poli(A-U), váltakozó A és U kopolimer [12];
poli(A,U), véletlenszerű A és U kopolimer; nem poliAU vagy poliA+U
poli(A2,U), hasonlóan az előző esethez, de átlagosan 2:1 arányú összetételben;
, hasonlóan az előző esethez, de az átlagos lánchossz 150 részegység;
poli[d(A-T)] vagy poli(dA-dT), váltakozó dA és dT (lásd az N-3.1 szabályt és a [12] referenciát).
1. Megjegyzés. A poli[d(A-T)] vagy poli(dA-dT) eredetileg [13] poli dAT módon volt kifejezve. Rövidsége miatt ez utóbbi előnyös, azonban más esetekben (lásd a következő megjegyzést) bizonyítottan kétértelmű és ellentmond a polimerjelölések általános alapelveinek (vö. [5]). Ezért használata nem javasolt.
2. Megjegyzés. Korábban a poli AU és poli A+U, stb., voltak használatosak a poli(A).poli(U) jelölésére [15]. Az asszociált homopolimerekre vonatkozó és az eredetileg váltakozó kopolimerekre javasolt rendszer (lásd előző megjegyzés) hasonlósága félreértésekre vezethet, mivel egy kovalens láncot jelölnek ketté helyett. Ezért ezek használata nem javasolt. Hasonló félreértésekre vezethetnek az N-3.4.2 szabályban megadott, nem megfelelő kifejezések.
Magyarázat. A polimereken belül többszörös vagy szögletes zárójelek is használhatók, valamint függőleges vonalak az oldalláncokhoz stb. [5, 9]. Az "oligo" kifejezést az alkalmas helyeken a "poli"-val helyettesíthetjük. A láncvégi foszfátrészt nem szükséges jelölni, hacsak nem létfontosságú a a megértéshez.
N-3.4.2. Láncok közötti asszociációk/kapcsolatok
Asszociációk (nemkovalens) két vagy több polinukleotid lánc között, melyek hidrogénkötéseknek tulajdoníthatók a középen elhelyezkedő(centrált) ponttal jelölendők (nem kötőjellel, ami a kovalens kötést jelzi), pl. (vö. [12, 14]):
a) poli(A).poli(U), nem pedig poli(A.U), sem poli AU, sem poli A+U (l.a fenti 2. megjegyzést); poli(A.U) használható, amennyiben azt jelezzük, hogy minden egyes A kötődik egy U-hoz a lánchosszra való tekintet nélkül.
b) poli(A).2poli(U) nem pedig poli(A.2U), sem poli(A.U2); poly(A.2U) azt a háromszálú komplexet jelöli, melyben minden egyes A két U-hoz kötődik, tekintet nélkül a lánchosszra.
c) poli[d(A-T)].poli[d(A-T)] vagy poli[d(A-T).d(A-T)].
d) A.poli(U) vagy A.(U)n egyedülálló adenozin részek poliuridilát vagy poli(uridilsav)hoz történő kötődésére.
Asszociációk hiánya a láncok között plusz jellel írható le (hagyományosan a kémiában az egymás mellett jelenlévő, de nem asszociált formákra) pl.:
a) poli(dC) + poli(dT), nem pedig poli(dC + dT);
b) poli(dA,rT2) + poli(dG);
c) 2 [(poli(A).poli(U)] poli(A).2poli(U) + poli(A) [12].
Az asszociációra vonatkozó meghatározó információ hiánya vesszővel jelölendő (hasonlóan a korábbi "meg nem határozott"-hoz), pl. :
a) poli(A), poli(A,U);
b) poli[d(G-C)], poli[d(A,T)].
Megjegyzések
i) Kötőjelek nem használandók (nem kovalens) asszociációkra; a poli(A-U) jelölés egyszálú láncot jelöl, nem két láncot.
ii) a centrált pontot mindig használni kell nem kovalens asszociátumokban található bázispárok jelölésére (lásd az N-3.3.2 szabályt), pl. A.T bázispár, vagy G.C hidrogénkötések (nem pedig A-T, vagy G-C melyek kovalens kapcsolatot jelölnek). A centrált pont, mint látszik, az alapvonal fölött található.
iii) A nukleobázis arányának leírásánál, az (A + T)/(G + C) forma használandó, nem pedig az AT/GC, sem az A + T/G + C. Két nagybetűt nem szabad egymás mellé írni (kivéve az N-3.1 szabály, 4. magyarázatát), hogy megkülönböztethető legyen a G-C szekvencia a G+C tartalomtól, a G:C vagy G/C aránytól, és a G.C bázispároktól.