Positions of conserved sequence motifs in inteins

(arranged by protein hosts)
          Domains: N-terminal (N) O, Endonuclease (EN) O, C-terminal (C) O.

Intein*   (length) Block positions
Sce_VMA      (455) 11-2-----33---------44-----11----------22-33-44---------221
Ctr_VMA      (472) 11-2-----33--------44-----11-------------22-33--44---------221
Pfu_VMA      (425) 112-------33-44----11--------22-33-44--------------221
Pho_VMA      (377) 112-------33-44----11--------22---44---------221
Pab_VMA      (430) 112-------33-44----11--------22-33-44---------------221
Tac_VMA      (174) 112-------33-44----221
Ppu_dnaB     (151) 11--2---3344----221
Gth_dnaB     (161) 112------3344----221
Mtu_dnaB     (417) 112-----3344--11---------22-33--44-----------------221
Mav_dnaB     (338) 11-2----33--------11-----22-33-44--------221
Ssp_dnaB     (430) 112-----3344--11----------22-33--44------------------221
Rma_dnaB     (429) 112-----3344--11----------22-33--44------------------221
Mle_dnaB     (146) 11-2----3344----221
Mfl_gyrA     (422) 112-----33-44--11---------22-33--44----------------221
Mgo_gyrA     (421) 112-----33-44--11---------22-33--44----------------221
Mka_gyrA     (421) 112-----33-44--11---------22-33--44----------------221
Mxe_gyrA     (199) 112-----33-44---------221
Mma_gyrA     (421) 112-----33-44--11---------22-33--44----------------221
Mle_gyrA     (421) 112-----33-44--11---------22-33--44----------------221
Pfu_RIR1-1   (455) 11-2--------33-44-11-----------33-44------------------221
Pab_RIR1-1   (400) 11-2--------33-44-11--22-33-44------------------221
Pab_RIR1-2   (439) 112----33-44----11----------22-33-44-----------------221
CIV_RIR1     (340) 112----3344----11--------33--44----------221
Spb_RIR1     (386) 112------33-44--11----------22-33--44-----------221
Dra_RIR1     (367) 112----33--44--11---------22-33--44-----------221
Pfu_RIR1-2   (383) 112---------3344--11--------22-33-44----------221
Pho_RIR1     (386) 112----------3344--11--------22-33-44----------221
Pab_RIR1-3   (383) 112---------3344--11--------22-33-44----------221
Mth_RIR1     (135) 112----33-44---221
Pho_r-gyr    (411) 112-----33-44-------11------22-33-44---------------221
Mja_r-gyr    (495) 112-----33-44-------------11-------22-33--44-----------------221
Pfu_topA     (374) 112-----33-44---------11---------3344---------221
Tfu_pol-1    (361) 112---33------11-----------33--44----------221
Tag_pol-1    (361) 112---33------11-----------33--44----------221
Pko_pol-1    (361) 112---33------11-----------33--44----------221
Mja_pol-1    (370) 112---33-------11-----------33--44----------221
Tli_pol-1    (539) 11-2--------33-44-------------------11--------22-33-44------------221
Tag_pol-2    (539) 11-2--------33-44-------------------11--------22-33-44------------221
Psp_pol-1    (538) 11-2--------33-44-------------------11--------22-33-44------------221
Pko_pol-2    (538) 11-2--------33-44-------------------11--------22-33-44------------221
Mja_pol-2    (477) 11-2--------33-44-------------------11--------22-33-44-----221
Pho_pol      (461) 11-2--------33-44-------------------11-------22-3344-----221
Tli_pol-2    (391) 11-2-------33-------11---------22-33--44----------221
Tfu_pol-2    (390) 11-2-------33------11---------22-33--44----------221
Tag_pol-3    (158) 11-2-------33-----221
Pfu_klbA     (523) 112--------33-44--------11---------22-33-44---------------------221
Pho_klbA     (521) 112--------33-44--------11---------22-33-44---------------------221
Pab_klbA     (197) 112--------33-44------221
Mja_klbA     (169) 112--------33-44--221
Pfu_IF2      (388) 112-------3344-------3344---------------------221
Pho_IF2      (445) 112-------3344-----11-----33-44----------------------221
Pab_IF2      (395) 112-------3344-------33-44----------------------221
Mja_IF2      (547) 112-------3344------------11--------22-33-44-----------------------221
Pfu_rtcB     (482) 112-----3344------11-----------22-33---44------------------221
Pho_rtcB     (391) 112-----3344------11-------22-33--44-----------221
Pab_rtcB     (437) 112-----3344------11----------22-33---44-------------221
Mja_rtcB     (489) 112-----3344------11-----------22-33---44------------------221
Pho_RFC      (526) 112------33-44-11--------2233-44--------------------------------221
Mja_RFC-1    (549) 112------33-44--11---------22-33-44---------------------------------221
Pfu_RFC      (526) 112------33-44-11--------2233-44--------------------------------221
Pab_RFC-1    (500) 112------33-44-11-------2233-44-----------------------------221
Mja_RFC-2    (437) 11-2------33-44-----11----------22-33-44--------------221
Pab_RFC-2    (609) 112-----3344------------------------11----------22-33---44-----------------221
Mja_RFC-3    (544) 112-----3344---------------11----------22-33---44-----------------221
Ssp_dnaX     (431) 11-2----3344---------------------------------------221
Mtu_recA     (441) 112-----3344--11---------22-33--44--------------------221
Mle_recA     (366) 112------3344-11---------2233-44------------221
Mfl_recA     (365) 112------3344-11---------2233-44------------221
Pho_radA     (173) 11-2-------33-44----221
Pho_CDC21-1  (169) 112--------33-44---221
Pab_CDC21-1  (165) 112--------33-44---221
Pfu_CDC21    (368) 112-------33-44-----33-44-------------------221
Pho_CDC21-2  (261) 112-------33-44---------------221
Pab_CDC21-2  (269) 112-------33-44----------------221
Pfu_lon      (402) 11-2-------3344-----11---------22-33-44-----------221
Pho_lon      (475) 11-2-------3344-----------11---------22-33---44-----------221
Pab_lon      (334) 11-2-------3344----11--------2233-44----221
Pho_polC     (167) 11-2-------33-44---221
Pab_polC     (186) 11-2-------33-44-----221
Mle_pps1     (387) 112----33--44-----11--------22-33-44-----------221
Mtu_pps1     (360) 11-2----33----44--11---------22-33--44--------221
Pho_LHR      (476) 112----33-44-------------11--------22-33--44--------------221
Mja_helicase (502) 112-----33-44--11--------22-33-44----------------------------22-1
Mja_RNR-1    (454) 11-2--------33---44---11--------22-33-44-----------------221
Mja_RNR-2    (534) 11-2--------33-44------------11---------22-33--44------------------221
Ceu_clpp     (457) 112-----33--------11---------22----44-------------------221
Ssp gyrB     (436) 112-----33-44------NNNN-----------------------------221
Aae_RIR2     (347) 112-----33----44-11--------22-33--44-----221
Pab_moaA     (456) 11-2-------33-44------------11--------22-33--44----------221
Mja_hyp1     (393) 11-2----33-----44-----11---------22-3344----------221
Mja_GF6P     (500) 11--2---33-44--------------11--------22-33-44-----------------221
Mja_PEPsyn   (413) 112------33-----11-------22--33-44---------------22-1
Mja_RpolA1   (453) 112-----3344-------11-----------22-33---44-------------221
Mja_RpolA2   (472) 11-2-------33-44------11--------22-33-44------------------221
Mja_TFIIB    (336) 11-2-------33-44--11--------22-3344-------221
Mja_UDPGD    (455) 11-2-----33-44-------------11---------22-33--44----------221
Ape_0745     (469) 11-2-------33-44------------11---------22-33-44-----------221
Ssp_DnaE1    (123) 112-----33------
Ssp_DnaE2    ( 37) --221
                   ---- 32 amino acids
* Intein names are colored by their allele groups (integration points VMA-a, VMA-b, dnaB-b, dnaB-a, gyrA-a, RIR1-a, RIR1-b, pol-a, pol-b, pol-c, IF2-a, klbA-a, rtcB-a, RFC-a, RFC-c, r-gyr-a, recA-b CDC21-a, CDC21-b, lon-a, polC-a).

Motif designations
This figure Pietrokovski '97 Perler '97 & Pietrokovski '94 Other names
11 N1 A Inteins N-terminal splicing point
2 N2 - -
33 N3 B -
44 N4 - -
11 EN1 C DOD, dodecapepetide, LAGLIDADG, P1
22 EN2 D -
33 EN3 E DOD, dodecapepetide, LAGLIDADG, P2
44 EN4 H -
NNNN HNH - I-TevIII family motif
22 C2 F -
1 C1 G Inteins C-terminal splicing point


[Inteins home page]
Page last modified July 2001
Shmuel Pietrokovski <pietro@weizmann.ac.il>