Abstract
O modo evolutivo de uma família multi-gene pode mudar ao longo do tempo, dependendo da diferenciação funcional e meio ambiente genômica local dos membros da família. Neste estudo, demonstramos uma tal alteração do antigénio de melanoma (
MAGE
) família de genes no cromossoma X de mamífero. O
MAGE
família de genes é composto por dez subfamílias que podem ser classificados em dois tipos. Tipo I genes são de origem relativamente recente, e que codificam para epitopos de antigénio de leucócitos humanos (HLA) em células cancerosas. Tipo II genes são relativamente antigo e alguns dos seus produtos são conhecidos por estar envolvidos na apoptose ou da proliferação celular. A história evolutiva da
MAGE
família de genes pode ser dividido em quatro fases. Na fase I, um estado de cópia única de um gene ancestral eo modo evolutivamente conservada durou até o surgimento dos mamíferos eutherian. Na fase II, oito antepassados da subfamília, com exceção de
MAGE-C Comprar e
MAGE-D
subfamílias, foram formados através retrotransposição de forma independente. Isto coincide com uma explosão transposição da
Elementos da linha
na radiação eutherian. No entanto,
MAGE-C
foi gerado por duplicação de genes de
MAGE-A
. Fase III é caracterizada por duplicação de genes extensa dentro de cada subfamília e, em especial, a formação de palíndromos no
MAGE-A
subfamília, que ocorreu em um ancestral do Catarrhini. Fase IV é caracterizado por o decaimento de um palindroma na maioria Catarrinos, com a excepção dos humanos. Embora o palíndromo é truncado por eliminações frequentes em macacos e macacos do Velho Mundo, ele é mantido em seres humanos. Aqui, defendemos que esta retenção específico do ser humano provém de seleção negativa agindo em
MAGE-A
genes que codificam epítopos de células cancerosas, que preserva a sua capacidade de se ligar a moléculas de HLA altamente divergentes. Estes achados são interpretados levando em consideração os fatores biológicos que moldam recentes humanos
MAGE-A
genes
Citation:. Katsura Y, Satta Y (2011) Evolutiva História da Imunidade Cancer Antigen
MAGE
família de genes. PLoS ONE 6 (6): e20365. doi: 10.1371 /journal.pone.0020365
editor: Nikolas Nikolaidis, California State University Fullerton, Estados Unidos da América
Recebido: 14 de fevereiro de 2011; Aceito: 18 de abril de 2011; Publicação: 10 de junho de 2011
Direitos de autor: © 2011 Katsura, Satta. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados
Financiamento:. Este trabalho foi apoiada por uma ajuda de Grant-in para a Investigação Científica em Áreas prioritárias (17.018.032). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito
CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes
Introdução
o modo evolutivo de uma família de genes, ou seja, o processo de nascimento e morte de genes e as extensões de divergência de seqüência, depende da divergência funcional de genes duplicados e sobre a estrutura local do genoma onde reside a família [1], [2]. Aqui, a estrutura local do genoma refere-se a tandem ou repetições invertidas (IRS). A evolução de uma família de genes em IRS pode ser particularmente complexo como um resultado da homogeneização por conversão do gene frequente e instabilidade estrutural, tais como devido às inserções e /ou deleções frequentes.
Warburton et ai. (2004) encontraram uma preponderância de grandes, IRs com um elevado grau de semelhança entre as repetições sobre os cromossomos X e Y (~ 30% de IR no genoma humano estão na cromossomos X e Y) [3]. Muitos IRS em X e Y contêm genes expressos predominantemente nos testículos [3]. Warburton e seus colegas sugeriram que estes RIs desempenhar um papel importante na evolução do genoma humano. No entanto, o papel preciso de IRs na evolução manteve-se incerto. Portanto, neste estudo, tentamos analisar o ritmo eo modo da evolução da família de genes em IRs, com um foco específico sobre o antígeno melanoma (
MAGE
) família de genes, em que os membros estão localizados em uma grande ( ~ 100 kb) palindrome no cromossoma X humano.
MAGE
foi originalmente identificado como “um antigénio de melanoma” e, posteriormente,
MAGE
e seus homólogos que foram descobertos para formar um família multi-genes em genomas eutherian [4] – [7].
MAGE
sequências homólogas foram encontradas em alguns vertebrados (peixe-zebra e frango) [8], [9] e invertebrados (mosca da fruta) [10]. No genoma humano, esta família está composta por 10 subfamílias e cada subfamília é constituída por uma a 15 genes [7]. Para além da classificação por subfamília,
MAGE
genes podem também ser classificados em tipo I ou II, com base em seus padrões e função de expressão. genes do tipo I são compostas de três subfamílias (
MAGE-A
, para –
C
) e tipo II genes de sete subfamílias (
MAGE-D
para –
F
, –
H
, –
L2
,
NDN
,
NDNL2
). genes do tipo I são expressos em células altamente proliferativas, tais como tumores, placenta e as células [4] de linha germinal. genes de tipo II, pelo contrário, são ubiquamente expressa em células somáticas, e alguns genes do tipo II são conhecidos por estar envolvido em apoptose ou proliferação celular [11].
Todo o tipo I
MAGE
genes estão localizados no cromossoma X e antigénios tumorais codificam que desempenham um papel chave na imunidade do cancro. Os péptidos do domínio de homologia MAGE humana (MHD), que é de 160-170 aminoácidos de comprimento, são epítopos do antigénio de leucócitos humanos (HLA) da classe I de moléculas [4]. Quando o antigénio (péptido no MHD) em uma célula de tumor se liga a um receptor numa célula T assassino, os ataques de células T a células tumorais [4], [12].
HLA
é excepcionalmente polimórfica no genoma humano e diferente
HLA
alelos pode ligar epítopos diferentes [13], [14].
MAGE genes podem codificar diversos epitopos de modo a ligar-se a, ou reagir com, cada uma das moléculas de HLA. Assim, é de interesse para rastrear a origem da associação entre o
HLA
e
MAGE
, bem como para determinar como a diversidade genética na região de codificação epitopo tem evoluído e sido mantida.
Muitos
MAGE
genes são pensados para ser específico de mamíferos [7]. Além disso, a maioria dos eutherian
MAGE
genes têm um único exão para codificar uma proteína e, portanto, eles são susceptíveis de ter derivado de retrotransposição de
MAGE-D
[7], porque só
MAGE-D membros da subfamília
tem 14 exões onde um ORF é codificados entre o segundo exões a 12o [15]. No entanto, a relação entre o tipo I e tipo II genes não foi totalmente investigado e o modo de diversificação desses genes ainda não está claro.
Neste estudo, nós investigamos a história evolutiva do
MAGE
família de genes. Em primeiro lugar, procurou os
genes MAGE
mais antigamente divergiram em vertebrados e invertebrados genomas. Em segundo lugar, nós investigamos como e quando ancestrais de cada três tipo I e sete subfamílias tipo II foram gerados com especial referência ao seu modo de amplificação. Em terceiro lugar, vamos nos concentrar no
MAGE Restaurant –
A
da subfamília (um do tipo I subfamílias) e demonstrar como o arranjo genoma tenha ocorrido em primatas. Finalmente, mostramos que alguns
MAGE
humana –
A
genes foram submetidos a seleção negativa contra a homogeneização através da conversão gênica, a fim de manter as suas variações genéticas entre as sequências de aminoácidos. Nós sugerimos que esta seleção está relacionada com a manutenção de uma variedade de HLA epitopos em células cancerosas.
Materiais e Métodos
sequências utilizadas
Humanos (
Homo sapiens
) dados de sequências de nucleótidos e correspondente informação de genes foram obtidos a partir do banco de dados do NCBI (construir 36,3; https://www.ncbi.nlm.nih.gov/). sequências genómicas sintênicas ou homólogos de outros primatas e mamíferos, incluindo gambás (
Monodelphis domestica
) e ornitorrincos (
Ornithorhynchus anatinus
), foram obtidas a partir das bases de dados do NCBI e ENSEMBL (http: //uswest .ensembl.org /index.html). Para encontrar sintenia conservada entre o cromossomo X humano e cromossomos em outros animais, BLAST análises usando humana
MAGE
genes como consultas foram realizadas. Para identificar sequências homólogas, usamos 70% como valor de corte para pesquisas BLAST.
Identificação das estruturas genômicas
A identificação de IRS e repetições em série foi realizada utilizando uma abordagem matricial [ ,,,0],16]. GenomeMatcher [17] foi então usada para obtenção de informação detalhada sobre a similaridade de sequência de nucleótidos entre as unidades de duplicados. Um diagrama desenhada por este programa apresenta a extensão da semelhança entre sequências utilizando códigos de cor, representando vermelho com similaridade superior a 95%, laranja representando aproximadamente 90% -95%, verde que representa aproximadamente 85% -90%, e azul que representa mais baixa do que 85 %.
evolutiva filogenética molecular e análises
Para estudar relações filogenéticas entre
MAGE
membros da família, 158 sequências codificadoras (CDS), no homem, o chimpanzé (
Pan troglodytes
), Macaca (
Macaca mulatta
), rato (
Mus musculus
), vaca (
Bos taurus
), cão (
Canis lupus
), gambá, ornitorrinco, frango (
Gallus gallus
) e peixe-zebra (
Danio rerio) genoma foram obtidos a partir do banco de dados do NCBI (Tabela S1).
MAGE
homólogos, também foram pesquisados na base de dados Ensembl do sapo com garras Africano Ocidental (
Xenopus tropicalis
), lampreias (
Petromyzon marinus
), lancelets (
Branchiostoma floridae
), tunicados (
Ciona intestinalis
) e ouriços-do-mar (
Strongylocentrotus purpuratus
). Para cada uma destas espécies, que procurou
MAGE
homólogos ao longo de todo o genoma. Nas pesquisas para homólogos,
MAGE-D
membros da subfamília foram usados como uma consulta, porque
MAGE-D
é pensado para ser o ancestral
MAGE
da subfamília [7] . Quando usamos outras
MAGE
sequências humanos como uma consulta, verificou-se que as sequências detectados já foram incluídos no resultado obtido usando
MAGE-D
.
No genoma humano , havia 37 anotada
MAGE
genes no cromossomo X: 15
MAGE-a
s, 11
MAGE-B
s, três
MAGE-C
s, cinco
s, MAGE-D dois
s e um MAGE-e
MAGE-H
. Além disso, dois
MAGE-F
s estão localizados no cromossomo 3, e
necdin-like 2
(
NDNL2
ou
MAGE-G
) ,
MAGE-like 2
(
MAGE-L2
) e
necdin
(
NDN
) estão no cromossomo 15. Além dos genes anotados, um sequência homóloga (
psMAGEA-like: psMAGEAL
, NC_000023: 2.765.558 ‥ 2.770.471) correspondente ao humano
MAGE
pseudogene,
psMAGEA
(NC_000023: complementar 151.952.946 ‥ 151.957.859), foi identificado. abreviaturas dos genes utilizados neste estudo seguem os padrões utilizados para genes humanos
.
As sequências obtidas foram alinhadas usando software Clustal W [18] com correções manuais. As sequências de humano
MAGE-H
, –
A5
e mouse –
A9
eram curtos. Estes foram descartados porque a inclusão destas sequências fez uma breve alinhamento de sequências significativa. O número de diferenças de nucleótidos por site (
p
-Distância) foi então calculada usando MEGA4 [19], ea filogenia foi construído utilizando o vizinho a se associar (NJ) [20] método disponível neste software. Filogenias também foram construídas com Randomized A (x) ccelerated máxima verossimilhança (RAxML) [21] e métodos Bayesiana (Bayes). Um programa para o método RAxML é fornecido por https://phylobench.vital-it.ch/raxml-bb/e que, para o método de Bayes é [22] MrBayes 3. Os alinhamentos utilizados aqui estão disponíveis mediante solicitação. DnaSP V5 [23] foi usado para a análise janela de divergência de nucleotídeos. RepeatMasker [24] foi utilizada para pesquisar sequências de repetições intercaladas na base de dados NCBI. Um programa, GENECONV [25] foi utilizado para detectar a conversão do gene.
ligação do factor de transcrição locais
sítios de ligação de factor de transcrição (TFBS) foram examinadas usando o banco de dados TRANSFAC R4.3 [26], disponível no site da TFBIND (http: //tfbind.ims.u-tokyo.acjp/) [27]. Para encontrar um candidato de TFB, sequências a montante de genes alvo foram alinhados, e as sequências altamente conservadas foram escolhidos. As sequências foram verificados quanto à presença de TFBS anotada no banco de dados.
Resultados
Origem dos vertebrados e mamíferos
MAGE
família de genes
Para identificar
MAGE
homólogos em lampreias, lancelets, tunicados, e ouriços do mar, uma pesquisa BLAST foi realizada em seu genoma e sequências EST, usando
genes MAGE-D
como consultas. Embora não houvesse genes homólogos detectáveis em lampreias e ouriços do mar, genes hipotéticos em ambos os tunicados (XM_002119518) e lancelets (XM_002613563) apresentaram 37% de similaridade de sequência com o
MAGE-D1
humano. Os resultados da pesquisa BLAST indicou que a emergência de
MAGE
gene poderia ter ocorrido antes da divergência de Protochordata de Chrodata.
Nos vertebrados com mandíbula, o genoma do peixe-zebra possui um único
MAGE
gene,
Necdin-like 2
(
DareNDNL2
) [8].
NDNL2
genes são encontrados também em humanos, ratos e vacas, mas eutherian
NDNL2s
são processados genes e têm um único exão, enquanto que
DareNDNL2
possui -11 exons. A árvore filogenética com base em sequências de aminoácidos mostra que eutherian
NDNL2
s são paraphyletic para
DareNDNL2
(Figuras 1 e S1.):
DareNDNL2
é um ortólogo “primário” de eutherian
MAGE
genes [28]. Esta relação filogenética (topologia da árvore) também é suportado por RAxML e Bayes árvores (dados não mostrados).
CDS de 158
MAGE genes foram usadas (ver Tabela S1). Os CDS comparação é de 204 bp de comprimento. Após o alinhamento, todos os espaços foram excluídos para a construção árvore. cachos da subfamília são mostrados. O número em cada nó é o valor de bootstrap apoiar o nó. Peixe
NDNL2
(
Desafio NDNL2
) e mamíferos
NDNL2
são mostrados em azul. abreviaturas dos nomes de espécies são as seguintes: Bota (
Bos taraus
), Capo (
Cavia porcellus
), Dare (
Danio rerio
), Gaga (
Gallus gallus
), Hosa (
Homo sapiens
), Mamu (
Macaca mulatta
), Modo (
Monodelphis domestica
), Mumu (
Mus musculus
), Orna (
Ornithorhynchus anatinus
) e Patr (
Pan troglodytes
). Figura S1 é uma versão ampliada desta figura e tem o texto legível.
Cada um dos rã e frango genomas possui apenas um
MAGE
gene. Em ambos os casos, a respeito da relação sintênica com
DareNDNL2
, a posição do gene em um cromossomo não pôde ser confirmada por causa da atribuição incompleta de genes nos cromossomos nestas espécies. No entanto, dado que as fases em cada exão e intron limite nos CDS de peixes, rãs e galinhas foram bem conservada (Tabela 1), o single
MAGE
genes no rã e frango são susceptíveis de ser um-para -um orthologs de
DareNDNL2
.
Apesar de apenas um único
MAGE
foi encontrado em peixes, rãs e galinhas, os seres humanos e camundongos têm várias subfamílias de
MAGE
genes [7]. Assim, é interessante investigar
MAGE
homólogos em monotremados (ornitorrinco) e marsupiais (gambás). A pesquisa completa do genoma BLAST usando humana
MAGE-D1
como uma consulta detectou um
MAGE
-como (
MAGEL
) sequência no ornitorrinco e dois
MAGEL
s no gambá. Estes foram tentativamente denominado
OrnaMAGEL
e
ModoMAGEL1
/
L2
, respectivamente. BLAST procura utilizando outro
MAGE
genes tais como
DareNDNL2
como uma consulta resultou na detecção dos mesmos genes.
Gambás
ModoMAGEL1
e
ModoMAGEL2
está localizado nos cromossomas X e 8, respectivamente.
ModoMAGEL2
é codificada por um único exão, enquanto que
ModoMAGEL1
é codificada por 11 exons. Assim,
ModoMAGEL2
é provável que seja um gene transformadas derivadas de
ModoMAGEL1
. Na verdade,
ModoMAGEL1
e
ModoMAGEL2
formar um monophyly na árvore (Fig. 1, Fig. S1) e em árvores construídas por três métodos diferentes (NJ, RAxML e Bayes).
os ornitorrincos
OrnaMAGEL
gene está localizado no contig Ultra 403 e é composto por 10 exons. Embora o número de exões que difere do em
ModoMAGEL1
, as fases e tamanhos de exões partilhados são bem conservados (Tabela 1). Além disso, Ultra 403 também contém o gene da ubiquitina-ligase
HUWE1
(domínio HECT, UBA e WWE contendo 1), que está localizado a montante do ~600 KB
OrnaMAGEL
. Um
in situ
estudo hibridização confirmou que no ornitorrinco,
HUWE1
está localizado no cromossomo 6 [29]; Assim, é provável que este contig é uma parte do cromossoma 6. ornitorrinco cromossoma 6 é homólogo ao antepassado autossómica de eutherian e cromossomas X marsupiais [29]. Na verdade, a região circundante
OrnaMAGEL
no contig mostrou uma relação sintênica com a região Xp11 humano. No genoma humano, a posição correspondente ao
OrnaMAGEL
é ocupado por
MAGE-D2 Comprar e –
D3
(Fig. 2). Human
MAGE-D2 Comprar e –
D3
possui 13 exons, e as fases e tamanhos de exons compartilhados são conservados com
OrnaMAGEL
, bem como com o
ModoMAGEL1 Comprar e outro
MAGE
genes na galinha, sapo, e genomas de peixe-zebra (Tabela 1).
as barras vermelhas indicam
MAGE-D
ou
MAGEL
genes no ser humano ou ornitorrinco, respectivamente. barras pretas e nomes de genes indicam genes sintênicas entre humanos e ornitorrincos. barras azuis e nomes de genes indicam genes que não mostram sintenia. Outros
MAGE-D
membros da subfamília,
MAGE-D1
e
MAGE-D4
estão localizados em 51,6 M e 51,9 M no cromossomo X humano, respectivamente.
Filogenia do mamífero
MAGE
gene família
Uma árvore de recursos humanos
MAGE
genes mostra que o tipo três I
MAGE
subfamílias (
MAGE-a
, –
B Comprar e –
C
) formam um grupo monofilético que é distinta da dos sete subfamílias tipo II (
MAGE- D
, –
e
, –
F
, –
H
, –
L2
,
NDN
e
NDNL2
) (Fig. 3). A evidência é suportada por cinco substituições filogeneticamente informativos (D16Y, K23T, I62V, A113E, R156Q e em um alinhamento da MHD, Fig. S3). Além disso,
MAGE-D
genes formar um cluster monofilético. Embora o número de nucleótidos utilizado nesta análise é pequeno, é óbvio que o tipo I subfamílias divergiu mais recentemente do que o tipo II subfamílias (Fig. 3 e Fig. S2).
A árvore é baseado no número de diferenças de aminoácidos por site (
p
-distances). Genes mas para
DareNDNL2
na árvore são todos
MAGE
genes encontrados no genoma humano.
DareNDNL2
de peixe-zebra é usado para determinar a raiz da árvore. O número de sites de comparação é de 92 aminoácidos, sem lacunas. O valor de inicialização está indicado no nó. As sequências estão listadas na Tabela S1.
MAGE-E
duplicou MHD ea duplicação ocorreu mais cedo do que o surgimento de genes de tipo I.
MAGEE1_1
(
MAGEE2_1
) e
MAGEE1_2
(
MAGEE2_2
) representam o MHD em N e C lado do terminal do
MAGE-E1
(
MAGE-E2
), respectivamente. O eutherian
gene MAGE-D3
codifica trophinin (TRO), que se expressa na placenta e afeta a implantação do embrião.
Com a exceção de
MAGE-D
genes, mamíferos
MAGE
genes têm um único exão de CDS. Assim, estes são susceptíveis de ser tratados genes derivados de transcrições de
MAGE-D
ou outros
MAGE-D
processados genes [7], [30]. No entanto, não se pode descartar a possibilidade de que um antepassado de cada subfamília resultou de duplicação de um gene processado.
Para examinar como o antepassado de cada família de genes surgiu, as sequências de nucleótidos de uma única representantes de cada subfamília foram em comparação com um outro usando análise de matriz de pontos [16]. Se uma região de codificação inteira, incluindo flanqueando região foi duplicada, a análise dotter mostra a semelhança além dos CDS. Por outro lado, um antepassado de cada subfamília foi gerado por retrotransposição, a análise mostra a similaridade apenas nas CDS.
Para a maior
MAGE genes, a análise de matriz de pontos revelou que foram observadas dentro e entre II semelhanças significativas tipo I e somente em regiões CDS, sugerindo uma retrotranspostion. Uma comparação entre
MAGE-A
e
MAGE-C
, por outro lado, foi uma excepção. A comparação revela a semelhança além dos CDS, sugerindo a duplicação de genes baseados em DNA. No entanto, pode ser possível que outras subfamílias também foram gerados por duplicação de genes. A similaridade de sequência em regiões flanqueadoras de duplicatas possivelmente foi perdida durante a evolução por causa da restrição funcional mais fraca. Na verdade, o grau de divergência de sequências entre sinónimas gens tipo II e aqueles entre o tipo I e tipo II genes varia de 0,81 a 1,0, de tal modo que não foi observada nenhuma semelhança significativa numa região para além dos CDS. Embora marcadores cladísticas tais como
Linhas
poderiam ter sido informativo para distinguir retrotransposição de duplicação de genes, não existem tais elementos informativos foram encontrados. Portanto, na ausência de quaisquer evidências de suporte, concluiu-se que
MAGE-C
foi repetido a partir de
MAGE-A
e que outras subfamílias foram gerados por retrotransposição. No total, oito inserções de retrotransposed
MAGE
ocorreram no genoma de Eutheria ancestral e tornou-se cada gene processado um antepassado de uma subfamília. Seguindo retrotransposição, uma duplicação de genes independentes parece ter ocorrido dentro de cada subfamília.
A duplicação de genes ea formação palíndromo
É digno de nota que o padrão de agrupamento de
MAGE-A
difere da de
MAGE-B
(Fig. 1, a Fig. S1). Cada um dos 11 humana
MAGE-B
genes formar um cluster monofilético com ortólogos em outros eutérios, enquanto que a 15
MAGE-A
genes formar grupos de espécies ou específicos de táxon (fig. 1 , a Fig. S1 e S2). Além disso, três
MAGE-C
genes parecem ser primata-específicos. Dentro de dois tipo II
MAGE
subfamílias, cinco
MAGE-D
e dois
MAGE Restaurant –
E
genes também mostram um padrão de agrupamento (um- para-um ortólogo) semelhante ao de
MAGE-B
(Figs. 1 e 3).
Um total de 16
MAGE-a
genes estão localizados sobre Xq28, na região de 148 a 153 Mb Mb, e são agrupados em três blocos a, B e C (Fig. 4A). Blocos A e B contêm cinco (
MAGE Restaurant –
A11
, –
A9
, –
A9B
, –
A8 Comprar e
psMAGEA7
) e dez (
MAGE Restaurant –
A4
, –
A5
, –
A10
, –
A6
, –
A2B
, –
A2
, –
A12
, –
A3
,
psMAGEA Comprar e
psMAGEAL
) genes, respectivamente, enquanto bloco C contém um único gene (
MAGE-A1
) (Fig. 4B e C). Cada um dos três blocos possui um palindrome (Fig. 4C). No entanto, em apenas bloco B a maioria dos genes (seis em cada dez) estão localizados em ambos os braços do palíndromo (Fig. 4C). Três pares quase idêntica de
MAGE
–
A2
/
A2B
, –
A3
/
A6
,
psMAGEA /psMAGEAL
estão localizados em posições simétricas nos braços (fig. 4B e 4C), enquanto
MAGE-A12
situa-se na região do laço. Nós designado um par de genes ou sequências duplicadas x e y em posições simétricas do palindrome como x /y. A relação filogenética entre 16
MAGE-A
genes incluindo
psMAGEAL
(Fig. 4B, ver Materiais e Métodos) e com
MAGE-D
usado como um grupo externo revelou que cinco genes no bloco B está em um monophyly, enquanto um par de
psMAGEA
/
psMAGEAL
genes são distantemente relacionado com outro
MAGE-a
genes.
(
a
) Uma linha diagonal traçada a partir do canto superior esquerdo para o canto inferior direito indica identidade dentro da região. A região está dividida em três sub-regiões das, A, B, e C, que contêm cinco, 10 e um
genes MAGE-A
, respectivamente. (
B
) A árvore foi construída usando o número de diferenças de nucleótidos (
p
-distances) entre os CDSs (1916 pb) do 16
MAGE-A
genes. O número em cada nó representa a probabilidade de bootstrap apoiar esse nó. valores de bootstrap superior a 50% são mostrados. unidades taxonômicas operacionais (OTU) em magenta, verde e azul representam genes em sub-regiões A, B e C, respectivamente. (
C
) Três previu palíndromos mostrados na sub-regiões A, B e C. Em sub-região B, a maioria dos genes estão localizados nos braços palíndromo putativos.
bloco B humano consiste de sete unidades duplicado. Cada unidade é de 10-20 kb de comprimento e contém um
MAGE-A
e um gene associado condrossarcoma (
CSAGE
) [31] (Fig. 5
A
). análise BLAST de genomas de mamíferos também mostra a ausência de
CSAGE
homólogos em mamíferos não primatas. O palíndromo no bloco B não foi observado nos genomas não primatas, como os ratinhos, cães e cavalos genomas.
(
A
) As linhas diagonais a partir do canto superior esquerdo para o canto inferior direito indica identidade dentro do seqüência macaque (painel direito) humana (painel da esquerda) ou. Lacunas na linha diagonal no macaco indicam lacunas de sequenciamento. As caixas coloridas na parte inferior de cada painel indicam sete unidades duplicadas. As mesmas caixas coloridas dentro de uma espécie indica que eles são mais estreitamente relacionados entre si do que para os outros, enquanto aqueles entre as espécies indicam orthologs putativos. (
B
) Palindromes previsto na sub-região B do ser humano (esquerda) ou a sequência (direita) macaque. Números ao lado das linhas indicam cada unidade duplicada. (
C
) Uma árvore NJ baseado em
p
-distances entre as unidades duplicadas (2880 pb) é mostrado. O código de cor para OTU é o mesmo que em (
Um
) e (
B
).
Entre os primatas, bloco B pode ser identificada em macacos (Fig. 5
A
). Este bloco também contém sete unidades duplicadas, mas a forma do palíndromo esperado difere entre o humano e macaque. Ao contrário da haste longa e laço curto observado no ser humano, no macaco, um tronco curto e uma grande estrutura de loop está previsto (Fig. 5
B
). Além disso, o ortologia de unidades entre macacos e seres humanos é curioso dadas as suas posições. Por conveniência, designou os sete unidades duplicadas no bloco B como
h1
para
h7
em seres humanos e
m1
para
m
7 em macacos ( Fig. 5
A
) e depois examinou suas relações filogenéticas (Fig. 5
C
). Unidades de
h1
/
H7
abrigar
psMAGEAL
e
psMAGEA
genes são ortólogo ao
m1
/
. Unidades de
h3
/
h5
com
MAGE-A2 /A2B
genes são ortólogo ao
m5
com
MAGE-A2
: no entanto, em macacos,
m5
está localizado no circuito e não há parceiro (uma sequência altamente semelhante) de
m5
no bloco. A unidade de
h4
com
MAGE-A12
é ortólogo ao
m3
, mas em macacos esta unidade não contém um
MAGE
gene (Fig . 5
A
). Além disso, as relações entre
h2
/
h6
,
m
2,
m4
e
m
6 são um pouco confuso, apesar do fato de que o
MAEG-A3 /A6
está no
h2
/
h6 Comprar e três homólogos possíveis (
MAGE-A3
, –
3L
e –
A3L
) estão em
m
2,
m4
e
m
6. O
p
-Distância entre
h2
e
h6
foi de 0,7% (± 0,2), enquanto o
p
-distances entre
m Página 2,
m4
e
m
6 são muito maiores (12,1%) do que o anterior. As distâncias entre pares de unidades entre os seres humanos e macacos variou de 8,3% (± 0,5) a 17,7% (± 0,7), que é demasiado grande para uma relação de ortólogos. A filogenia também não apoiar uma relação ortóloga entre cada uma das três unidades em macacos (
m
2,
m4
, ou
m
6) e
h2 Twitter /
h6
(Fig. 5
C
).
Para examinar ainda mais as relações ortólogos dessas unidades duplicadas, marcadores cladísticas tais como
SINE
s e
LINHA
s foram procurados utilizando software RepeatMasker [24] (Fig. 6). Em geral, o arranjo de
SINE
s,
LINHA
s,
LTR
s, e repete curtas em bloco B mostra semelhança parcial entre o genoma humano e macaque. A posição eo tipo de sequências repetitivas encontradas ao longo de toda
m2 e região são quase idênticos aos encontrados na metade distal do
h2
. Uma distribuição semelhante de sequências repetitivas é observada entre uma região de
m5
e
h5
, e à semelhança é também observada entre uma parte do
m4
e que de
h4
. No entanto, espécies específicas regiões parecem estar presentes em cada genoma. Nos seres humanos, a região é ~ 40 kb de comprimento e se estende a partir do meio de
H2
H4
, enquanto que em macacos, a região de espécies específicas é ~ 30 kb e se estende a partir de meados de
m2
para
m4
. Ao contrário de resultados das análises de filogenia e distância genética (Fig. 5
C
e 6), os marcadores cladísticas mostrou que
h2
com humano
MAGE-A6 Comprar e
m2
com o macaco
MAGE3L Quais são, na verdade ortólogos entre si.
triângulos coloridos mostram elementos intercalados (
Linhas
ou
SINEs
) ,
LTRs
, transposons de DNA (
DNA-TP
) ou repetições simples (
SR
) encontrados no genoma humano ou Macaca, respectivamente. Suportes sob cada linha indicam unidades duplicados. setas rosa claro indicam estrutura palíndromo. A seta azul claro indica lacunas de sequenciamento em macacos. Letras A a L e uma ‘to i’ sobre os triângulos indicam elementos de inserção ortólogos em genomas humanos e de macaco. A luz barra verde indica uma região e pontilhadas de origem humana ou de macaco-específica linhas indicam a fronteira entre as regiões de espécies específicas e ortólogos.
-específica Humano palíndromo e gene conversão
A a análise de matriz de pontos revelou que o palindrome no bloco B é aparente apenas em humanos. Embora lacunas sequenciamento existir atualmente no chimpanzé eo genoma do orangotango, as sequências disponíveis mostrou que o palíndromo no bloco B é menos aparente nestes dois macacos do que nos seres humanos (Fig. 7). Nós parcimoniosamente inferir o estado ancestral do palíndromo usando informações da sequência do genoma de espécies de primatas existentes.
O tamanho da janela é de 500 pb, sem sobreposição entre as janelas adjacentes. retângulos coloridos na parte inferior da figura indicam a unidade duplicada incluindo o
MAGE
genes (setas cor de rosa claro). A ordenada representa a divergência de nucleótidos (
d
) e a abcissa representa a posição (em pb) em relação ao centro da espira (posição zero, seta azul). A área em torno de uma linha pontilhada vermelha indicam a região divergiram alta no
MAGE-A3 Comprar e
MAGE-A6
.
Genes sobre palíndromos pode enfrentar conversão gene frequentes .