PLOS ONE: Evolutionary História da Imunidade Cancer Antigen MAGE Gene Family

Abstract

O modo evolutivo de uma família multi-gene pode mudar ao longo do tempo, dependendo da diferenciação funcional e meio ambiente genômica local dos membros da família. Neste estudo, demonstramos uma tal alteração do antigénio de melanoma (

MAGE

) família de genes no cromossoma X de mamífero. O

MAGE

família de genes é composto por dez subfamílias que podem ser classificados em dois tipos. Tipo I genes são de origem relativamente recente, e que codificam para epitopos de antigénio de leucócitos humanos (HLA) em células cancerosas. Tipo II genes são relativamente antigo e alguns dos seus produtos são conhecidos por estar envolvidos na apoptose ou da proliferação celular. A história evolutiva da

MAGE

família de genes pode ser dividido em quatro fases. Na fase I, um estado de cópia única de um gene ancestral eo modo evolutivamente conservada durou até o surgimento dos mamíferos eutherian. Na fase II, oito antepassados ​​da subfamília, com exceção de

MAGE-C Comprar e

MAGE-D

subfamílias, foram formados através retrotransposição de forma independente. Isto coincide com uma explosão transposição da

Elementos da linha

na radiação eutherian. No entanto,

MAGE-C

foi gerado por duplicação de genes de

MAGE-A

. Fase III é caracterizada por duplicação de genes extensa dentro de cada subfamília e, em especial, a formação de palíndromos no

MAGE-A

subfamília, que ocorreu em um ancestral do Catarrhini. Fase IV é caracterizado por o decaimento de um palindroma na maioria Catarrinos, com a excepção dos humanos. Embora o palíndromo é truncado por eliminações frequentes em macacos e macacos do Velho Mundo, ele é mantido em seres humanos. Aqui, defendemos que esta retenção específico do ser humano provém de seleção negativa agindo em

MAGE-A

genes que codificam epítopos de células cancerosas, que preserva a sua capacidade de se ligar a moléculas de HLA altamente divergentes. Estes achados são interpretados levando em consideração os fatores biológicos que moldam recentes humanos

MAGE-A

genes

Citation:. Katsura Y, Satta Y (2011) Evolutiva História da Imunidade Cancer Antigen

MAGE

família de genes. PLoS ONE 6 (6): e20365. doi: 10.1371 /journal.pone.0020365

editor: Nikolas Nikolaidis, California State University Fullerton, Estados Unidos da América

Recebido: 14 de fevereiro de 2011; Aceito: 18 de abril de 2011; Publicação: 10 de junho de 2011

Direitos de autor: © 2011 Katsura, Satta. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiada por uma ajuda de Grant-in para a Investigação Científica em Áreas prioritárias (17.018.032). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o modo evolutivo de uma família de genes, ou seja, o processo de nascimento e morte de genes e as extensões de divergência de seqüência, depende da divergência funcional de genes duplicados e sobre a estrutura local do genoma onde reside a família [1], [2]. Aqui, a estrutura local do genoma refere-se a tandem ou repetições invertidas (IRS). A evolução de uma família de genes em IRS pode ser particularmente complexo como um resultado da homogeneização por conversão do gene frequente e instabilidade estrutural, tais como devido às inserções e /ou deleções frequentes.

Warburton et ai. (2004) encontraram uma preponderância de grandes, IRs com um elevado grau de semelhança entre as repetições sobre os cromossomos X e Y (~ 30% de IR no genoma humano estão na cromossomos X e Y) [3]. Muitos IRS em X e Y contêm genes expressos predominantemente nos testículos [3]. Warburton e seus colegas sugeriram que estes RIs desempenhar um papel importante na evolução do genoma humano. No entanto, o papel preciso de IRs na evolução manteve-se incerto. Portanto, neste estudo, tentamos analisar o ritmo eo modo da evolução da família de genes em IRs, com um foco específico sobre o antígeno melanoma (

MAGE

) família de genes, em que os membros estão localizados em uma grande ( ~ 100 kb) palindrome no cromossoma X humano.

MAGE

foi originalmente identificado como “um antigénio de melanoma” e, posteriormente,

MAGE

e seus homólogos que foram descobertos para formar um família multi-genes em genomas eutherian [4] – [7].

MAGE

sequências homólogas foram encontradas em alguns vertebrados (peixe-zebra e frango) [8], [9] e invertebrados (mosca da fruta) [10]. No genoma humano, esta família está composta por 10 subfamílias e cada subfamília é constituída por uma a 15 genes [7]. Para além da classificação por subfamília,

MAGE

genes podem também ser classificados em tipo I ou II, com base em seus padrões e função de expressão. genes do tipo I são compostas de três subfamílias (

MAGE-A

, para –

C

) e tipo II genes de sete subfamílias (

MAGE-D

para –

F

, –

H

, –

L2

,

NDN

,

NDNL2

). genes do tipo I são expressos em células altamente proliferativas, tais como tumores, placenta e as células [4] de linha germinal. genes de tipo II, pelo contrário, são ubiquamente expressa em células somáticas, e alguns genes do tipo II são conhecidos por estar envolvido em apoptose ou proliferação celular [11].

Todo o tipo I

MAGE

genes estão localizados no cromossoma X e antigénios tumorais codificam que desempenham um papel chave na imunidade do cancro. Os péptidos do domínio de homologia MAGE humana (MHD), que é de 160-170 aminoácidos de comprimento, são epítopos do antigénio de leucócitos humanos (HLA) da classe I de moléculas [4]. Quando o antigénio (péptido no MHD) em uma célula de tumor se liga a um receptor numa célula T assassino, os ataques de células T a células tumorais [4], [12].

HLA

é excepcionalmente polimórfica no genoma humano e diferente

HLA

alelos pode ligar epítopos diferentes [13], [14].

MAGE genes podem codificar diversos epitopos de modo a ligar-se a, ou reagir com, cada uma das moléculas de HLA. Assim, é de interesse para rastrear a origem da associação entre o

HLA

e

MAGE

, bem como para determinar como a diversidade genética na região de codificação epitopo tem evoluído e sido mantida.

Muitos

MAGE

genes são pensados ​​para ser específico de mamíferos [7]. Além disso, a maioria dos eutherian

MAGE

genes têm um único exão para codificar uma proteína e, portanto, eles são susceptíveis de ter derivado de retrotransposição de

MAGE-D

[7], porque só

MAGE-D membros da subfamília

tem 14 exões onde um ORF é codificados entre o segundo exões a 12o [15]. No entanto, a relação entre o tipo I e tipo II genes não foi totalmente investigado e o modo de diversificação desses genes ainda não está claro.

Neste estudo, nós investigamos a história evolutiva do

MAGE

família de genes. Em primeiro lugar, procurou os

genes MAGE

mais antigamente divergiram em vertebrados e invertebrados genomas. Em segundo lugar, nós investigamos como e quando ancestrais de cada três tipo I e sete subfamílias tipo II foram gerados com especial referência ao seu modo de amplificação. Em terceiro lugar, vamos nos concentrar no

MAGE Restaurant –

A

da subfamília (um do tipo I subfamílias) e demonstrar como o arranjo genoma tenha ocorrido em primatas. Finalmente, mostramos que alguns

MAGE

humana –

A

genes foram submetidos a seleção negativa contra a homogeneização através da conversão gênica, a fim de manter as suas variações genéticas entre as sequências de aminoácidos. Nós sugerimos que esta seleção está relacionada com a manutenção de uma variedade de HLA epitopos em células cancerosas.

Materiais e Métodos

sequências utilizadas

Humanos (

Homo sapiens

) dados de sequências de nucleótidos e correspondente informação de genes foram obtidos a partir do banco de dados do NCBI (construir 36,3; https://www.ncbi.nlm.nih.gov/). sequências genómicas sintênicas ou homólogos de outros primatas e mamíferos, incluindo gambás (

Monodelphis domestica

) e ornitorrincos (

Ornithorhynchus anatinus

), foram obtidas a partir das bases de dados do NCBI e ENSEMBL (http: //uswest .ensembl.org /index.html). Para encontrar sintenia conservada entre o cromossomo X humano e cromossomos em outros animais, BLAST análises usando humana

MAGE

genes como consultas foram realizadas. Para identificar sequências homólogas, usamos 70% como valor de corte para pesquisas BLAST.

Identificação das estruturas genômicas

A identificação de IRS e repetições em série foi realizada utilizando uma abordagem matricial [ ,,,0],16]. GenomeMatcher [17] foi então usada para obtenção de informação detalhada sobre a similaridade de sequência de nucleótidos entre as unidades de duplicados. Um diagrama desenhada por este programa apresenta a extensão da semelhança entre sequências utilizando códigos de cor, representando vermelho com similaridade superior a 95%, laranja representando aproximadamente 90% -95%, verde que representa aproximadamente 85% -90%, e azul que representa mais baixa do que 85 %.

evolutiva filogenética molecular e análises

Para estudar relações filogenéticas entre

MAGE

membros da família, 158 sequências codificadoras (CDS), no homem, o chimpanzé (

Pan troglodytes

), Macaca (

Macaca mulatta

), rato (

Mus musculus

), vaca (

Bos taurus

), cão (

Canis lupus

), gambá, ornitorrinco, frango (

Gallus gallus

) e peixe-zebra (

Danio rerio) genoma foram obtidos a partir do banco de dados do NCBI (Tabela S1).

MAGE

homólogos, também foram pesquisados ​​na base de dados Ensembl do sapo com garras Africano Ocidental (

Xenopus tropicalis

), lampreias (

Petromyzon marinus

), lancelets (

Branchiostoma floridae

), tunicados (

Ciona intestinalis

) e ouriços-do-mar (

Strongylocentrotus purpuratus

). Para cada uma destas espécies, que procurou

MAGE

homólogos ao longo de todo o genoma. Nas pesquisas para homólogos,

MAGE-D

membros da subfamília foram usados ​​como uma consulta, porque

MAGE-D

é pensado para ser o ancestral

MAGE

da subfamília [7] . Quando usamos outras

MAGE

sequências humanos como uma consulta, verificou-se que as sequências detectados já foram incluídos no resultado obtido usando

MAGE-D

.

No genoma humano , havia 37 anotada

MAGE

genes no cromossomo X: 15

MAGE-a

s, 11

MAGE-B

s, três

MAGE-C

s, cinco

s, MAGE-D dois

s e um MAGE-e

MAGE-H

. Além disso, dois

MAGE-F

s estão localizados no cromossomo 3, e

necdin-like 2

(

NDNL2

ou

MAGE-G

) ,

MAGE-like 2

(

MAGE-L2

) e

necdin

(

NDN

) estão no cromossomo 15. Além dos genes anotados, um sequência homóloga (

psMAGEA-like: psMAGEAL

, NC_000023: 2.765.558 ‥ 2.770.471) correspondente ao humano

MAGE

pseudogene,

psMAGEA

(NC_000023: complementar 151.952.946 ‥ 151.957.859), foi identificado. abreviaturas dos genes utilizados neste estudo seguem os padrões utilizados para genes humanos

.

As sequências obtidas foram alinhadas usando software Clustal W [18] com correções manuais. As sequências de humano

MAGE-H

, –

A5

e mouse –

A9

eram curtos. Estes foram descartados porque a inclusão destas sequências fez uma breve alinhamento de sequências significativa. O número de diferenças de nucleótidos por site (

p

-Distância) foi então calculada usando MEGA4 [19], ea filogenia foi construído utilizando o vizinho a se associar (NJ) [20] método disponível neste software. Filogenias também foram construídas com Randomized A (x) ccelerated máxima verossimilhança (RAxML) [21] e métodos Bayesiana (Bayes). Um programa para o método RAxML é fornecido por https://phylobench.vital-it.ch/raxml-bb/e que, para o método de Bayes é [22] MrBayes 3. Os alinhamentos utilizados aqui estão disponíveis mediante solicitação. DnaSP V5 [23] foi usado para a análise janela de divergência de nucleotídeos. RepeatMasker [24] foi utilizada para pesquisar sequências de repetições intercaladas na base de dados NCBI. Um programa, GENECONV [25] foi utilizado para detectar a conversão do gene.

ligação do factor de transcrição locais

sítios de ligação de factor de transcrição (TFBS) foram examinadas usando o banco de dados TRANSFAC R4.3 [26], disponível no site da TFBIND (http: //tfbind.ims.u-tokyo.acjp/) [27]. Para encontrar um candidato de TFB, sequências a montante de genes alvo foram alinhados, e as sequências altamente conservadas foram escolhidos. As sequências foram verificados quanto à presença de TFBS anotada no banco de dados.

Resultados

Origem dos vertebrados e mamíferos

MAGE

família de genes

Para identificar

MAGE

homólogos em lampreias, lancelets, tunicados, e ouriços do mar, uma pesquisa BLAST foi realizada em seu genoma e sequências EST, usando

genes MAGE-D

como consultas. Embora não houvesse genes homólogos detectáveis ​​em lampreias e ouriços do mar, genes hipotéticos em ambos os tunicados (XM_002119518) e lancelets (XM_002613563) apresentaram 37% de similaridade de sequência com o

MAGE-D1

humano. Os resultados da pesquisa BLAST indicou que a emergência de

MAGE

gene poderia ter ocorrido antes da divergência de Protochordata de Chrodata.

Nos vertebrados com mandíbula, o genoma do peixe-zebra possui um único

MAGE

gene,

Necdin-like 2

(

DareNDNL2

) [8].

NDNL2

genes são encontrados também em humanos, ratos e vacas, mas eutherian

NDNL2s

são processados ​​genes e têm um único exão, enquanto que

DareNDNL2

possui -11 exons. A árvore filogenética com base em sequências de aminoácidos mostra que eutherian

NDNL2

s são paraphyletic para

DareNDNL2

(Figuras 1 e S1.):

DareNDNL2

é um ortólogo “primário” de eutherian

MAGE

genes [28]. Esta relação filogenética (topologia da árvore) também é suportado por RAxML e Bayes árvores (dados não mostrados).

CDS de 158

MAGE genes foram usadas (ver Tabela S1). Os CDS comparação é de 204 bp de comprimento. Após o alinhamento, todos os espaços foram excluídos para a construção árvore. cachos da subfamília são mostrados. O número em cada nó é o valor de bootstrap apoiar o nó. Peixe

NDNL2

(

Desafio NDNL2

) e mamíferos

NDNL2

são mostrados em azul. abreviaturas dos nomes de espécies são as seguintes: Bota (

Bos taraus

), Capo (

Cavia porcellus

), Dare (

Danio rerio

), Gaga (

Gallus gallus

), Hosa (

Homo sapiens

), Mamu (

Macaca mulatta

), Modo (

Monodelphis domestica

), Mumu (

Mus musculus

), Orna (

Ornithorhynchus anatinus

) e Patr (

Pan troglodytes

). Figura S1 é uma versão ampliada desta figura e tem o texto legível.

Cada um dos rã e frango genomas possui apenas um

MAGE

gene. Em ambos os casos, a respeito da relação sintênica com

DareNDNL2

, a posição do gene em um cromossomo não pôde ser confirmada por causa da atribuição incompleta de genes nos cromossomos nestas espécies. No entanto, dado que as fases em cada exão e intron limite nos CDS de peixes, rãs e galinhas foram bem conservada (Tabela 1), o single

MAGE

genes no rã e frango são susceptíveis de ser um-para -um orthologs de

DareNDNL2

.

Apesar de apenas um único

MAGE

foi encontrado em peixes, rãs e galinhas, os seres humanos e camundongos têm várias subfamílias de

MAGE

genes [7]. Assim, é interessante investigar

MAGE

homólogos em monotremados (ornitorrinco) e marsupiais (gambás). A pesquisa completa do genoma BLAST usando humana

MAGE-D1

como uma consulta detectou um

MAGE

-como (

MAGEL

) sequência no ornitorrinco e dois

MAGEL

s no gambá. Estes foram tentativamente denominado

OrnaMAGEL

e

ModoMAGEL1

/

L2

, respectivamente. BLAST procura utilizando outro

MAGE

genes tais como

DareNDNL2

como uma consulta resultou na detecção dos mesmos genes.

Gambás

ModoMAGEL1

e

ModoMAGEL2

está localizado nos cromossomas X e 8, respectivamente.

ModoMAGEL2

é codificada por um único exão, enquanto que

ModoMAGEL1

é codificada por 11 exons. Assim,

ModoMAGEL2

é provável que seja um gene transformadas derivadas de

ModoMAGEL1

. Na verdade,

ModoMAGEL1

e

ModoMAGEL2

formar um monophyly na árvore (Fig. 1, Fig. S1) e em árvores construídas por três métodos diferentes (NJ, RAxML e Bayes).

os ornitorrincos

OrnaMAGEL

gene está localizado no contig Ultra 403 e é composto por 10 exons. Embora o número de exões que difere do em

ModoMAGEL1

, as fases e tamanhos de exões partilhados são bem conservados (Tabela 1). Além disso, Ultra 403 também contém o gene da ubiquitina-ligase

HUWE1

(domínio HECT, UBA e WWE contendo 1), que está localizado a montante do ~600 KB

OrnaMAGEL

. Um

in situ

estudo hibridização confirmou que no ornitorrinco,

HUWE1

está localizado no cromossomo 6 [29]; Assim, é provável que este contig é uma parte do cromossoma 6. ornitorrinco cromossoma 6 é homólogo ao antepassado autossómica de eutherian e cromossomas X marsupiais [29]. Na verdade, a região circundante

OrnaMAGEL

no contig mostrou uma relação sintênica com a região Xp11 humano. No genoma humano, a posição correspondente ao

OrnaMAGEL

é ocupado por

MAGE-D2 Comprar e –

D3

(Fig. 2). Human

MAGE-D2 Comprar e –

D3

possui 13 exons, e as fases e tamanhos de exons compartilhados são conservados com

OrnaMAGEL

, bem como com o

ModoMAGEL1 Comprar e outro

MAGE

genes na galinha, sapo, e genomas de peixe-zebra (Tabela 1).

as barras vermelhas indicam

MAGE-D

ou

MAGEL

genes no ser humano ou ornitorrinco, respectivamente. barras pretas e nomes de genes indicam genes sintênicas entre humanos e ornitorrincos. barras azuis e nomes de genes indicam genes que não mostram sintenia. Outros

MAGE-D

membros da subfamília,

MAGE-D1

e

MAGE-D4

estão localizados em 51,6 M e 51,9 M no cromossomo X humano, respectivamente.

Filogenia do mamífero

MAGE

gene família

Uma árvore de recursos humanos

MAGE

genes mostra que o tipo três I

MAGE

subfamílias (

MAGE-a

, –

B Comprar e –

C

) formam um grupo monofilético que é distinta da dos sete subfamílias tipo II (

MAGE- D

, –

e

, –

F

, –

H

, –

L2

,

NDN

e

NDNL2

) (Fig. 3). A evidência é suportada por cinco substituições filogeneticamente informativos (D16Y, K23T, I62V, A113E, R156Q e em um alinhamento da MHD, Fig. S3). Além disso,

MAGE-D

genes formar um cluster monofilético. Embora o número de nucleótidos utilizado nesta análise é pequeno, é óbvio que o tipo I subfamílias divergiu mais recentemente do que o tipo II subfamílias (Fig. 3 e Fig. S2).

A árvore é baseado no número de diferenças de aminoácidos por site (

p

-distances). Genes mas para

DareNDNL2

na árvore são todos

MAGE

genes encontrados no genoma humano.

DareNDNL2

de peixe-zebra é usado para determinar a raiz da árvore. O número de sites de comparação é de 92 aminoácidos, sem lacunas. O valor de inicialização está indicado no nó. As sequências estão listadas na Tabela S1.

MAGE-E

duplicou MHD ea duplicação ocorreu mais cedo do que o surgimento de genes de tipo I.

MAGEE1_1

(

MAGEE2_1

) e

MAGEE1_2

(

MAGEE2_2

) representam o MHD em N e C lado do terminal do

MAGE-E1

(

MAGE-E2

), respectivamente. O eutherian

gene MAGE-D3

codifica trophinin (TRO), que se expressa na placenta e afeta a implantação do embrião.

Com a exceção de

MAGE-D

genes, mamíferos

MAGE

genes têm um único exão de CDS. Assim, estes são susceptíveis de ser tratados genes derivados de transcrições de

MAGE-D

ou outros

MAGE-D

processados ​​genes [7], [30]. No entanto, não se pode descartar a possibilidade de que um antepassado de cada subfamília resultou de duplicação de um gene processado.

Para examinar como o antepassado de cada família de genes surgiu, as sequências de nucleótidos de uma única representantes de cada subfamília foram em comparação com um outro usando análise de matriz de pontos [16]. Se uma região de codificação inteira, incluindo flanqueando região foi duplicada, a análise dotter mostra a semelhança além dos CDS. Por outro lado, um antepassado de cada subfamília foi gerado por retrotransposição, a análise mostra a similaridade apenas nas CDS.

Para a maior

MAGE genes, a análise de matriz de pontos revelou que foram observadas dentro e entre II semelhanças significativas tipo I e somente em regiões CDS, sugerindo uma retrotranspostion. Uma comparação entre

MAGE-A

e

MAGE-C

, por outro lado, foi uma excepção. A comparação revela a semelhança além dos CDS, sugerindo a duplicação de genes baseados em DNA. No entanto, pode ser possível que outras subfamílias também foram gerados por duplicação de genes. A similaridade de sequência em regiões flanqueadoras de duplicatas possivelmente foi perdida durante a evolução por causa da restrição funcional mais fraca. Na verdade, o grau de divergência de sequências entre sinónimas gens tipo II e aqueles entre o tipo I e tipo II genes varia de 0,81 a 1,0, de tal modo que não foi observada nenhuma semelhança significativa numa região para além dos CDS. Embora marcadores cladísticas tais como

Linhas

poderiam ter sido informativo para distinguir retrotransposição de duplicação de genes, não existem tais elementos informativos foram encontrados. Portanto, na ausência de quaisquer evidências de suporte, concluiu-se que

MAGE-C

foi repetido a partir de

MAGE-A

e que outras subfamílias foram gerados por retrotransposição. No total, oito inserções de retrotransposed

MAGE

ocorreram no genoma de Eutheria ancestral e tornou-se cada gene processado um antepassado de uma subfamília. Seguindo retrotransposição, uma duplicação de genes independentes parece ter ocorrido dentro de cada subfamília.

A duplicação de genes ea formação palíndromo

É digno de nota que o padrão de agrupamento de

MAGE-A

difere da de

MAGE-B

(Fig. 1, a Fig. S1). Cada um dos 11 humana

MAGE-B

genes formar um cluster monofilético com ortólogos em outros eutérios, enquanto que a 15

MAGE-A

genes formar grupos de espécies ou específicos de táxon (fig. 1 , a Fig. S1 e S2). Além disso, três

MAGE-C

genes parecem ser primata-específicos. Dentro de dois tipo II

MAGE

subfamílias, cinco

MAGE-D

e dois

MAGE Restaurant –

E

genes também mostram um padrão de agrupamento (um- para-um ortólogo) semelhante ao de

MAGE-B

(Figs. 1 e 3).

Um total de 16

MAGE-a

genes estão localizados sobre Xq28, na região de 148 a 153 Mb Mb, e são agrupados em três blocos a, B e C (Fig. 4A). Blocos A e B contêm cinco (

MAGE Restaurant –

A11

, –

A9

, –

A9B

, –

A8 Comprar e

psMAGEA7

) e dez (

MAGE Restaurant –

A4

, –

A5

, –

A10

, –

A6

, –

A2B

, –

A2

, –

A12

, –

A3

,

psMAGEA Comprar e

psMAGEAL

) genes, respectivamente, enquanto bloco C contém um único gene (

MAGE-A1

) (Fig. 4B e C). Cada um dos três blocos possui um palindrome (Fig. 4C). No entanto, em apenas bloco B a maioria dos genes (seis em cada dez) estão localizados em ambos os braços do palíndromo (Fig. 4C). Três pares quase idêntica de

MAGE

A2

/

A2B

, –

A3

/

A6

,

psMAGEA /psMAGEAL

estão localizados em posições simétricas nos braços (fig. 4B e 4C), enquanto

MAGE-A12

situa-se na região do laço. Nós designado um par de genes ou sequências duplicadas x e y em posições simétricas do palindrome como x /y. A relação filogenética entre 16

MAGE-A

genes incluindo

psMAGEAL

(Fig. 4B, ver Materiais e Métodos) e com

MAGE-D

usado como um grupo externo revelou que cinco genes no bloco B está em um monophyly, enquanto um par de

psMAGEA

/

psMAGEAL

genes são distantemente relacionado com outro

MAGE-a

genes.

(

a

) Uma linha diagonal traçada a partir do canto superior esquerdo para o canto inferior direito indica identidade dentro da região. A região está dividida em três sub-regiões das, A, B, e C, que contêm cinco, 10 e um

genes MAGE-A

, respectivamente. (

B

) A árvore foi construída usando o número de diferenças de nucleótidos (

p

-distances) entre os CDSs (1916 pb) do 16

MAGE-A

genes. O número em cada nó representa a probabilidade de bootstrap apoiar esse nó. valores de bootstrap superior a 50% são mostrados. unidades taxonômicas operacionais (OTU) em magenta, verde e azul representam genes em sub-regiões A, B e C, respectivamente. (

C

) Três previu palíndromos mostrados na sub-regiões A, B e C. Em sub-região B, a maioria dos genes estão localizados nos braços palíndromo putativos.

bloco B humano consiste de sete unidades duplicado. Cada unidade é de 10-20 kb de comprimento e contém um

MAGE-A

e um gene associado condrossarcoma (

CSAGE

) [31] (Fig. 5

A

). análise BLAST de genomas de mamíferos também mostra a ausência de

CSAGE

homólogos em mamíferos não primatas. O palíndromo no bloco B não foi observado nos genomas não primatas, como os ratinhos, cães e cavalos genomas.

(

A

) As linhas diagonais a partir do canto superior esquerdo para o canto inferior direito indica identidade dentro do seqüência macaque (painel direito) humana (painel da esquerda) ou. Lacunas na linha diagonal no macaco indicam lacunas de sequenciamento. As caixas coloridas na parte inferior de cada painel indicam sete unidades duplicadas. As mesmas caixas coloridas dentro de uma espécie indica que eles são mais estreitamente relacionados entre si do que para os outros, enquanto aqueles entre as espécies indicam orthologs putativos. (

B

) Palindromes previsto na sub-região B do ser humano (esquerda) ou a sequência (direita) macaque. Números ao lado das linhas indicam cada unidade duplicada. (

C

) Uma árvore NJ baseado em

p

-distances entre as unidades duplicadas (2880 pb) é mostrado. O código de cor para OTU é o mesmo que em (

Um

) e (

B

).

Entre os primatas, bloco B pode ser identificada em macacos (Fig. 5

A

). Este bloco também contém sete unidades duplicadas, mas a forma do palíndromo esperado difere entre o humano e macaque. Ao contrário da haste longa e laço curto observado no ser humano, no macaco, um tronco curto e uma grande estrutura de loop está previsto (Fig. 5

B

). Além disso, o ortologia de unidades entre macacos e seres humanos é curioso dadas as suas posições. Por conveniência, designou os sete unidades duplicadas no bloco B como

h1

para

h7

em seres humanos e

m1

para

m

7 em macacos ( Fig. 5

A

) e depois examinou suas relações filogenéticas (Fig. 5

C

). Unidades de

h1

/

H7

abrigar

psMAGEAL

e

psMAGEA

genes são ortólogo ao

m1

/

. Unidades de

h3

/

h5

com

MAGE-A2 /A2B

genes são ortólogo ao

m5

com

MAGE-A2

: no entanto, em macacos,

m5

está localizado no circuito e não há parceiro (uma sequência altamente semelhante) de

m5

no bloco. A unidade de

h4

com

MAGE-A12

é ortólogo ao

m3

, mas em macacos esta unidade não contém um

MAGE

gene (Fig . 5

A

). Além disso, as relações entre

h2

/

h6

,

m

2,

m4

e

m

6 são um pouco confuso, apesar do fato de que o

MAEG-A3 /A6

está no

h2

/

h6 Comprar e três homólogos possíveis (

MAGE-A3

, –

3L

e –

A3L

) estão em

m

2,

m4

e

m

6. O

p

-Distância entre

h2

e

h6

foi de 0,7% (± 0,2), enquanto o

p

-distances entre

m Página 2,

m4

e

m

6 são muito maiores (12,1%) do que o anterior. As distâncias entre pares de unidades entre os seres humanos e macacos variou de 8,3% (± 0,5) a 17,7% (± 0,7), que é demasiado grande para uma relação de ortólogos. A filogenia também não apoiar uma relação ortóloga entre cada uma das três unidades em macacos (

m

2,

m4

, ou

m

6) e

h2 Twitter /

h6

(Fig. 5

C

).

Para examinar ainda mais as relações ortólogos dessas unidades duplicadas, marcadores cladísticas tais como

SINE

s e

LINHA

s foram procurados utilizando software RepeatMasker [24] (Fig. 6). Em geral, o arranjo de

SINE

s,

LINHA

s,

LTR

s, e repete curtas em bloco B mostra semelhança parcial entre o genoma humano e macaque. A posição eo tipo de sequências repetitivas encontradas ao longo de toda

m2 e região são quase idênticos aos encontrados na metade distal do

h2

. Uma distribuição semelhante de sequências repetitivas é observada entre uma região de

m5

e

h5

, e à semelhança é também observada entre uma parte do

m4

e que de

h4

. No entanto, espécies específicas regiões parecem estar presentes em cada genoma. Nos seres humanos, a região é ~ 40 kb de comprimento e se estende a partir do meio de

H2

H4

, enquanto que em macacos, a região de espécies específicas é ~ 30 kb e se estende a partir de meados de

m2

para

m4

. Ao contrário de resultados das análises de filogenia e distância genética (Fig. 5

C

e 6), os marcadores cladísticas mostrou que

h2

com humano

MAGE-A6 Comprar e

m2

com o macaco

MAGE3L Quais são, na verdade ortólogos entre si.

triângulos coloridos mostram elementos intercalados (

Linhas

ou

SINEs

) ,

LTRs

, transposons de DNA (

DNA-TP

) ou repetições simples (

SR

) encontrados no genoma humano ou Macaca, respectivamente. Suportes sob cada linha indicam unidades duplicados. setas rosa claro indicam estrutura palíndromo. A seta azul claro indica lacunas de sequenciamento em macacos. Letras A a L e uma ‘to i’ sobre os triângulos indicam elementos de inserção ortólogos em genomas humanos e de macaco. A luz barra verde indica uma região e pontilhadas de origem humana ou de macaco-específica linhas indicam a fronteira entre as regiões de espécies específicas e ortólogos.

-específica Humano palíndromo e gene conversão

A a análise de matriz de pontos revelou que o palindrome no bloco B é aparente apenas em humanos. Embora lacunas sequenciamento existir atualmente no chimpanzé eo genoma do orangotango, as sequências disponíveis mostrou que o palíndromo no bloco B é menos aparente nestes dois macacos do que nos seres humanos (Fig. 7). Nós parcimoniosamente inferir o estado ancestral do palíndromo usando informações da sequência do genoma de espécies de primatas existentes.

O tamanho da janela é de 500 pb, sem sobreposição entre as janelas adjacentes. retângulos coloridos na parte inferior da figura indicam a unidade duplicada incluindo o

MAGE

genes (setas cor de rosa claro). A ordenada representa a divergência de nucleótidos (

d

) e a abcissa representa a posição (em pb) em relação ao centro da espira (posição zero, seta azul). A área em torno de uma linha pontilhada vermelha indicam a região divergiram alta no

MAGE-A3 Comprar e

MAGE-A6

.

Genes sobre palíndromos pode enfrentar conversão gene frequentes .

Deixe uma resposta