PLOS ONE: Assinaturas da selecção na fusão transcrições resultantes De cromossômica translocações em Câncer Humano

Abstract

Fundo

A recorrência e distribuição não-aleatória de pontos de interrupção de translocação em tumores humanos são geralmente atribuídos a sequência local Características presentes nas imediações dos pontos de interrupção. No entanto, também foi sugerido que os constrangimentos funcionais podem contribuir para delimitar a posição de pontos de interrupção de translocação dentro dos genes envolvidos, mas uma análise quantitativa de tal contribuição tem faltado.

Metodologia

Temos analisadas duas assinaturas bem conhecidas de selecção funcional, tais como a compatibilidade de leitura-quadro e combinações não aleatórios de domínios proteicos, numa grande conjunto de dados de proteínas de fusão resultantes de translocações cromossómicas no cancro.

Conclusões

os nossos dados proporcionam forte suporte experimental para o conceito de que a posição de pontos de interrupção de translocação no genoma das células cancerosas é determinada, em grande parte, pela necessidade de combinar certos domínios de proteína e para manter uma grelha de leitura intacta em transcrições de fusão. Além disso, as informações que reunimos proporciona uma visão global dos mecanismos oncogênicos e arquiteturas de domínio que são usados ​​por proteínas de fusão. Isso pode ser usado para avaliar o impacto funcional de novos translocações cromossómicas e de prever a posição de pontos de interrupção nos genes envolvidos

Citation:. Ortiz de Mendibil I, Vizmanos JL, Novo FJ (2009) Assinaturas da selecção na Transcrições de fusão resultante de cromossômica translocações no cancro humano. PLoS ONE 4 (3): e4805. doi: 10.1371 /journal.pone.0004805

Autor: Michael J. Pazin, Instituto Nacional sobre Envelhecimento (NIA), Institutos Nacionais de Saúde (NIH), Estados Unidos da América

recebida: 08 de outubro de 2008; Aceito: 30 de janeiro de 2009; Publicação: 12 de março de 2009

Direitos de autor: © 2009 Ortiz de Mendibil et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi financiado com a ajuda do Instituto de Saúde Carlos III (FIS PI040037), Ministério da Educação espanhol e Ciência (SAF 2007-62473), o Programa PIUNA da Universidade de Navarra e da Fundação Caja Navarra através do Programa “Você escolhe , você decide “(Project 10,830). F.J.N é o destinatário de um prêmio “Jerónimo de Ayanz” do Governo de Navarra. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

A maioria das células cancerosas exibir algum tipo de rearranjo cromossômico. Considerando que os tumores sólidos geralmente exibem cariótipos complexos com muitos tipos diferentes de rearranjos cromossómicos, muitas doenças malignas hematológicas e certos exibir apenas uma sarcomas ou algumas aberrações, geralmente translocações cromossómicas equilibrados, que em alguns casos, têm sido mostrados para ser o evento inicial no desenvolvimento do tumor [ ,,,0],1], [2]. Por esta razão, translocações cromossómicas são tecnicamente mais fácil de caracterizar em cancros hematológicos. Uma análise extensiva de translocações cromossômicas em neoplasias humanas ao longo dos últimos três décadas revelou dois resultados principais pelos quais esses rearranjos impulsionam a progressão do câncer: i) de câmbio promotor (principalmente em neoplasias linfóides), e ii) a criação de genes quiméricos que são traduzidos como proteínas de fusão (leucemias mielóides e alguns tumores sólidos) [3]. Da mesma forma, o consenso derivada a partir destes estudos sugerem que as translocações cromossómicas são o resultado de ADN misrepaired quebras de cadeias duplas (DSB) em células somáticas [4] – [7]. translocações cromossómicas, resultando em transcrições de fusão quiméricas constituem um importante grupo de translocações recíprocas, que responde por 20% da morbilidade câncer em seres humanos [3], e têm o potencial para iniciar o crescimento do tumor porque seus produtos de proteína contêm domínios de ambos os parceiros de fusão. A presença de domínios de proteínas heterólogas nos mesmos resultados proteína quimérica em actividades biológicas desreguladas que em última análise levam ao desenvolvimento do cancro.

Algumas das translocações cromossómicas equilibradas encontradas em tumores são recorrentes, no sentido de que eles estão presentes em diferentes pacientes com o mesmo tipo de tumor, ou mesmo em diferentes tipos de tumores [8]. Além disso, a caracterização de sequências de fusão ao nível molecular em diferentes amostras do paciente mostrou que, pelo menos para alguns genes, pontos de interrupção tendem a agrupar-se em regiões específicas. Como resultado, a distribuição de pontos de interrupção de translocação encontrados em amostras de tumores segue um padrão não aleatório, com alguns locais em que os pontos de interrupção são mais frequentes do que o esperado por acaso. Embora vários estudos têm abordado o papel potencial dos motivos de nucleótidos e sequência local Características como a causa para tal recorrência [9] – [14], a importância dos fatores funcionais na delimitação a posição de pontos de interrupção de translocação não foi testado experimentalmente. A este respeito, uma análise global de transcrições de fusão quiméricas poderia mostrar se recorrência ponto de interrupção pode ser o resultado de selecção para as funções celulares codificados por domínios específicos que estão presentes nas respectivas proteínas de fusão. Além disso, a exigência de manter um quadro de leitura intacta no produto de fusão também poderia contribuir para explicar a distribuição não-aleatória de pontos de interrupção translocação através desses genes.

Para testar esta hipótese, analisamos um conjunto abrangente de translocações cromossómicas que criam proteínas de fusão oncogênicas em malignidades humanas, procurando assinaturas de selecção funcional. Nós compilado um catálogo dos domínios de proteínas codificadas por essas proteínas de fusão e visualizou-los como uma rede de nós que interagem, obtendo-se uma visão global dos domínios de proteínas que são trazidos em conjunto para as mesmas proteínas de fusão. Também foi avaliada a estrutura de leitura das transcrições de fusão, a fim de confirmar que as grelhas de leitura originais dos genes parceiros foram mantidos em grelha em transcrições de fusão, a uma proporção mais elevada do que o esperado por acaso.

Materiais e Métodos

sequências de fusão foram obtidos a partir TICdb versão 2.1 (Outubro de 2007). TICdb é um banco de dados disponível gratuitamente de pontos de interrupção de translocação-mapeados gene no câncer, que descreve a localização genómica de 1.445 pontos de interrupção de translocação, correspondendo a 310 genes diferentes, em hematológicas, mesenquimais e doenças malignas epiteliais. O banco de dados foi criado usando a informação do

Mitelman banco de dados de aberrações cromossómicas em cancro

(disponível no Projeto Genoma do Câncer Anatomy), dois catálogos publicados de genes rearranjados em câncer e nossas próprias pesquisas [15]. sequências de junção de translocações recíprocas foram mapeados para a sequência de referência do genoma humano utilizando BLAST. Todos os pontos de interrupção de translocação são assim referidos preciso posições de nucleótidos ou fragmentos de genes (íntrons ou exons) dentro específica

ENSEMBL

transcrições (ENSEMBL 38,36).

O procedimento seguido é resumido na Figura 1. A partir TICdb , obtiveram-se informações sobre 699 fusões de genes oncogénicos diferentes, com excepção de uma análise mais aprofundada todas essas translocações no qual foi mostrado o mecanismo oncogénico ser gene de-regulação por troca de promotor em vez da criação de uma proteína de fusão. Da mesma forma, 116 fusões em que, pelo menos, um dos genes de parceiros não contribuir com um domínio de proteína reconhecível para a proteína de fusão não foram informativos para a análise do domínio da proteína co-ocorrências, e foram, portanto, excluído do conjunto de dados, porque não são elegíveis para o estude. No total, foram analisados ​​583 fusões de genes em que ambos os genes de parceiros contribuiu com um domínio de proteína anotada para a proteína de fusão quimérica gerado pela translocação. Dois terços (66%) dessas fusões foram relatados em doenças hematológicas, 26% em cancros mesenquimais e 8% em tumores epiteliais.

Para cada fusão em TICdb (retângulo superior mostra parte da imagem de uma busca de translocações envolvendo ETV6) fomos para a página de “visão Protein” das respectivas transcrições (ENST00000266427 e ENST00000381652 neste exemplo). A caixa inferior esquerda mostra a proteína ETV6 com os aminoácidos codificados por cada exão (blocos de cor alternada), a posição de domínios proteicos anotados em vários bancos de dados (SMART superfamília PFAM, PROSITE e imprime), a localização do ponto de interrupção (vertical a linha a tracejado) e a parte do péptido que é contribuído para a proteína de fusão (linha horizontal com ponta de seta dupla). O mesmo é mostrado para JAK2 na caixa canto inferior direito. Em ambos os casos, o exão flanqueando a fusão é realçado (retângulo vermelho), com sua inicial e final quadros de leitura mostrados em uma caixa ( “informações Splice”).

TICdb mostra a posição de cada ponto de interrupção mapeado para um intrão exão particular ou de um transcrito específico Ensembl. Isso nos permitiu usar Ensembl “visão Protein”, que fornece uma representação gráfica da proteína e de todos os domínios anotados em bancos de dados de SMART, Pfam, ProSite e impressões, a fim de extrair, para cada gene de fusão, o PFAM e domínios ProSite que são contribuiu para a proteína de fusão por cada um dos genes de parceiros. Quando os domínios Pfam e ProSite sobrepostas e /ou tinha o mesmo número de acesso Interpro, considerou-se apenas a entrada PFAM. domínios ProSite únicas sem anotações Interpro foram ignorados; estes incluem regiões de baixa complexidade, como, regiões ricas em serina ou ricas em glutamina rica em prolina. regiões espiral enrolada foram incluídos na análise, uma vez que são importantes domínios de oligomerização utilizados em muitas proteínas de fusão.

Uma consideração importante sobre domínios de proteínas em proteínas nativas é que muitos domínios são geralmente encontrados em associação com outros domínios na mesma proteína. Isto significa que as proteínas de fusão irá normalmente receber dois ou mais domínios de cada um dos parceiros de translocação. Nestes casos, é difícil estabelecer se apenas uma (e qual) de um dos domínios é responsável para as propriedades oncogénicas da proteína de fusão, ou se é que determinada combinação de domínios que é responsável pela actividade oncogénica. Por esta razão, foram agrupados os domínios em arquitecturas de domínio, isto é, grupos de domínios que são encontradas juntas nas mesmas proteínas nativas de acordo com as anotações Pfam. Duas arquiteturas, EAD e COIL, foram particularmente difícil atribuir. O primeiro inclui o domínio de activação de EWS, que não é anotada como um domínio de proteína na Pfam mas tem sido mostrado para ser responsável pelo potencial de transformação das proteínas de fusão contendo esta parte da proteína EWS. Curiosamente, este domínio é também detectado, pela semelhança de sequência, na FUS TAF15 e proteínas, que formar proteínas de fusão com arquitecturas encontrados em fusões EWS. No que diz respeito ao domínio espiral enrolada, que está presente em muitas proteínas mas também carece de uma anotação em bases de dados de domínio de proteína. Afigura-se em proteínas de fusão, quer isoladamente ou em combinação com outros domínios, por isso nem sempre é claro se o potencial de transformação da proteína de fusão é devido às propriedades de oligomerização da espiral enrolada ou à presença combinada deste domínio com outros domínios proteicos . Por este motivo, criou uma arquitetura (bobina) para essas proteínas de fusão em que a bobina em espiral é o único domínio presente, além de várias outras arquitecturas (bobina /outros) para aqueles casos em que outros domínios são encontrados em combinação com espirais enroladas. A arquitetura NUP é composto pelas repetições GLFG da proteína NUP.

Em seguida, gerou uma lista de arquiteturas de domínio que são trazidos juntos para a mesma proteína de fusão. Estes pares de arquitecturas de domínio foram visualizados como as redes em que os nós representam uma arquitectura de domínio, e ligar essas bordas arquitecturas que estão presentes na mesma proteína de fusão. Redes foram criadas usando Cytoscape 2,5 (https://cytoscape.org/). Análise dos parâmetros de rede foi realizada usando o plugin NetworkAnalyzer [16]. Tabela Suplementar S1 lista todas as arquiteturas com os domínios que compõem cada arquitetura.

O Ensembl “visão Protein” também mostra o quadro de leitura em que cada codificação de exão começa e termina (caixas mostrado na Figura 1). Uma vez que todos translocações em TICdb são mapeados para íntrons ou exons específicos, fomos capazes de verificar se os exons flanqueando um ponto de interrupção de translocação têm quadros de leitura compatíveis, ou seja, se o último exão do gene parceiro 5 ‘termina no mesmo quadro de leitura que o primeiro exão do gene inicia o parceiro 3 ‘. Como mostrado na Figura 1, esta pode ser usada para inferir se o gene de fusão resultante da translocação iria manter a grelha de leitura de ambos os genes de parceiros, e, portanto, ser traduzida como uma proteína de fusão em-quadro. Uma vez que a maioria das sequências de fusão analisados ​​são derivados a partir de transcritos de ARNm de fusão (splicing), estas sequências já ter em conta o potencial exão saltando ou eventos de splicing alternativo. Em 43 das fusões de genes 583 analisados, o quadro de leitura de ambos os exons parecia incompatível com um produto de fusão em grelha, então nós voltamos para a sequência original para verificar se outros mecanismos tinha restaurado o quadro de leitura da transcrição de fusão.

resultados

leitura quadro conservação

Seguindo a estratégia explicada em Métodos, analisamos lendo compatibilidade quadro de exons flanqueando pontos de interrupção de translocação, em 583 fusões de genes que codifica para uma proteína de fusão potencial em que com ambos os genes de parceiros contribuir com um domínio de proteína anotada. Curiosamente, o quadro de leitura final de 5 ‘do exão e o quadro de leitura a partir da extremidade 3’ do exão foram compatíveis em 540 das fusões analisados, confirmando assim que uma proteína de fusão em-quadro foi gerado em 93% dos casos. Em alguns translocações, o ponto de interrupção caiu no meio de um exão, mas mesmo assim a grelha de leitura foi mantida através da fusão. Isto é ilustrado por um conjunto de fusões de genes entre

FIP1L1

(5 ‘do gene) e

PDGFRA

(3′ do gene), nos quais diferentes exons de

FIP1L1

são fundidos versões truncadas de exão 12 do

PDGFRA

(transcrição ENST00000381354 Ensembl). Eliminações neste exão sempre resultam em um quadro de leitura compatível com os exons correspondentes de

FIP1L1

(exons 10, 11, 12 e 13 da

FIP1L1

transcrição ENST00000358575, que terminam em quadros de leitura +3 , 1, 2 e 3, respectivamente, na versão 38.36 da Ensembl), levando a transcrições de fusão em-quadro em todas as quatro configurações.

nos restantes 43 fusões as grelhas de leitura de exões que flanqueiam não eram compatíveis , de modo que não seria esperado para gerar uma proteína de fusão em-quadro. Nestes casos, nós voltamos para a sequência de fusão original e constatou que em 31 deles (72%) o quadro de leitura tinha sido restaurado por vários mecanismos, tais como splicing alternativo, a inserção de regiões intrônicas, inserção de nucleótidos não templated ou exclusão de nucleotídeos ex�icas. Este foi particularmente comum em proteínas de fusão envolvendo

EWSR1

,

FUS

e

TAF15

, uma vez que 48% dessas fusões teve quadros de leitura incompatíveis que foram corrigidos por um desses mecanismos (24 de 50 analisados ​​para fusões de genes destes genes). Após avaliação cuidadosa das restantes 12 fusões em que quadros de leitura não eram compatíveis (2% do total de 583 fusões), assumiu-se que um produto proteico funcional não pode ser gerada nestes casos.

A verificação de que 98% do gene fusões geram transcrições que pode ser traduzido como em grelha produtos proteicos confirma que a leitura de conservação armação é de grande importância funcional em proteínas de fusão oncogénicos, uma vez que a frequência esperada de grelhas de leitura compatíveis entre dois exões aleatórios (assumindo frequências iguais de 1, +2 e +3 quadros de leitura) é um terço. Esta é uma clara assinatura da forte pressão selectiva em células somáticas que favorece os produtos de fusão capaz de conduzir a transformação oncogénica, e tem implicações importantes na discussão sobre a identidade dos factores que regulam a posição dos pontos de interrupção de translocação em células cancerosas (ver abaixo).

arquiteturas de domínio proteína presente na mesma proteína de fusão

Um gráfico de rede dos genes envolvidos em translocações cromossómicas que geram proteínas de fusão (suplementar Figura S1) mostra três grupos independentes principais, além de alguns gráficos menores, que não estão ligados a qualquer um dos componentes principais [15], [17]. Estes foram analisados, como explicado na secção de Métodos, a fim de criar uma rede global de arquitecturas de domínio que são trazidos em conjunto para as mesmas proteínas de fusão em cancro (Figura 2 e texto complementar S1). parâmetros topológicos, como mostram grau de distribuição que a rede de fusões de genes e da rede de arquiteturas de domínio são compatíveis com acesso escala ou pequeno-mundo, mas não aleatória, topologias. O número de nós (114) na rede de arquitecturas de domínio (Figura 2) é inferior a metade do número de genes rearranjados naqueles translocações (235 nós na Figura S1), o que indica que as mesmas arquitecturas são usados ​​em eventos de fusão de genes diferentes. Da mesma forma, a rede de arquitecturas de domínio tem um diâmetro mais pequeno (8 vs 13) e um comprimento do percurso característico menor (3,66 vs. 4,83); Como resultado, a densidade da rede na rede de arquitecturas de domínio é mais de duas vezes a densidade da rede de fusões de genes (0,0019 x 0,0008). Estes parâmetros reflectem a menor complexidade da rede de arquitecturas de domínio no que respeita à rede de fusões de genes. Uma discussão mais aprofundada dessas redes podem ser encontradas no texto complementar S1, S2 Suplementar Figura, Suplementar Figura S3, Suplementar Figura S4 e S5 Suplementar Figura.

Todas as arquiteturas de domínio foram fundidos em conjunto, resultando em um único grande componente mais 6 outros gráficos menores. Nove nós com mais do que 5 vizinhos (concentradores) são mostrados a azul. As três redes de fusão gene principais mostrados na Suplementar Figura S1 são claramente visíveis nos centros correspondentes a TK, NUP e arquiteturas /HZ bobina. O tamanho de cada nó é indicativo do seu grau (número de vizinhos).

Duas características interessantes são evidentes na rede de arquiteturas de domínio. Em primeiro lugar, todas as arquitecturas de derivados das três redes de fusão de genes principais aparecem como um grande gráfico único, o que indica que algumas arquitecturas de domínio são comuns a todas as redes de genes. Do mesmo modo, algumas das arquiteturas das 21 gráficos de fusão de genes pequenos estão também incluídos neste grande componente, de modo que apenas seis componentes pequenos permanecem sem ligação à rede principal de arquitecturas de domínio. Em segundo lugar, os nós conectados mais (with≥5 centros vizinhos, mostrados na azul na Figura 2) identificar as principais classes de proteínas de fusão encontradas no cancro, ou seja, as que envolvem o domínio de tirosina-quinase (TK), o domínio de activação de EWS (EAD ), o domínio Runt, o domínio de ligação ao ligando do receptor de hormona nuclear (HRMN), o domínio de ligação de DNA em gancho (gancho e da bobina /Hz), as repetições GLFG (NUP) e espirais enroladas (bobina). Isto sugere que a rede de captura os principais temas biológicos que são conhecidas presentemente a ser utilizado por proteínas de fusão em cancro.

A constatação de que apenas certas combinações de domínios de proteína estão presentes em proteínas de fusão oncogénicos, formando uma rede de não topologia RANDOM, implica que tais combinações são o resultado de constrangimentos funcionais distintas. Como mencionado acima, esta é uma assinatura das pressões de selecção celulares que ditam que translocações cromossómicas estão presentes em células de cancro.

De modo a antecipar como esta rede não será afectado pela descoberta de novas translocações, analisamos cromossómico translocações que foram publicados após o início deste trabalho (Outubro de 2007) e, assim, ainda não incluídos no TICdb no momento [18] – [33]. Foram coletadas 17 fusões de genes que geram uma proteína de fusão com os domínios de proteína anotados, descrevendo 9 novos genes e novas arquitecturas 7 domínios (dois dos novos genes contribuiu uma arquitectura já descrito). Observamos também duas novas combinações de arquiteturas de domínio descritos anteriormente. Além disso, num caso, um “gene

parceiro

(TCF3), anteriormente descrito como 5 ‘3 parceiro de fusão, contribui com uma arquitectura de domínio distinto neste novo processo. A análise destas novas fusões sugere que a rede de arquitecturas de domínio, apesar de ainda não está completa, contém a maior parte das arquiteturas utilizados por proteínas de fusão oncogênicos, e cresce a uma velocidade mais lenta do que a rede de fusões de genes.

discussão

realizamos uma pesquisa imparcial da literatura e da de todos os dados públicos disponíveis para nós sobre translocações cromossómicas que criam proteínas de fusão em cancros humanos. As fusões que não foram informativos para esta análise foram excluídos, ou seja, as pessoas envolvidas na troca de promotor (que não criar proteínas de fusão) e aqueles em que um dos genes de parceiros não contribuir com um domínio reconhecível para a proteína de fusão (que não são informativas para a análise de co-ocorrência de domínio). Por conseguinte, deve ser mantido em mente que os dados aqui apresentados se aplicam a translocações cromossómicas que geram proteínas de fusão contendo domínios de proteína anotados na Pfam. Nossa análise revelou duas assinaturas de selecção funcional: compatibilidade de leitura-frame e co-ocorrência não aleatória de domínios proteicos. Ambos os recursos podem ser determinantes importantes da posição dos pontos de interrupção de translocação em células cancerosas. Além disso, nossos dados poderiam ajudar a prever novas translocações e avaliar a relevância funcional de novas fusões de genes descobertos em hematológicas e tumores sólidos.

papel da seleção funcional na posição de pontos de interrupção de translocação em células cancerosas

as duas assinaturas de selecção funcional que temos analisados ​​em transcrições de fusão (ou seja, a leitura combinações de conservação quadro e não-aleatórias de domínios proteicos) sugerem que essas forças podem ser fatores importantes na determinação da distribuição não-aleatória de pontos de interrupção de translocação que é visto em cancros humanos. A este respeito, a visão generalizada de que os factores de sequências locais são responsáveis ​​para a presença de pontos de interrupção de translocação em locais genómicos específicos baseia-se no pressuposto de que os pontos de interrupção de translocação revelar a localização de todos os DSBs geradas nessas células. Assim, uma vez que os pontos de interrupção de translocação são distribuídos de forma não aleatória, a inferência é feita de que LAP são inicialmente criados de forma não aleatória. No entanto, os elementos de sequência responsáveis ​​pela geração de LAP (motivos de sequência curta, locais de topoisomerase II, repetições dispersas, locais intrónicas de iniciação de transcrição, estruturas cruciformes, etc.) são muito comuns ao longo do genoma, por isso, é razoável supor que a maior parte dos LAP que são criados em todo o genoma, durante o tempo de vida de uma célula somática foram devidamente reparado e que apenas um pequeno subconjunto de LAP misrepaired irá resultar em fusões oncogénicos e acabará por ser encontrado em amostras de tumor. A este respeito, deve-se ter em mente que a análise de amostras tumorais representa um caso extremo de polarização verificação: por definição, só translocações que foram importantes para o crescimento do tumor vai ser detectado, enquanto que muitos outros translocações possíveis que não fornecem um vantagem proliferativa para a célula não vai. Algumas translocações, por exemplo, seria de esperar que seja prejudicial para a célula, uma vez que dois alelos de genes diferentes (um alelo do gene de cada) foram inactivadas pelas quebras, de modo que as células que transportam esses translocações irá eventualmente desaparecer a partir do tecido. Outros rearranjos será funcionalmente neutro e o gene de fusão resultante não terá uma função biológica vantajosa. No final, as translocações que são encontrados em amostras de tumores são o resultado da expansão clonal de células que abrigam translocações com o potencial para promover o crescimento do tumor, pois eles criar genes de fusão oncogénicos. Os pontos de interrupção específicos hospedadas pelos translocações estes constituem o subconjunto de pontos de interrupção de translocação não aleatórios que são encontrados em células cancerosas.

Isto é ilustrado na Figura 3, que mostra dois genes teoricamente capaz de participar de uma translocação recíproca com oncogénica propriedades, devido aos domínios que estão presentes nas respectivas proteínas. Mesmo se as LAP iniciais foram distribuídos uniformemente em toda a esses genes [34], é evidente que nem todas as translocações possíveis irá criar um gene de fusão com um potencial oncogénico. Olhando para a posição das regiões que codificam para os domínios de proteína necessárias, e considerando os quadros de leitura dos vários exões envolvidos, torna-se claro que uma proteína de fusão oncogénica só será gerado se pontos de interrupção estão localizados dentro de certos intrões. Outras combinações possíveis de ponto de interrupção levaria à perda de um domínio funcional importante na proteína de fusão, ou a um produto para fora da moldura, e não irá ser favorecida em amostras de tumor. Uma implicação clara disto é que a percepção de “não-aleatoriedade” na distribuição genómico de pontos de interrupção de translocação não está necessariamente relacionado com a localização inicial de LAP, mas poderia ser o resultado do processo de selecção, através da qual apenas alguns desses LAP, eventualmente sobreviver nas células de um tumor.

Três exons de dois genes hipotéticos são mostrados (exons a, B e C em azul, exons 1, 2 e 3 em laranja). A grelha de leitura inicial e final de cada exão é mostrado (1, 2 ou 3). Exons A e B do código genético superior para um domínio de proteína (barra vermelha), enquanto exon 3 do gene codifica fundo para outro domínio de proteína (barra verde). Mesmo se as quebras da cadeia dupla (DSB, símbolos de relâmpago amarelos) foram criados uniformemente em toda a sequência de ambos os genes, apenas as combinações de ponto de interrupção que conduz a proteínas de fusão em-quadro que codificam ambos os domínios de proteína irá mostrar potencial oncogénico. Como resultado, os pontos de interrupção de translocação encontrados em amostras de tumor vai agrupar as regiões de genes específicos (setas azuis verticais).

Previsão de proteínas de fusão novos em hematológicas e tumores sólidos

Se os dois assinaturas identificadas neste trabalho são importantes determinantes da localização de ponto de interrupção, em seguida, nossos resultados devem ser úteis para a previsão de fusões de genes que ainda não foram encontrados em tumores. Em primeiro lugar, a informação sobre quais as arquiteturas de domínios estão presentes na mesma proteína de fusão pode ser utilizado para seleccionar todos os genes que codificam para um determinado par de arquitecturas de domínio. Isto irá prever várias fusões de genes que são potencialmente oncogênicos. Informação sobre os quadros de leitura dos exões que pertencem a esses genes deve identificar qual fusões específica (se houver) são capazes de gerar uma proteína de fusão em-quadro que inclui a combinação requerida de domínios proteicos. Mais importante, esta análise também deve identificar quais íntrons são mais susceptíveis de conter os pontos de interrupção, e, assim, ajudar na concepção de estratégias moleculares para a detecção dessas transcrições de fusão putativos.

Uma implicação óbvia do nosso trabalho é que muitas fusões de genes potenciais poderia gerar a mesma combinação de arquitecturas de domínio, porque cada arquitectura é normalmente codificado por vários genes. No entanto, é geralmente aceite que a maioria das translocações cromossómicas responsáveis ​​pelo desenvolvimento de cancro humano foram já descritos [8], [17]. Apesar de alguns novos casos são publicados a cada ano, a maioria deles relatam novos pontos de interrupção em fusões de genes já conhecidos, ou novas fusões entre genes que tinham sido previamente encontrados fundido com outros parceiros. Não está claro por que muitos dos potenciais fusões de genes novos não foram detectados. Uma explicação provável é que os genes envolvidos não satisfazem alguns dos critérios que são necessários para uma translocação recíproca para ocorrer, tais como a proximidade dentro do espaço nuclear ou co-transcrição nas mesmas fábricas de transcrição nucleares [35] – [39] . Alternativamente, algumas dessas fusões de genes novos pode passar despercebido, porque eles nunca foram pesquisados, uma vez que a maioria dos estudos se concentrar na detecção de translocações conhecidos. A este respeito, é interessante considerar estudos recentes em que o genoma de vários tipos de células cancerosas tem sido interrogado de forma imparcial [40] – [43]. No caso de uma amostra de um paciente diplóide leucemia, massivamente paralela sequenciação revelou novas mutações pontuais, mas não há rearranjos genómicos [40]. End Sequence Profiling de linhas celulares de tumores sólidos revelou muitos rearranjos genômicos somáticas, mas apenas alguns deles eram fusões de genes. Por exemplo, Campbell et ai. [41] utilizado massivamente paralelo sequenciamento-end emparelhado em duas linhas de células de câncer de pulmão e encontraram 22 rearranjos intercromossômicas somáticas na linha celular NCI-H2171, mas nenhum em NCI-H1770. Destes, apenas um expressou transcrição de fusão foi identificada, embora tenha sido previsto para ser out-of quadro. Raphael et ai. [42] encontraram uma fusão entre o

HYDIN

gene e um gene anónimo em linha de células de carcinoma da mama metastático MCF7. Outra fusão entre

SCL12A2

e uma marca de sequência expressa foi encontrada apenas em células MCF-7 de alta passagem. Nesta mesma linha celular, em que as aberrações cromossómicas foram previamente descritos por Spectral Cariotipagem (CÉU) e gama-Comparativo genómico de hibridação (CGH), Hampton et al. [43] encontraram 10 fusões de genes utilizando final de seqüência de perfis com sequenciamento paralelo em massa. Destes, apenas quatro foram encontrados a ser expresso, mas o seu potencial oncogénico não foi directamente testada. Considerando que esses estudos foram realizados em linhas celulares, o número de fusões de genes novos expressa é relativamente baixo.

são igualmente relevantes para o presente debate sobre “driver” e mutações “passageiro” em genomas do câncer Estes dados recentes. Devido à instabilidade inerente dos genomas e a natureza clonal do processo tumorigénico, muitas aberrações deverão ser encontrados quando genomas cancerosas são interrogados de uma maneira imparcial, a maioria dos quais será aberrações de passageiros, sem relevância funcional para o processo oncogénico . Neste contexto, existe uma grande necessidade de novas abordagens que conseguem distinguir as alterações genómicas que dirigem a iniciação ou a progressão do tumor de alterações neutros que foram adquiridos pelo clone, mas não têm qualquer impacto funcional. Os nossos resultados sublinham duas características que poderiam ser úteis neste respeito.

Deixe uma resposta