PLOS ONE: Análise expansão clonal de transposões Inserções by-High Throughput Sequencing Identifica genes do cancro Candidato em uma tela piggyBac Mutagênese

Abstract

somática mutagénese transposon em camundongos é uma estratégia eficiente para investigar os mecanismos genéticos de tumorigênese. A identificação de condução tumorais inserções de transposões requer tradicionalmente a geração de grandes coortes de tumor para obter informação sobre os locais de inserção comuns. Tumor condução inserções também são caracterizados pela sua expansão clonal no tecido tumoral, um fenómeno que é facilitado pelo processo de transformação lenta e evolução de mutagénese de transposão. Descrevemos aqui uma abordagem melhorada para a detecção de inserções de condução tumorais que avalia a expansão clonal das inserções pela quantificação da proporção relativa da sequência de leituras obtidas em tumores individuais. Para este fim, temos desenvolvido um protocolo de sequenciação local de inserção que utiliza cisalhamento acústico de ADN de tumor e Ilumina sequenciação. Foram analisados ​​diversos tumores sólidos gerados por piggyBac mutagênese e para cada tumor 10

6 lê correspondente a 10

4 locais de inserção foram obtidos. Em cada tumor, de 9 a 25 inserções destacou-se por sua sequência enriquecido ler frequências quando comparadas às frequências obtidas a partir de controles de DNA cauda. Estas inserções enriquecidos são potenciais inserções de condução tumor clonalmente expandidas e, assim, identificar os genes do cancro candidatos. Os genes do cancro candidato do nosso estudo compreendeu muitos genes do cancro estabelecidos, mas também novos genes candidatos, como Mastermind-Gosto1 (

Mamld1

) e Diacylglycerolkinase delta (

Dgkd

). Mostramos que a análise expansão clonal por sequenciamento de alto rendimento é uma abordagem robusta para a identificação de genes de câncer de candidatos em telas mutagénese de inserção no nível de tumores individuais

Citation:. Friedel RH, Friedel CC, Bonfert T, shi R, Rad R, Soriano P (2013) Análise expansão clonal de transposões Inserções by-High throughput Sequencing Identifica genes do cancro Candidato em uma tela piggyBac Mutagênese. PLoS ONE 8 (8): e72338. doi: 10.1371 /journal.pone.0072338

editor: Andrew C. Wilber, Escola de Medicina da Universidade de Southern Illinois, Estados Unidos da América

Recebido: 04 de março de 2013; Aceito: 08 de julho de 2013; Publicação: 05 de agosto de 2013

Direitos de autor: © 2013 Friedel et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado por HD24875 subsídio do Instituto Nacional de Saúde Infantil e Desenvolvimento Humano à PS, por fundos de desenvolvimento do Instituto do Câncer Tisch, Mount Sinai School of Medicine, a RF e P. S., e por FR2938 concessão DFG /1-1 para CF. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

mutagénese somática por transposons de DNA em ratos investiga a genética subjacentes da tumorigênese. Transposons abrigando gene-activação ou cassetes de captura de gene pode activar oncogenes ou interromper supressores de tumor, aumentando assim o crescimento do tumor [1]. Em adição ao seu papel na descoberta de novos genes do cancro, mutagénese de transposões também facilita a estudos mais detalhados sobre os mecanismos genéticos e celulares da tumorigénese através da utilização de mutações fundo sensibilizantes e activação transposão específico do tipo de célula [2]. Dois sistemas de transposões têm sido utilizados com sucesso em telas cancerosas no mouse: Bela Adormecida [2-4] e piggyBac [5,6]. locais de inserção de transposões são identificados por fragmentos de junção sequenciamento de extremidades transposon e flanqueando DNA genômico. genes do cancro de tumores candidatos condução são então identificadas por análise comum local de inserção (CIS), um processo de mapeamento de inserções de vários tumores e análise de genes que são normalmente atingidos em amostras independentes. CIS análise provou ser uma abordagem bem sucedida para a identificação de genes candidatos, no entanto, requer um considerável número de amostras de tumores (50-100 na maioria dos estudos), e fornece muito pouca informação sobre os padrões de mutação em tumores individuais.

Uma característica importante da transformação por transposões é a mobilização contínua dentro e para fora dos locais de inserção. Este mecanismo facilita a selecção positiva e expansão clonal de inserções tumor-condução durante a evolução do tumor ao longo inserções de passageiros neutros. A expansão clonal das inserções de transposões pode ser avaliada por meio da análise das proporções relativas de sequência leituras obtidas a partir de inserções em tumores individuais. No entanto, as telas de tumor transposão anteriores não têm utilizado análise expansão clonal, provavelmente devido a limitações no número de sequência de leituras obtidas pela abordagem 454 pirossequenciao utilizados nestes estudos. Além disso, protocolos padrão para preparação de ADN do tumor envolvem fragmentação por restrição digere, que introduz preconceitos para inserções representados por fragmentos de restrição mais curtos que são mais eficientemente amplificados por PCR [7]. Uma abordagem alternativa para a fragmentação do ADN, cisalhamento acústica, pode reduzir significativamente enviesamentos de PCR, uma vez que cada local de inserção é representado por um conjunto de fragmentos com uma gama de comprimento semelhante [8].

De modo a obter uma representação quantitativa melhorada locais de inserção por sua sequência de ler números, combinamos dois avanços técnicos de relatórios recentes – Illumina seqüenciamento obter o 10

6 leituras por amostra [7], e cisalhamento acústico para reduzir os vieses de PCR [7,8] – e desenvolvido um protocolo de sequenciação eficiente de alto rendimento de inserções de transposões. Aplicou-se o nosso protocolo para a análise de onze vários tumores sólidos que tinham gerado por mutagénese com o piggyBac matriz transposão ATP1-S2 [5]. Para cada inserção em cada tumor, calculamos uma frequência de leitura relativo, o que nos permitiu identificar entre 9-25 inserções por tumor representam inserções de condução tumorais clonalmente expandidas. Entre os genes mutantes por inserções clonalmente expandidas foram numerosos genes do cancro estabelecidos, e também vários genes do cancro candidato novos.

Nós demonstramos aqui mutações que high-throughput seqüenciamento de bibliotecas do sítio de inserção identifica clonalmente expandidas em tumores individuais. Esta abordagem irá melhorar substancialmente a qualidade das previsões do gene do cancro candidato de telas de mutagénese de inserção, e vai facilitar a identificação de redes de mutações cooperando em tumores individuais.

Resultados

piggyBac mutagênese transposon

uma tela transposão mutagénese foi realizada em ratinhos que transportam um transposase expressa ubiquamente piggyBac (ROSA26-PBASE) e uma matriz de piggyBac transposão transgénico (ATP1-S2) [5]. A matriz ATP1-S2 contém 20 cópias do transposão ATP1, que está equipado com aceitadores de splice para aprisionamento de genes supressores de tumor e um promotor de CAG para a activação de oncogenes. Estes elementos permitem ATP1 para causar tumores sólidos sobre a transposição [5]. Nós criado um grupo de teste de 27 ratos que carregavam ROSA26-PBASE e ATP1-S2, e um grupo de controlo de 27 ratinhos apenas com ATP1-S2. Coortes foram envelhecidos e, embora não se observaram tumores no grupo de controlo, observou-se 11 tumores macroscópicos entre 8 ratinhos no grupo de teste entre 59 a 85 semanas (Figura 1A). Três animais transportados tumores em dois locais independentes, e em um exemplo, a análise genética dos locais de inserção indicou que ambos os tumores partilham uma origem comum (ver abaixo), enquanto todos os outros aparentemente tumores surgiram de forma independente. tipos de tumor composto de células de carcinomas escamosos da pele, tumores sólidos de pulmão e intestino e linfoma folicular do baço. O conteúdo de células tumorais nas amostras dissecados variou de 30-100% de, como avaliado por análise histopatológica de hematoxilina e eosina secções coradas (Figura S1). Nós isolado DNA para análise de locais de inserção de transposon de todos os 11 tumores. Para controlar inserções aleatórias de piggyBac no tecido não canceroso, nós isolamos também DNA a partir de 6 pontas da cauda de camundongos portadores de tumor.

A) lote de sobrevida de Kaplan-Meier das coortes que transportam tanto matriz piggyBac sozinho (ATP1-S2 ) ou matriz piggyBac e transposase constitutiva (ATP1-S2; R26-PBASE). As setas vermelhas indicam a ocorrência do tumor. As marcas denotam animais censurado (sem tumor observada no momento do sacrifício).

B) Alinhamentos de seqüência genômica Illumina lê terminar em posições geradas por corte acústico. PB3 /PB5, piggyBac 3 ‘/5’ de repetição terminal; SA, aceitador de splicing; P, promotor CAG.

C) Exemplo de sequência mapeada lê para os PB3 e PB5 lados de uma inserção piggyBac, visto no navegador do genoma UCSC. Note-se que tosquia acústico provoca aleatórios pontos de quebra de ADN aos quais estão ligados adaptadores Splinkerette, o que conduz a um padrão de escada semelhante de alinhamentos de sequências. O final constante de alinhamentos para a direita e esquerda são causados ​​pela sequência ler comprimento invariável do sistema Illumina.

D) visão geral quantitativa da sequência lê, lê mapeados, e os locais de inserção únicos a partir de amostras de cauda e tumorais.

sequenciamento de alto rendimento de inserções de transposões

Nós utilizados Illumina high-throughput seqüenciamento para atingir a cobertura de leitura abrangente de inserções de transposões em amostras de tumores individuais. Na maioria dos ecrãs de mutagénese de transposões anteriores, ADN do tumor foi digerido por enzimas de restrição, que geram fragmentos de um tamanho constante por inserções individuais. Como PCR amplifica fragmentos mais curtos mais eficientemente do que fragmentos mais longos, uma polarização é introduzido durante a amplificação por PCR subsequente para inserções que são representadas por fragmentos de restrição curtas [7,8]. Para conseguir uma representação mais proporcional de inserções, que fragmentou DNA tumoral por corte acústico em fragmentos de 200-400 bp tamanho (ver Métodos S1 para um protocolo detalhado). Desse modo, as inserções são representados por piscinas fragmento com faixa de tamanho similar. Cisalhamento foi seguido de reparação de extremidades de ADN, A-cauda de extremidades 3 ‘, e a ligação a adaptadores Splinkerette com 3’-t-saliência (Figura S2). Em reacções separadas, fragmentos de junção para a 3 ‘e 5’ do transposão piggyBac (PB3 e PB5) foram, em seguida, amplificado por PCR em dois consecutivos arredonda para gerar bibliotecas PB3 e PB5 para cada amostra. Os iniciadores de PCR continham sequências adaptador de terminal para a amplificação de fase sólida Illumina e sequenciamento e um código de barras de 6 bases para distinguir amostras de sequenciamento multiplex. Foram preparadas duas piscinas de bibliotecas PB3 e PB5, e cada piscina foi sequenciado em uma única faixa de um dispositivo de Illumina HiSeq2000 com 100 bases ler comprimento. Sequência leituras foram demultiplexed de acordo com seu código de barras e mapeado para o genoma do rato usando o algoritmo laço Bow [9].

Alinhamento da sequência lê no navegador genoma UCSC confirmou o caráter imparcial de fragmentação do DNA por corte acústico. A distribuição aleatória de pontos de quebra de ADN causada sequência lê a partir de inserções de transposões para alinhar em um padrão de escada semelhante em torno da sequência TTAA central da inserção piggyBac (Figura 1B, C). Para cada amostra, foram obtidas em média ~ 5×10

6 lê, com números semelhantes para os tumores e os controles de cauda de código de barras (Figura 1D; Tabela S1).

Sobre 19,3% de leituras a partir de amostras de tumor poderia ser mapeado para o genoma do rato. Para as amostras de cauda, ​​15,3% de leituras podiam ser mapeada. Estes lê representam novas inserções do transposon ATP1 fora da sua variedade de doadores. Esta proporção moderada de mappable lê deveu-se principalmente a uma fração alta de lê essa sequência plasmídeo continha flanqueando transposons não mobilizados com a variedade de doadores e, por isso, não poderia ser mapeado. Para determinar a fracção de transposões ATP1 que permanecem na matriz doador ATP1-S2, foi realizada a análise de mancha de Southern de caudas de ROSA26-PBASE; ratinhos ATP1-S2 e descobriu que cerca de 40% de transposões ATP1-S2 não foi mobilizado a partir da matriz (Figura S3). Esta mobilização incompleta das ATP1 pode ser causada pelo estado específico na cromatina vivo da matriz ATP1-S2. Como a metilação do DNA em locais CpG pode ser inibidor para piggyBac transposição [10], foi analisado o estado de metilação de ATP1-S2 por Southern blot com uma restrição sensível à metilação digerir. CpG metilação da matriz ATP1-S2 foi detectado, fornecendo uma possível explicação para a taxa de transposição moderada (Figura S3). Um fator adicional que reduz a novas inserções de transposões é a perda de transposons durante a transposição (ou seja, a excisão sem seguir reintegração), e um estudo anterior indicou que cerca de metade de todas as cópias ATP1 transposões são perdidos durante a atividade transposição [5]. Apesar da fração moderada da sequência mappable lê, nosso protocolo de sequenciação de alto rendimento nos permitiu recuperar um número significativo de leituras para os objetivos do nosso estudo com ~ 1×10

6 lê mapeados em média, para amostras de tumores e ~ 0.7×10

6 lê para controles de cauda (Figura 1D).

cobertura de leitura de inserções

no total, encontramos 4.210 novos locais de inserção em amostras de tumores e de cauda combinados que foram suportados unilateral e em frente e verso por mapeamentos de leitura em ambos os lados da inserção de transposão piggyBac (PB3 e PB5). A maioria das inserções, no entanto, foram identificadas por leituras mapeados em apenas um lado do transposão (314,970 inserções com lê apenas em PB3 ou lado PB5). Curiosamente, a grande maioria das inserções no nosso estudo, em particular aqueles com leituras mapeada para apenas um dos lados do transposão, foram representadas por números pequenos de leitura (Figura S4). Uma observação semelhante sobre a alta proporção de inserções raros tem sido feito em um estudo Bela Adormecida [7]. É concebível que estas inserções raras escapar à detecção em ambos os lados do transposão, devido à sua fraca abundância, resultando em alta a proporção de inserções cobertos em apenas um lado. Curiosamente, também observamos várias inserções com altos números de leitura que foram cobertos em apenas um lado (Figura S4). razões potenciais para a cobertura de leitura unilateral nesses casos incluem flanqueando trechos repetitivos ou baixas de DNA complexidade que impedem o mapeamento, ou rearranjos de DNA pequenas (deleções, inversões) causadas pela inserção do transposon. Para a análise abrangente, incluímos em nosso estudo todos os locais de inserção, combinando locais de inserção com unilateral e com a sequência de dois lados ler a cobertura, o que resultou em ~ 2×10

4 inserções de transposões únicas em média por amostra (Figura 1D).

piggyBac sofre mutações no genoma

uniformemente

os dados sobre a distribuição cromossômica de inserções ATP1 revelou que o transposon ATP1 piggyBac transforma cromossomos uniformemente em proporção ao seu conteúdo TTAA, tanto em tumores e caudas (Figura 2A) . Este padrão está de acordo com os dados anteriores relatados para o padrão de inserção do transposon ATP2 relacionada [5]. A excepção à distribuição proporcional de inserções foi a extremidade proximal do cromossoma 10, o qual contém a matriz de doadores ATP1-S2. Aqui, foi observado um enriquecimento de inserções na gama de ~ 2 Mb na extremidade proximal do cromossoma 10 (Figura 2B). Esta polarização é provavelmente causada por um efeito de salto local do transposão piggyBac na vizinhança da matriz doador, e inserções nesta área, por conseguinte, foram excluídos de análises posteriores.

A) Distribuição relativa dos locais de inserção piggyBac sobre cromossomas , em comparação com proporção de sítios TTAA nos cromossomos. Note-se a sobre-representação do cromossoma 10, que transporta a matriz de transposão dador. Cromossomo Y, que consiste principalmente de elementos altamente repetitivos, mostrou uma ligeira preferência por inserções piggyBac.

B) efeito de salto local no cromossomo 10. Histograma da densidade de inserção no cromossoma 10, revela um viés positivo para inserções na extremidade proximal (setas), onde a matriz de doadores ATP1-S2 está localizado

c) Distribuição das inserções piggyBac em regiões genômicas:. Promoter (10 kb a montante de TSS), exons, introns e regiões intergênicas

.

Além disso, comparamos a distribuição dos locais de inserção em regiões do gene (promotor, exão, intron) e regiões intergênicas. Em geral, ambas as amostras de cauda e de tumor mostrou uma distribuição de inserções que se assemelhavam a proporção média de regiões de genes no genoma do rato, embora inserções piggyBac foram observados em um pouco mais elevados do que os números esperados nas regiões intergênicas (Figura 2C).

expansão clonal de inserções de transposões

a nossa análise de inserções de transposões não demonstrou diferenças substanciais nos padrões de inserção de transposões piggyBac em amostras de tumor e cauda em termos de distribuição dos cromossomas e regiões de genes. A seguir, analisou as diferenças quantitativas de sequência lê os números de inserções em amostras individuais. O pressuposto é que as inserções de clonalmente expandidas estão presentes na maioria das células de uma amostra e devem ser representados por números de leitura mais elevados do que as inserções neutros que estão presentes apenas numa fracção mais pequena da amostra.

Para ajustar variações na sequência de ler a cobertura de diferentes amostras, primeiro gerado frequências de leitura em relação ao normalizar lado PB3 e PB5 ler os números para o número total de leituras a partir da respectiva biblioteca amostra. Como PB3 e PB5 ler frequências foram derivados de bibliotecas de PCR preparados de forma independente, uma correlação perfeita entre o PB3 e PB5 ler frequências não se poderia esperar. No entanto, observou-se uma correlação forte entre PB3 e PB5 ler frequências para inserções piggyBac (Figura S5). Para combinar as informações de frequências leitura do PB3 e PB5 lados de cada inserção, nós então calculado para cada inserção, a freqüência média de leitura de sua PB3 e PB5 ler frequências. Para inserções que foram representados por lê em apenas um lado, a freqüência média é igual a 0,5 da respectiva frequência unilateral.

Para uma análise comparativa das distribuições de freqüência de leitura em amostras de tumor e da cauda, ​​nós traçamos a leitura média frequências de todos os locais de inserção em um diagrama de caixa de plot (Figura 3). Este diagrama revelou que mais de 99% das inserções em tumores e caudas foram representados por uma pequena fração de leituras com frequências de leitura abaixo de 0,1%. Curiosamente, no entanto, quando incidiu sobre os principais valores extremos de cada amostra, observamos que as amostras de tumor continha um pequeno número de outliers com frequências de leitura enriquecidos que eram claramente mais elevado do que os mais fortes valores extremos de amostras de cauda. Essas inserções de alta frequência são susceptíveis de ser clonalmente expandidas inserções que foram seleccionadas positivamente para durante o crescimento do tumor.

Box lote de frequências médias de leitura de inserções de transposões em tumores e controles de cauda. Pontos mostram os top 1% inserções de cada amostra, classificados por freqüências médias de leitura. A linha vertical indica a distribuição do grupo percentil 2-25%, e caixas de distribuição de indicar o inferior a 75% das inserções. Um limiar de valores atípicos (linha pontilhada horizontal) foi calculado pela média das frequências de leitura dos 10 melhores inserções de cada amostra de cauda.

Na ausência de um método estatístico eficaz para distinguir os verdadeiros valores discrepantes de inserções enriquecidos aleatoriamente , decidimos definir expansão clonal através de um método de limiar. Utilizamos controles cauda como uma referência para a distribuição de frequências de leitura no tecido não-tumoral, e calculou um limite para a detecção de outlier pela média dos 60 maiores freqüências de amostras de controlo de cauda (os 10 maiores frequências de cada amostra de cauda). Isto resultou em um limite de 0,37% para o nosso conjunto de dados. Foram identificados entre 9-25 inserções para cada amostra de tumor acima do limiar, mas apenas 2-6 inserções em amostras da cauda (Tabela S2).

Nós interrogado ainda mais a reprodutibilidade da classificação locais de inserção por frequência de leitura de uma série de experiências de controlo. Em primeiro lugar, perguntou se a expansão local de inserção iria variar entre diferentes partes de uma única massa tumoral (Figura S6). Ao comparar as freqüências de leitura de amostras microdissecadas de massas tumorais individuais, observou-se uma sobreposição completa das inserções mais altamente enriquecido entre amostras e uma partida de mais de 50% das inserções acima limiar global.

Em seguida, investigaram se expandiu inserções em tumores já podem estar presentes como inserções expandidas no tecido pré-canceroso a partir da qual surge o tumor. Para este efeito, comparou-se inserções de transposões em genes de um tumor do pulmão com as inserções de tecido pulmonar normal adjacente (Figura S7). As inserções de tumor mais altamente enriquecido não estavam presentes no tecido normal, confirmando a validade da nossa abordagem para identificar genes do cancro candidato. Contudo, 2 dos 6 inserções de genes expandidas do tumor também foram detectados em níveis similares no tecido pulmonar normal, indicando que algumas inserções clonalmente expandidas em tumores pode ser derivada a partir de inserções clonais pré-cancerosas.

Finalmente, perguntamos se órgãos levaria a uma taxa mais elevada de fundo expandida inserções pré-cancerosas do que o tecido de cauda, ​​como órgãos têm normalmente uma composição mais homogênea de tipos de células do que a cauda heterogênea (Figura S7). De fato, descobrimos que o DNA de órgãos pode, em alguns casos contêm inserções mais alargados do tecido da cauda. O número de inserções expandidas variou de 3 a 23 em órgãos, com uma média de 11 inserções expandidas por amostra. À medida que as amostras de tumores do nosso coorte realizados, em média, 16,4 inserções expandidas, estima-se que, em média, 66% (11 /16,4) de inserções expandidas em tumores podem representar expandido inserções pré-cancerosas. Com base nestas experiências de controlo, conclui-se que a análise de expansão clonal é um método adequado para identificar genes candidatos cancerosas em tumores individuais. No entanto, uma observação importante é a presença de inserções expandidas pré-cancerosas no tecido tumoral, e a taxa destas inserções pode variar amplamente entre as amostras, dependendo do tipo de tumor e o tecido hospedeiro.

Entre inserções clonalmente expandidas em tumores, 56,9% foram encontrados em regiões do gene (promotores, exons, e íntrons), -a proporção significativamente maior do que para todas as inserções piggyBac em tumores (33,4%; veja a Figura 2C) -, e 43,1% foram encontrados em regiões intergênicas. inserções clonalmente expandidas em regiões intergênicas pode exercer cis-efeitos de longo alcance em genes vizinhos. No entanto, como bases de dados actuais não contêm informações sobre o papel oncogênico das regiões intergênicas, nós limitamos nossa análise adicional para inserções de transposões em regiões de genes.

expansões clonais identificar genes do cancro candidatos

A expansão clonal análise das inserções de transposões em regiões de genes identificados 88 genes únicos que representam os genes do câncer potencial candidato (Figura 4A). De acordo com esta previsão, observamos vários genes entre nossos genes candidatos que estão implicados no câncer. Por exemplo, nove de nossos genes do cancro candidato também estavam contidos na lista Cancer Gene Censo, que compreende 487 genes causalmente ligados ao câncer [11], o que representa um enriquecimento altamente significativa (

Abl2

,

Braf

,

Fbxw7

,

FOXP1

,

Ipo11

,

Mllt3

,

Fas

,

Pten

e

Nf1

; p . 0,0002, teste exato de Fisher)

A) inserções de gene clonal expandidas em amostras de tumor, classificado por suas frequências médias de leitura (

f

) . Três ratos cada abrigava dois tumores (tumor de 01 e 08, 05 e 09 tumorais, e tumores 04 e 10, respectivamente). Um asterisco azul indica genes presentes na lista Cancer Gene Censo, uma lista de 487 genes causalmente implicado em câncer.

Mamdl1 Comprar e

Dgkd

foram atingidos em amostras de tumores independentes e são destacadas em vermelho e rosa, respectivamente.

B) Os processos celulares afetados por inserções de gene clonal expandidas. categorias de processo foram compilados a partir de informações gene funcional no www.omim.org e www.informatics.jax.org.

Em nosso estudo, três animais de coorte realizados dois tumores cada (Figura S1). Curiosamente, dois pares de tumores mostraram nenhuma sobreposição de genes do cancro (tumores candidato 01 e 08 e os tumores 04 e 10), indicando origem independente de tumores. Em contraste, os tumores 05 (massa sólida tumor no fígado) e 09 (linfoma folicular) fizeram 5 genes do cancro candidato, indicando uma origem comum. Como o fígado é um sítio comum de invasão para a leucemia linfocítica [12], é possível que o tumor do fígado 09 é uma massa de tumor metastático que é derivado a partir do tumor linfóide esplénico 05. É de notar, a 5 partilhada genes do cancro de tumores candidatos 05 e 09 (

Pten, Fas, ESR1, Abl2, Lrp1b

) foram obtidos de forma independente em ambos os tumores com frequências médias de leitura semelhantes, confirmando a robustez do nosso método de sequenciamento para identificar a expansão clonal de inserções.

ao analisar os genes candidatos para enriquecimento significativo de categorias funcionais usando o recurso DAVID bioinformática (https://david.abcc.ncifcrf.gov) [13], encontramos um enriquecimento significativo de categorias e vias relacionadas quinase de proteínas (por exemplo, KEGG : via de sinalização MAPK, p 0,016; InterPro: proteína quinase, núcleo, p 0,016; Benjamini-Hochberg corrigida valor P; Tabela S3). Da mesma forma, quando agrupados manualmente genes candidatos por seu processo celular conhecida, descobriu-se que os genes envolvidos na transdução de sinal representado o maior grupo de genes (Figura 4B). Outros processos celulares importantes de genes candidatos foram apoptose, a remodelação da cromatina, da transcrição, e o transporte de proteínas /triagem (Figura 4B). Interessantemente, quando se olha para os processos celulares sobre o nível de tumores individuais, descobriu-se que cada tumor tinha uma ou várias mutações em genes de sinalização, e uma mistura de inserções que afectam pelo menos dois outros processos celulares. Este padrão de múltiplos processos mutantes para cada tumor está de acordo com o conceito de que múltiplas alterações genéticas em diferentes processos celulares impulsionar o crescimento do tumor [14].

Entre os genes do cancro candidato definidas pela expansão clonal, dois genes foram atingidos de forma independente em diferentes locais TTAA em vários tumores (excluindo genes compartilhados por tumor 05 e 09, que compartilham uma origem comum): Mastermind-domínio como 1 (

Mamld1

) e Diacylglycerolkinase delta (

Dgkd

). Deste modo, estes genes são genes particularmente fortes cancerosas candidato, como eles são duplamente definida tanto pela expansão clonal de inserções em tumores individuais e independentes ocorrência como locais de inserção comum em várias amostras de tumor. O

gene Mamld1

foi mutado por inserções em tumores epiteliais da pele (tumor 01, 02 e 03).

Mamld1

tem sido proposto para ser um co-activador de sinalização Notch não canónicas [15]. Na pele humana, componentes de sinalização Notch são abundantemente expresso, e de-regulação da sinalização Notch conduz a vários tipos de cancros da pele [16]. Assim,

Mamld1

é um gene candidato cancro romance como um regulador de sinalização de Notch para tumores epiteliais. O gene

Dgkd

foi encontrado mutado em tumores sólidos 05 (metástase linfocítica no fígado) e 07 (pulmão).

Dgkd

metaboliza 1,2, diacilglicerol (DAG) ao ácido fosfatídico (PA). Ambos DAG e PA desempenham papéis importantes como segundos mensageiros para sinais mitogénicos e modulação dos níveis de

proteínas DGK

foi proposto para ser um mecanismo potencial no câncer [17].

Discussão

Nós demonstramos aqui que high-throughput análise de sequenciação de DNA tosquiada de tumores gerados por transposões proporciona meios para identificar genes do cancro candidato por meio de análise de expansão clonal. Esta abordagem representa uma estratégia melhorado para a identificação de genes de cancro candidato em telas de transposões, e permite, pela primeira vez a identificação de genes de cancro candidato no nível de tumores individuais.

A quantificação da expansão clonal

protocolos actuais usam restrição digere ao fragmento de ADN de tumor, resultando em uma tendência para as inserções que são representados por pequenos fragmentos com [7], e reduzindo, assim, o aspecto quantitativo de análise de número ler. Nós aplicamos corte acústico para a fragmentação do ADN para minimizar as diferenças de tamanho de fragmentos do sítio de inserção. Esta melhoria, em combinação com Ilumina-sequenciação de alto rendimento, permitiu obter uma avaliação semi-quantitativa da representação proporcional de inserções. Várias observações sugerem que o nosso método alcançou um nível de precisão quantitativa suficiente para identificar clonalmente expandidas inserções que definem genes do cancro candidato. Em primeiro lugar, a comparação entre amostras tumorais e de controlo revelou um enriquecimento distintas de inserção das leituras em amostras de tumor. Segundo, a análise dos tumores relacionados 05 e 09 apresentaram forte correlação das frequências de leitura de inserções clonalmente expandidas. Finalmente, genes mutantes por inserções clonalmente expandidas composta muitos genes do cancro bem definidas.

No entanto, uma ressalva importante da análise expansão clonal é que órgãos podem levar um número de inserções pré-cancerosas que são clonalmente expandidas por acaso. Como nossas experiências de controlo indicam, estas inserções podem compreender, em média, dois terços das inserções clonalmente expandidas. Assim, embora o nosso método é claramente eficaz na identificação de genes de câncer de candidatos em tumores individuais, a função de condução do câncer de cada gene precisa ser corroborada por métodos alterative, como a análise CIS ou ensaios funcionais.

Um fator que pode influenciar a taxa de expansão clonal das inserções é a actividade da transposase piggyBac. Se a atividade transposição piggyBac deixaria durante o tempo de vida do rato, isso iria corrigir certas inserções, que aparecem como expansões clonais em nossa análise. Iremos abordar a atividade contínua da transposase piggyBac no tecido do rato adulto em futuros estudos de ensaios de imuno-histoquímica.

Vários preconceitos em representação sequência ler na nossa análise expansão clonal permanecem, por exemplo, aqueles introduzidos por diferentes conteúdos GC de fragmentos durante a amplificação por PCR. Um outro factor que diminui a potência quantitativa do nosso método são a presença potencial de tecido do estroma do tumor não nas amostras, que dilui as inserções de condução do tumor clonalmente expandidas. Além disso, uma advertência do nosso método é que a ligação não específica Splinkerette iniciador pode conduzir em alguns casos, a uma amplificação predominante de locais genómicos que não são verdadeiros inserções de transposões. Refinamentos técnicos serão necessários para trazer a análise da expansão clonal para um nível quantitativa absoluta

de alta capacidade sequenciamento de inserções de transposões

A nossa abordagem sequenciamento rendeu . 10

6 mapeados lê por amostra de tumor. Um número de 10

5 leituras por amostra havia sido proposto ser suficiente para revelar todas as inserções de Sleeping Beauty gerado tumores [7].

Deixe uma resposta