PLOS ONE: Somatic Mutation perfis de MSI e MSS Câncer Colorretal Identificado por inteiro exome Next Generation Sequencing and Analysis Bioinformatics

Abstract

Fundo

O câncer colorretal (CRC) é com aproximadamente 1 milhão de casos, o terceiro tipo de câncer mais comum em todo o mundo. Extensa investigação está em curso para decifrar os padrões genéticos subjacentes com a esperança de melhorar o diagnóstico precoce do câncer e tratamento. Neste sentido, o progresso recente em tecnologias de sequenciamento de próxima geração revolucionou o campo da genômica do câncer. No entanto, uma ressalva destes estudos continua a ser a grande quantidade de variações genéticas identificadas e sua interpretação.

Metodologia /Principais Achados

Aqui nós apresentamos o primeiro trabalho sobre toda exome NGS dos cancros do cólon primários. Realizamos todo 454 pyrosequencing exome de tumor, assim como tecido do cólon normal não afectada ao lado de estável microssatélite (MSS) e microssatélites pacientes instáveis ​​(MSI) de câncer de cólon e identificou mais de 50.000 variações de nucleotídeos pequenas para cada tecido. De acordo com previsões baseadas em MSS e pathomechanisms MSI identificamos oito vezes mais somáticas variações não sinónimas em cancros MSI do que no MSS e fomos capazes de reproduzir o resultado em quatro CRCs adicionais. Nossos bioinformática abordagem de filtragem estreitada para baixo a taxa da maioria das mutações significativas a 359 para o MSI e 45 para MSS CRCs com funções proteína alterada previstos. Em ambos os CRCs, MSI e MSS, foram observadas mutações somáticas no domínio quinase intracelular da receptor 1A de proteína morfogenética óssea, BMPR1A, um gene onde mutações medida da linha germinal estão associadas com a síndrome de polipose juvenil, e mostram que as mutações funcionalmente prejudicar a função das proteínas .

Conclusões /Significado

Nós concluímos que com profunda sequenciação do exomes tumorais pode-se ser capaz de prever o estado de microssatélites de CRC e, além disso identificar mutações potencialmente clinicamente relevantes.

Citação: Timmermann B, Kerick M, Roehr C, Fischer A, Isau M, Boerno ST, et al. (2010) Somatic Mutation perfis de MSI e MSS Câncer Colorretal Identificado por inteiro exome Next Generation Sequencing and Analysis Bioinformática. PLoS ONE 5 (12): e15661. doi: 10.1371 /journal.pone.0015661

editor: Amanda Ewart Toland, Ohio State University Medical Center, Estados Unidos da América

Recebido: 25 de agosto de 2010; Aceito: 19 de novembro de 2010; Publicação: 22 de dezembro de 2010

Direitos de autor: © 2010 Timmermann et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pelo Ministério Federal Alemão de Educação e Pesquisa (01GS08105 “Mutanom,” 01GS08111 “intestinal modificadores”) e da Sociedade Max Planck. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer colorretal é o terceiro câncer mais comum com cerca de 1 milhão de casos em todo o mundo. Ao longo das últimas décadas que se tornou claro que a CRC evolui através de várias vias e que estas vias pode ser aproximadamente definida em função de padrões moleculares, tais como a integridade do sistema de reparação de emparelhamentos incorrectos (MMR) ou padrões de mutação e epigenética. A deficiência de MMR é reflectida na instabilidade do ADN microssatélites (MSI), que também tem sido associada com o resultado do tratamento, mas que necessita de ser ainda mais validado em estudos clínicos adicionais [1], [2], [3], [4], [ ,,,0],5], [6].

de alto rendimento de sequenciação de Sanger estudos sobre o outro lado têm mostrado que a frequência de mutação de genes do cancro candidatos pode ser muito mais elevado do que o esperado, e que a combinação específica de mutações podem influenciar o Propriedades do tumor [7], [8], [9], [10], [11]. Com o desenvolvimento de tecnologias de próxima geração seqüenciamento (NGS) o throughput seqüenciamento aumentou dramaticamente e os custos diminuíram. Além disso, e especialmente importante para os cenários clínicos, NGS pode ser aplicada ao material fixado com formalina e embebido em parafina FFPE tecido, bem como ADN altamente degradada que é rotineiramente preparadas em departamentos de patologia ou encontrada em ADN antigo [12], [13]. Vários estudos têm utilizado tecnologias NGS para a identificação da mutação subjacente nas doenças monogenéticos [14], [15]. No entanto, apenas um número limitado de estudos relatam sobre sequenciamento de última geração para identificar novos genes do cancro candidato; um dos primeiros estudos examinaram leucemia mielóide aguda citogeneticamente normal, e genomas de cancro da mama [16], [17]. Além disso, estudos sobre melanoma maligno e de células do cancro do pulmão de pequenas células linhas forneceram primeiros insights sobre alterações genômicas induzidas pela exposição à luz ultravioleta ou o fumo do tabaco [18], [19].

Para obter insights sobre os genomas de câncer colorretal estáveis ​​e instáveis ​​microssatélites e identificar padrões de mutações relevantes funcionais que usamos um todo exome abordagem captura de DNA com base hibridação seguido por 454 sequenciamento de próxima geração [20]. Aplicando bioinformática rigorosas análises, nós reduzimos a quantidade de mutações somáticas funcionalmente significativos na MSI a 359 e 45 em cânceres MSS, destacando, assim, os padrões de mutação específicos, dependendo do estado de microssatélites. Fomos capazes de confirmar nossos resultados sequenciando os exomes de quatro casos de CRC adicionais (um MSI, três MSS) utilizando uma tecnologia de enriquecimento e sequenciamento diferente. Entre essas mutações são BRAF no câncer de MSI e KRAS e TP53 no câncer de MSS, ressaltando ainda mais a validade da nossa abordagem de seleção [21]. Outras caracterizações funcionais identificadas mutações somáticas recorrentes no BMPR1A, uma proteína que tem sido associado até agora com síndrome de polipose juvenil, uma síndrome predisposição ao câncer.

Resultados

enriquecimento específica de sequência e a estratégia de sequenciação

Nós sequenciado do tumor e correspondentes tecidos normais do cólon a partir de dois pacientes com adenocarcinoma de alto grau do cólon (G3), o paciente 1 com um microssatélite instável e paciente 2 com um tumor estável microssatélite (Tabela 1, Figura S1). Para a determinação de mutações da linha germinal que sequenciado para além dos tecidos tumorais de cada paciente tecido adjacente não afectada do cólon normais. Usando Illumina seqüenciamento e matrizes SNP determinou-se que o tumor do paciente 1 é o número da cópia estável, enquanto o paciente 2 apresentou variações que usamos para a re-avaliação de mutações de elevado rigor identificados (Tabela S3).

Foram analisados ​​os exomes completa de mais de 135.000 exões com espingarda 454 sequenciação única de leitura (Figura 1, Figura S1, S2 Figura, Tabela 2). Para avaliar o efeito de profundidade de cobertura sobre a sensibilidade e a especificidade de detecção variante de sequência, chamadas genótipo da matriz Affymetrix SNP 6,0 foram comparadas gradual para as posições chamado ácido nucleico e resultou em uma precisão de mais do que 99% (Figura S3) . Em adição à matriz de SNP, utilizou-se a sequenciação de Sanger para confirmar 23 mutações seleccionadas (Tabela S5, Figura S5).

(A) diagrama de Venn de exões capturados de amostras normais e tumorais. exões capturadas com, pelo menos, uma leitura foram contadas. (B) parcela de cobertura de distribuição normalizada Representante. A fracção de exões coberto de isca no genoma conseguir coberturas igual ou menor do que a cobertura normalizado é indicado no eixo dos x. A cobertura média per exão foi dividida pela cobertura média de todos os exons.

Identificação de mutações somáticas em sequências de codificação para um MSI CRC

Pesquisa de variantes em regiões codificantes encontramos 12,767 e 12,518 pequenas variações nucleares em 6,428 e 6,205 genes, por tumor e normal, respectivamente. Destas variantes 1.428 para controle e 2.404 para tumor têm uma heterozigosidade média ou freqüência do alelo menor inferior a 1% ou que não tenham sido previamente relatada em dbSNP ou o Projeto 1000 Genomas (Figura 2). Desde Indels (pequenas inserções e deleções) em locais homopoliméricos são uma importante fonte de erros de sequenciamento da plataforma 454 que ignorou esse tipo de alteração em nossas análises.

(A) Esquema do fluxo de trabalho bioinformática detecção SNV. (B) Extracção de mutações somáticas funcionalmente relevantes para MSI e MSS câncer colorretal. Variantes foram detectadas com o GS Mapper Referência antes de serem filtradas por sua localização, anotação em dbSNP130 ou os 1000genomes, somáticos e comprometimento funcional. De dbSNP130 ou os 1000genomes variantes com foram utilizadas frequências acima de 1%. Para MSI CRC 359 variantes e para MSS CRC 45 foram identificados com funções proteína alterada previstos.

A nossa estratégia de detecção variante somática foi projetado para minimizar falsas variante somática positiva chama ao invés de determinar zygosity. Nós usamos uma abordagem em duas fases, com dois níveis de exigência diferentes para detectar variantes em tecidos tumorais e benignos semelhantes a Pleasance

et al.

[18]. No primeiro passo, as variantes de tumores foram chamadas de acordo com critérios rigorosos, que foram determinadas por comparação com os dados de matriz de genotipagem de SNP. O segundo passo verificar se a variante do tumor foi germinal ou somática. Para manter a taxa de falso negativo no tecido benigno em menos de 10%, que defina a cobertura de corte em cinco vezes, abaixo dos quais não foram desenhadas conclusões sobre se era uma variante somática ou de linha germinal. Se a cobertura de corte foi cumprida, uma leitura única, mostrando a mesma variante no tecido benigno e tumor resultou na classificação da variante como germinal.

Usando essa estratégia, identificamos 915 somáticas mutações não sinónimas afetando 864 genes. A maioria das mutações somáticas foram mutações missense (65%). No entanto, muitos (7%) estão localizados dentro das regiões não traduzidas dos genes e, portanto, pode resultar na expressão alterada ou aumentada decomposição de espécies de mRNA. Além disso, cerca de 0,5% de tais mutações são encontradas nos locais de splice e poderia influenciar eventos de splicing, que conduz a uma estrutura transcriptoma alterada. Além disso, três variantes somáticas foram identificados em regiões de miARN (Tabela S6). Estas mutações são de particular interesse porque miARNs têm sido implicados como master reguladores da homeostase do tumor. Análise dos tipos específicos de variações de ácido nucleico, incluindo variantes conhecidas e não conhecidas, mostrou essencialmente as taxas esperadas de trocas de nucleótidos, tal como determinado por cálculos utilizando dbSNP130 (Figura S4).

A análise funcional de mutações de um cólon MSI

câncer

Uma vez que nem todos os 1.304 mutações somáticas são susceptíveis de ser patologicamente relevantes, buscou-se identificar aqueles que provavelmente destruir a função da proteína ou afetar altamente conservada aminoácidos e pode, portanto, ser funcionalmente importante. Utilizou-se Polyphen e MutationTaster ferramentas de classificação para predizer as consequências funcionais de alterações de aminoácidos ou mutações frameshift e descobriram que 359 genes tinham pelo menos uma mutação potencialmente destrutiva (Tabela S1) [22], [23]

.

De as mutações somáticas potencialmente destrutivos, 309 foram localizados em posições altamente conservadas em 44 espécies diferentes, incluindo opossum

(Monodelphis domestica)

, frango

(Gallus gallus) Comprar e lampreia

(Petromyzon marinus )

. Destes, 259 foram localizados em genes expressos no cólon, dos quais 47 eram genes de reparação, receptores, ou quinase. Visualização de mutações selecionados em estruturas de proteínas indica que esses nucleótidos estão na superfície da proteína, potencialmente resultando em interações proteína-proteína interrompidas.

O Catálogo de Somatic Mutações em Câncer (COSMIC) do banco de dados é uma coleção abrangente de Câncer mutações relacionadas. Aproximadamente 39% dos nossos genes mutantes já foram descritas neste banco de dados, e 13% foram encontrados por Wood

et al

[10]. Como fez estas bases de dados anteriores, encontramos o

BRAF

mutação p.V600E no caso MSI e identificamos

KRAS Comprar e

TP53

mutações no tumor MSS.

BRAF

mutações são encontrados em aproximadamente 10% dos CRCs, predominantemente MSI e 30 a 35% de todos os pacientes com câncer colorretal esporádico realizar somática

KRAS Comprar e

TP53

mutações. Estes resultados demonstram ainda mais a sensibilidade da nossa estratégia de classificação.

paisagem mutacional de um MSS câncer de cólon

Para o câncer de cólon MSS foram identificados 10.622 pequenas variações nucleares. Depois que os mesmos processos de filtragem como para o câncer MSI utilizando o banco de dados dbSNP e os dados dos 1000 Genomas Projeto 1.288 variantes permaneceu que ou teve baixa prevalência ou eram desconhecidos. Destes, 198 foram somática e 45 foram previstas para alterar a função do gene com base em cálculos MutationTaster e Polyphen (Figura 2B, Quadro S2) [22], [23]. Em relação ao copiar variações no número cinco das 45 mutações identificadas estão localizados dentro das regiões amplificadas, e, como esperado, nenhum em regiões com exclusões. Os rácios de leituras com a sequência de referência a sequência mutada não superior a rácios em áreas estáveis ​​número de cópias que suporta o algoritmo SNV-chamada.

Em contraste com 1.304 mutações somáticas no tumor MSI encontramos 198 mutações somáticas no tumor MSS o que demonstra que o sistema de MMR deficiente na MSI tumores resulta em um aumento significativo nas taxas de mutação no cancro colorectal.

Além disso, olhando para intersecções entre os dois tipos de câncer que encontramos BMPR1A, WDTC1 (WD e tetratricopeptode repete 1 ) e EHD3 (EH-domínio contendo 3) mutado em ambos os tumores. A seleção foi baseada no comprometimento funcional com elevada probabilidade em Polyphen e MutationTaster [22], [23]. Todas as mutações estão localizadas na superfície da proteína e são altamente conservadas. Desde que encontramos vias relacionadas ao câncer significativos associados apenas com BMPR1A mas não com WDTC1 ou EHD3, e, além disso mutações germinativas em BMPR1A são um fator de risco conhecido para a síndrome de polipose juvenil, nós escolhemos BMPR1A para ensaios funcionais adicionais (Figura 3, Figura S5) . Utilizando ensaios repórter do tipo selvagem e proteínas mutadas BMPR1A fomos capazes de mostrar que as proteínas mutadas são fortemente prejudicados na sua função de sinalização e que a estimulação com resultados BMP2 em uma actividade máxima reduzida (Figura 3D).

(A ) diagrama de Venn proporcional. Frações de chamadas SNVS idênticos aos dados Genomas Projeto e dbSNP130. Apenas os dados para o qual a freqüência do alelo menor ou a heterozigosidade média foi conhecidos e abaixo de 1% foram utilizados para comparação. (B) Distribuição de sinônimo, missense, absurdo e mutações que afetam os códon de início ou de parada são mostrados em relação a todas as mutações somáticas. mutações (C) BMPR1A p.W487R p.E502G e estão localizados no domínio de proteína cinase de BMPR1A. aminoácidos de referência estão em verde, as formas mutantes são mostrados em vermelho. A estrutura de rede no lado inferior esquerdo indica o domínio de ligação ao ATP. mutações (D) BMPR1A mostram diminuição sinalização acitivity. Actividade de peso mBMPR1A, mBMPR1A E502G e mBMPR1A W487R foi determinada em células C2C12 usando um ensaio de gene repórter de luciferase Smad-responsivo. A actividade da luciferase induzida foi normalizada para Renilla acitivty. A actividade de células não transfectadas foi definido como 0% e a actividade de mBmpr1a em peso foi definido como 100%. Diferenças significativas foram calculados com um t-teste bilateral e marcado como:. * p ≤ 0,05, ** p≤0.01, *** p≤0.001

MSI cancros colo abrigar até 8 fold mais codificação de mutações somáticas que MSS cancros

As análises apresentadas até agora foram baseados em inteiros 454 sequencings exome de um paciente com câncer colorretal para cada status de microssatélites. Para confirmar ainda que o aumento da quantidade de codificação de mutações em cancros MSI pode ser generalizado e não é devido à tecnologia utilizada (enriquecimento “matriz” e sequenciação 454) que sequenciou o exomes de quatro cancros colorrectais adicionais, cada um com correspondentes tecidos normais. Desta vez usamos ‘hibridização solução “para a captura de DNA seguida de sequenciação sólida. Depois de filtrar os mesmos procedimentos como descrito para os dois primeiros pacientes que novamente determinada até 8 vezes taxas de mutação mais elevadas para o cancro colo-rectal de MSI para cancros MSS (Tabela 3). A este respeito, encontramos 532 SNVS não sinónimas somáticas no MSI CRC adicional e apenas 65, 74 e 76 nos três casos MSS CRC. Assim, as diferenças nas taxas de mutação são reprodutíveis e independente da tecnologia de sequenciação utilizada.

Discussão

Usando a próxima geração de sequenciamento, nós sequenciaram os exomes de pacientes com câncer de cólon MSS e MSI , com coberturas médios de aproximadamente 20 vezes. Foi aplicado um algoritmo de classificação dos dois lados para descobrir mutações funcionalmente relevantes. Utilizando esta abordagem, demonstramos pela primeira vez que uma matriz de captura de NGS fluxo de trabalho de um só passo é uma ferramenta poderosa para profunda caracterização de tumores sólidos e mostram que os tumores MSI transportar oito vezes mais funcionais mutações relevantes do que os tumores MSS (Figura 2) .

o impacto funcional das variações somáticas foi previsto usando dois algoritmos de previsão funcionais, Polyphen e MutationTaster, e encontramos 359 mutações somáticas para o MSI e 45 para o câncer MSS que são altamente susceptíveis de causar prejuízo funcional [ ,,,0],22], [23]. A heterogeneidade dos genes mutados não sugere que um gene específico

por si só, mas a via afectada desempenha um papel importante para o desenvolvimento do tumor. Neste sentido, encontramos um enriquecimento significativo de mutações nas vias relacionadas com o cancro, como o cancro, o desenvolvimento celular e replicação do DNA, recombinação e reparação (Tabela S5). Curiosamente, encontramos 50% das vias enriquecidos mais significativos no cancro da MSS também vias como significativamente enriquecido para o câncer MSI, indicando que, apesar de cancros MSI abrigar um aumento do número de mutações ambos os tipos de câncer pode desenvolver-se através pathomechanisms sobrepostas.

Historicamente, o teste de microssatélites em cancros colorrectais foi o primeiro teste preditivo para a identificação de uma mutação subjacente reparação de emparelhamentos incorrectos (MMR). Uma vez que mais de 90% de não-polipose cancro colorectal hereditário (HNPCC) mostram MSI, o status de microssatélites tornou-se um marcador de diagnóstico comum de MMR. Além disso, as vantagens e as consequências de sobrevivência terapêuticas têm sido relatados em pacientes com tumores MSI [5], [24]. Usando sequenciamento ultraprofundas de uma região conservada, UCR41, de Grassi e colegas mostram que esta região tem taxas de mutação mais elevadas em amostras de HNPCC do que nos controles saudáveis ​​e sugerem que isso pode ser usado como ensaio molecular sensível da instabilidade genômica [24]. Nós estendemos suas análises para exomes inteiros e encontraram diferenças de 8 vezes no número de mutação somática da MSI e MSS câncer colorretal. Em comparação, um estudo realizado por Greenman

et al.

Que informou sobre o sequenciamento de 518 genes da proteína quinase em 210 diversos cancros humanos encontraram uma cerca de 25 vezes mais elevada taxa de mutação para os cancros MMR com deficiência [9]. No entanto, estes são extrapolações e em contraste com nosso estudo que incluiu tumores de diferentes origens e examinou todas as mutações somáticas independentemente da sua relevância funcional. Com nossa abordagem de sequenciamento também detectou uma somática

MLH3

mutação no tumor MSI, que, apesar de

MLH3

mutações não pertencem às mutações MMR clássicos no CRC, pode contribuir para o microssatélite instabilidade fenótipo [25]. Além disso, a combinação de MSI e

BRAF

mutação, conforme detectado pelo tumor MSI descrito, é mais frequentemente encontrada para ilha metilação fenótipo 1 tumores CpG (CIMP1) que estão associados com

promotor MLH1

metila�es [21], [26]. A metilação do promotor por sua vez, está associada com mecanismos de silenciamento de genes que é sugestivo como uma explicação para o estado MSI dos tumores. Por outro lado, tem sido proposto que a instabilidade cromossómica (CIN) e CIMP representam dois mecanismos independentes e inversamente relacionados de instabilidade [27]. casos CIMP-negativos estão associados a p53 (71%) e

KRAS

(33%) mutações, mas raramente são encontrados com

BRAF

(2%) mutações. Desde que encontramos grandes variações no número de cópias, bem como

KRAS Comprar e

TP53

mutações no tumor MSS analisou este tumor é mais provável CIMP-negativos [5], [24].

a estratégia de sequenciação e análise apresentamos pode ser a base para futuras ferramentas de classificação para cancros colorrectais, porque pode permitir uma detecção em paralelo de um aumento da frequência de mutação em tumores MSI, bem como a detecção de defeito subjacente MMR. Além disso, fomos capazes de detectar mutações de genes frequentemente associados a certos subtipos de cânceres colorretais, como

BRAF, KRAS Comprar e

TP53

. Dentro de nossos genes de alta prioridade, abrangendo todos os genes que passam todos os filtros de seleção,

BMPR1A

se destaca como mutado em ambos os casos. A estrutura geral revela que os aminoácidos mutados estão todos localizados no feixe hélice intracelular C-terminal no domínio de proteína cinase e sugere que as interacções proteína-proteína são destruídos [28]. Linha germinal

BMPR1A

mutações predispor a juvenil síndrome de polipose; No entanto, os nossos resultados indicam que mutações somáticas também pode desempenhar um papel importante no desenvolvimento do cancro colo-rectal esporádica [29], [30], [31], [32], [33].

Além destas mutações temos também identificou vários alvos mutantes câncer de drogas ou genes que estão associados com o resultado do tratamento, incluindo

BRAF, KRAS, FGFR2

e

MTOR

, o que pode ajudar a escolher as melhores combinações de drogas. Como tais abordagens re-sequenciação direcionados semelhantes e bioinformática estratégias de filtragem pode se tornar um padrão-ouro para o tratamento do câncer colorretal individualizado no futuro.

Materiais e Métodos

Declaração de Ética

o estudo foi aprovado pelo Comitê de Ética da Universidade de Medicina de Graz. Para novas amostras de pacientes deram o seu consentimento informado por escrito. Para amostras de idade (15 anos) sem o consentimento informado foi disponíveis, portanto, todas as amostras e dados médicos utilizados neste estudo foram irreversivelmente anónimos.

Apresentação do caso e amostra de tecido coleção

O paciente 1 teve um alto grau (G3) adenocarcinoma do cólon proximal, encenada pT-3C, pn-0, pM-X, PR-0, microssatélite instável (Figura 1A). Além disso, neste caso, foi seleccionado por causa da sua estabilidade cromossómico, como determinado usando a sequenciação de todo o genoma próxima geração (NGS) (Figura 1B). Paciente 2 teve um adenocarcinoma de alto grau (G3) do cólon proximal, encenado pT-4B, PN-2, o PM-X, microssatélite estável.

O tecido humano obtido durante a cirurgia foi snap-congelados em nitrogênio líquido . Criosecções (3 mm de espessura) foram preparadas e coradas com hematoxilina e eosina para avaliar o conteúdo de células tumorais. As dissecções foram realizadas ao microscópio para atingir um teor de célula de tumor de 80%. o isolamento de ADN foi realizada utilizando o estojo QIAamp DNA Mini (Qiagen), de acordo com as instruções do fabricante.

Total exome ADN enriquecimento e Genoma Sequencer FLX sequenciação

O ADN genómico de ambos os tecidos foi submetido a toda captura sequência exome usando matriz 2.1M exome Humano Roche /de NimbleGen. Esta matriz baseia-se na construção de 36,3 a sequência do genoma humano, e capta as regiões de codificação de genes NCBI 16,755 RefSeq (aproximadamente 180.000) exões codificantes, bem como as regiões 493 de miARN. Tumor e tecido normal de ADN foram submetidos a sequência exome toda a captura de acordo com o protocolo do fabricante. O DNA foi cisalhado por nebulização para fragmentar tamanhos inferiores a 800 pb, limpo (Zymo Research) e usando T4 ADN polimerase e quinase de polinucleótido T4-polida final. Ligador adaptadores pSel3 (5 ‘- CTCGAG AAT TCT GGA TCC TC – 3’) e pSel4-P (5 ‘- Phos /GAG GAT CCA GAA TTC TCG AGT T – 3’) foram ligados e selecção de tamanho foi realizada utilizando AMPure DNA Purification Grânulos (Agencourt). Qualidade foi controlada com o sistema Bioanalyzer. LM-PCR foi realizada com iniciadores LMPCR3 (5 ‘- GAG CUC AAU UCU UCC GGA UC – 3’) antes da biblioteca foi utilizada para a hibridação a 42 ° C durante 72h. As matrizes foram lavadas duas vezes a partir de 47,5 ° C, duas vezes à temperatura ambiente e duas vezes a 42 ° C, com tampões de lavagem, tal como recomendado. ADN genómico ligado foi eluído com NaOH 125 mM durante 10 min à temperatura ambiente e amplificada por LM-PCR utilizando iniciadores LMPCR3. amostras amplificadas capturados foram submetidos a PCR quantitativo para medir o enriquecimento relativo.

O DNA NimbleGen enriquecido foi usado para construir single-stranded Genome Sequencer FLX (454 /Roche) bibliotecas. Após PCRs emulsão iniciadores de sequenciação foram emparelhados com o molde e as esferas foram incubadas com DNA polimerase Bst, apirase, e proteína de ligação de cadeia simples. Pirossequenciao foi realizada numa placa picotiter 70 × 75 mm de 13 experiências separadas de sequenciação. Após o processamento de dados em bruto predefinida, um filtro de corte resequenciamento foi usada para aumentar a saída de dados. (Parâmetros utilizados: doValleyFilterTrimBack = false, vfBadFlowThreshold = 6, vfLastFlowToTest = 168, errorQscoreWindowTrim = 0,01)

Para o sequenciamento foi realizado 13 Genome Sequencer FLX é executado, o que produziu mais de 558 milhões de bases e 1,43 milhões de leituras por execução. . Lê foram alinhados ao genoma de referência humana, NCBI construir 36 (https://hgdownload.cse.ucsc.edu/goldenPath/hg18/), utilizando GS Referência Mapper Versão 2.0.0.12 (Roche). Os melhores partidas no genoma foram utilizados como o local para a lê com vários jogos. Só única lê com um comprimento mínimo de 50 pb foram usados ​​para análise posterior (ver Tab estatísticas executado. 2).

Detecção de variantes foi realizada com o GS Referência Mapper Versão 2.0.0.12 (Roche). Redundante leituras foram subtraídos antes chamados de variantes. Apenas o HCDiff (diferenças alta confiança) do software GS mapeador foram utilizados como base de detecção variante [20]. chamados HCDiff presumir pelo menos três leituras com a variante com a frente e reverso lê incluído; alternativamente os índices de qualidade nas posições variáveis ​​devem ser maiores de 20 (ou mais de 30 se um homopolímero de cinco ou mais bases está envolvido). Como critérios de qualidade adicionais que usados ​​somente variantes com uma cobertura . 10 × de alta qualidade lê

Whole exome ‘em solução de DNA Enriquecimento e sólida sequenciamento

enriquecimentos e preparação biblioteca SOLiD foram realizados de acordo com o protocolo de Enriquecimento SureSelect alvo da Agilent para o sólido sistema Applied Biosystems. Em resumo, o ADN genómico total foi cortado e fim reparado. Para ligaes do adaptador foram usadas 30X o excesso de adaptadores. Tamanho selecções para fragmentos de ADN de 150-200 pb foram realizadas seguindo-se um passo de nick-translation e amplificação com polimerase Platinum (Invitrogen) e Pfu-polimerase (Fermentas). Para selecção de híbridos as bibliotecas foram ajustadas a 500 ng em 3,4 ul de volume e adicionou-se as soluções SureSelect bloco. As hibridações foram realizadas durante 24 h a 65 ° C, os híbridos foram extraídas com 500 ng M-280 Dynabeads de estreptavidina (Invitrogen) e, finalmente, eluiu-se com tampão de eluição de 50 ul. Após a amplificação com polimerase Platinum as bibliotecas foram quantificados por qPCR e a concentração de ADN foi titulada para alcançar uma fracção de 10-20% de partículas de modelo monoclonal na emulsão de PCR utilizando um total de 0,7 a 1 bilhão de grânulos. enriquecimento talão sucessiva e deposição de 130 milhões de contas de por slide trimestre (quad) foi seguido por padrão 50 execuções fragmento pb. Cada uma das quatro amostras de pacientes foi analisado num único quad

O mapeamento foi realizado com o gasoduto alinhamento Bioscópio usando a semente estender algoritmo com uma pontuação -2.0 pena de incompatibilidade. Variantes de um Único Nucleótido (SNV) foram chamado com o algoritmo DiBayes integrado no pacote Bioscópio.

variante de um único nucleótido (SNV) detecção

materiais de tecido foram genotipados no array Affymetrix 6.0, de acordo com o o protocolo do fabricante. posições matriz com um índice de qualidade (p-value) 0,1 foram utilizados para comparação com os dados de sequenciamento. posições de dados de sequenciação foram usados ​​se a sua cobertura ultrapassou 3 vezes. Isto gerou 46.000 e 49.000 posições para tumor e tecido benigno, respectivamente, que eram elegíveis para comparação. Para determinar as taxas de falsos positivos e falsos negativos, que defina os dados de matriz como padrão e distinto entre chamada de referência e dependência chamada SNP nos dados da matriz.

Para a detecção de variantes somáticas, uma estratégia bimodal foi aplicado com tumor variantes chamados de acordo com critérios rigorosos, enquanto variantes em tecido de controlo foram chamados usando critérios menos rigorosos: um limite mínimo para as leituras foi criado com variantes de 15% de todas as leituras em uma determinada posição no tumor. critérios menos rigorosos foram usados ​​para chamar variantes de tecido controle com um mínimo de uma variante de ler e um corte de cobertura mínima de 5. Para coberturas acima de 30 vezes uma leitura variante foi aceito.

Capilar Sequencing

confirmação de Acompanhamento do SNVS identificado foi executado em um ABI 3730 (Applied Biosystems) instrumento de sequenciação capilar seguindo procedimentos padrão.

Determinação do número de cópia variações

Preparação de bibliotecas de leitura individuais e sequenciação foram realizada utilizando a plataforma de sequenciamento Solexa (GenomeAnalyzer IIx, Illumina) seguindo as instruções do fabricante. Análise de Imagem e chamadas de base foram realizadas utilizando Firecrest 1.9.5_14 e Abetarda 1.9.5_14 e as leituras foram alinhados ao genoma humano (NCBI36) usando Bowtie 0.9.7.1 [34]. Cópia de análise de número foi feito em I utilizando o pacote DNAcopy [35]. Em suma, DNA ler frequências foram determinadas para caixas de 50 Kb. A proporção de caixas correspondentes frequência log2 foi calculado para tumor contra o tecido normal. Mediana de proporções foi centrado a experiência de zero sábio. Log proporções foram alisados ​​por DNAcopy usando valores padrão e copiar a variação do número foi detectada por DNAcopy usando um limiar de dois desvios padrão.

A genotipagem na matriz Affymetrix 6.0 foi realizada de acordo com o protocolo do fabricante. Regiões de cópia ganho número e perda foram determinadas por emparelhado e análise utilizando o Modelo Oculto de Markov (HMM) do software Partek Genomics Suite (Partek Inc, St.Louis, MO) com parâmetros predefinidos. Para a análise emparelhado, valores de número de cópias foram gerados mediante comparação de perfis tecido benigno do tumor e do mesmo paciente.

Bioinformatics fluxo de trabalho

Para cada tecido, as variações foram anotados utilizando os modelos de genes gerados por Ensembl ( Ensembl 54,36, www.ensembl.org). Todas as variações foram mapeados para todos os modelos de transcrição, o que levou a várias anotações para vários loci. Por exemplo, uma variante pode levar a uma alteração de um aminoácido em uma transcrição e aparecem na UTR do outro.

Deixe uma resposta