PLOS ONE: Amplicon Sequenciamento de câncer colorretal: Variant Chamar Congelados e fixadas em formalina Samples

Abstract

A próxima geração seqüenciamento (NGS) é uma tecnologia emergente se tornando relevante para a genotipagem de amostras clínicas. Aqui, nós avaliamos a estabilidade do sequenciamento amplicon de embebido em parafina (FFPE) e emparelhado as amostras congeladas de metástases do câncer colorretal com diferentes condutas de análise fixados em formalina. 212 regiões amplicon em 48 genes relacionados com o cancro foram sequenciados com Illumina MiSeq usando DNA isolado a partir de amostras de ressecção de 17 pacientes com metástases hepáticas de cancro colorrectal. De dez desses pacientes, emparelhado fresco congelado e tecido FFPE rotineiramente processadas estava disponível para estudo comparativo. qualidade das amostras de tecidos FFPE foi determinada pela quantidade de ADN amplificável usando qPCR, bibliotecas de sequenciação foram avaliadas usando Bioanalyzer. Três gasodutos de bioinformática foram comparados por análise de dados amplicon de sequenciamento. mutações hot spot selecionados foram analisados ​​utilizando sequenciamento Sanger. Nas amostras sequenciadas de 16 pacientes, 29 mutações de codificação não-sinônimas foram identificados em onze genes. Mais frequentes foram mutações em TP53 (10), a APC (7), PIK3CA (3) e KRAS (2). Foi observada uma alta concordância de FFPE e amostras de tecidos congelados emparelhados em dez amostras emparelhadas, revelando 21 idênticas chamadas de mutação e apenas duas mutações diferentes. A comparação destes resultados com duas outras ferramentas variantes chamando comumente utilizados, no entanto, mostraram altas discrepâncias. Assim, amplicon sequenciamento pode, potencialmente, ser usado para identificar mutações hot spot em metástases de câncer colorretal em tecido congelado e FFPE. No entanto, diferenças notáveis ​​existir entre os resultados de diferentes ferramentas de variantes de chamada, que não estão apenas relacionados com a qualidade da amostra de DNA. Nosso estudo destaca a necessidade de padronização e avaliação comparativa de dutos telefônicos variantes, que será necessária para aplicações de translação e clínica

Citation:. Betge J, Kerr G, Miersch T, Leible S, Erdmann G, Galata CL, et ai. (2015) Amplicon Sequenciamento de câncer colorretal: Variant Chamar Congelados e amostras fixadas em formalina. PLoS ONE 10 (5): e0127146. doi: 10.1371 /journal.pone.0127146

Editor do Academic: Jeong-Sun Seo, Seoul National University College of Medicine, República da Coreia

Recebido: 10 Janeiro, 2015; Aceito: 13 de abril de 2015; Publicado em: 26 de maio de 2015

Direitos de autor: © 2015 Betge et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão disponíveis no Arquivo Nucleotide Europeia (ENA), sob o número de acesso PRJEB8754

Financiamento:.. JB tem sido apoiado por uma bolsa da Hartmut-Hoffmann-Berling Internacional Graduate School (HBIGS)

interesses concorrentes:. os autores declararam que não existem interesses conflitantes

Introdução

Devido aos recentes avanços em tecnologias de sequenciamento de profundidade, notáveis ​​insights ter sido adquirida nas alterações adquiridas por câncer colorretal (CRC) genomas durante o processo cancerígeno, expandindo em grande parte nosso ponto de vista sobre a progressão da genômica CRC [1-3]. A promessa de que, após caracterização estrutural de genomas do câncer, tomada de decisão clínica seria guiado pelos perfis de tumor genômicas individuais, no entanto, continua a ser cumpridas. No entanto, o desenvolvimento de novas terapias orientadas destaca a necessidade de métodos fiáveis ​​e de custo eficaz para a caracterização molecular do genoma de cancro para identificar pacientes que, em última análise respondem ao tratamento com base de mutações druggable, alterações preditivos ou marcadores de resistência adquirida.

sequenciamento alvejado com base em amplicons PCR representa uma abordagem viável para avaliação de mutações acionáveis, hot spots mutacionais ou alterações preditivos em genomas do câncer para estudos clínicos. Em comparação com genoma de largura ou largura-exome sequenciação, uma elevada profundidade de sequenciação ( 1000 lê) nos loci genómico de interesse pode ser alcançado, facilitando assim a detecção de variantes de baixa frequência em amostras tumorais heterogéneas misturados com células estromais [4 , 5]. Além disso, devido à comparativamente baixo número de pares de bases a ser sequenciado por paciente, várias amostras, também para análise longitudinal, podem ser analisados ​​em paralelo em bench-top máquinas tais como Ilumina MiSeq, reduzindo os custos e permitindo potencialmente a aplicação clínica de rotina na num futuro próximo.

no entanto, para aplicação clínica e para estudos translacionais sobre amostras clínicas arquivadas, muitos problemas continuam por resolver. A maioria dos espécimes amplamente disponíveis para diagnósticos clínicos e estudos de biomarcadores são fixadas em formol, (FFPE) tecidos embebidos em parafina de arquivos de patologia, como seu armazenamento a longo prazo é relativamente simples e de custo eficiente em comparação com material congelado. No entanto, sabe-se que a fixação de formalina leva a ligação covalente de DNA, RNA e proteínas por pontes de metileno, de desaminação e reacções de oxidação, formação de derivados cíclicos de bases e também para a fragmentação do ADN [6]. Essas alterações de DNA dificultar tecnologias de sequenciamento levando a resultados menos robustos e dificuldades na interpretação dos dados a partir de experimentos de seqüenciamento. Além disso, um método padrão ouro para análise de dados de próxima geração seqüenciamento (NGS) está faltando e programas de garantia de qualidade ainda não são lançados. Diferentes ferramentas de análise de bioinformática e dutos foram desenvolvidos para dados NGS. No entanto, parece que a reprodutibilidade entre os dois deve ser melhorada [7]. Além disso, modelos estatísticos para a descoberta variante e avaliação variante, projetado para-exome todo ou todo o genoma dados que consistem em muitas amostras com baixa cobertura, pode não ser o ideal para pequenos conjuntos de dados amplicon com poucas regiões-alvo. Assim, é geralmente aceite padrão sobre como realizar variante de chamada dos dados de sequenciação do amplicon. Estes problemas realçam a necessidade de preparação de amostras e de análise de dados condutas optimizadas para sequenciamento amplicon de amostras clínicas.

Neste estudo, descrevemos um gasoduto experimental e bioinformática para sequenciamento amplicon de amostras congeladas e FFPE frescos clínicos de CRC. Foco especial é desenhada na preparação de bibliotecas de seqüenciamento de amostras FFPE de baixa qualidade. O gasoduto bioinformática, utilizando um adaptado Genome Analysis Toolkit (GATK) Unified Genotyper, é explicado em detalhe e em comparação com outros métodos variantes chamando comumente utilizados no que diz respeito à sua adequação para a sequenciação amplicon com material FFPE.

Materiais e Métodos

os pacientes

Trinta e três amostras de 17 pacientes submetidos à ressecção de metástases hepáticas de CRC no Departamento de Cirurgia, Hospital Universitário de Mannheim, entre fevereiro de 2012 e fevereiro de 2013 foram incluídos no estudo. Para todos estes pacientes, quer (FFPE) de tecido congelado de fresco ou fixado com formalina embebido em parafina foi utilizado para o isolamento de ADN. De 10 pacientes, emparelhado congelado e tecido FFPE estava disponível para estudo e de 5 pacientes, combinado tumores primários pode ser obtido a partir dos arquivos do Instituto de Patologia, Hospital Universitário de Mannheim. Além disso, uma correspondência par-metástase de primário a partir de um carcinoma neuroendócrino do intestino delgado (Pat05), material de cultura primária a partir de um paciente (Pat16), o material a partir de um paciente com cancro da próstata e linhas de células DLD-1, HCT116, HT55, HUH7, HEK293T , HS68 e SW480 foram incluídos em corridas de sequenciação e análise de outros projectos ou como controles. As amostras foram analisadas em duas corridas de sequenciação, um paciente (Pat13) foi analisada em duas corridas como controlo. Todas as linhas celulares foram obtidas a partir de ATCC. Informações sobre os pacientes podem ser encontrados na Tabela S1.

aprovação Ética

Ética aprovação do conselho foi obtido a partir de Ética Médica Comissão II da Faculdade de Medicina Mannheim, Universidade de Heidelberg, Mannheim, Alemanha (No. 2012-293N-MA, 2013-841R-MA, 2014-551N-MA). consentimento informado por escrito dos doadores de amostras de tecido foi obtido para o uso em pesquisa.

A preparação da amostra

Frozen amostras e linhas celulares.

As amostras de metástases hepáticas de pacientes com CCR foram transportadas em meio de cultura celular RPMI e foram rapidamente congelados em gelo seco e em seguida armazenado a -80 ° C. isolamento de ADN foi realizado com o DNeasy da Qiagen Blood Kit de tecido (Qiagen, Hilden, Alemanha) de acordo com as recomendações dos fabricantes, incluindo a digestão com RNase (Fig 1A). As linhas de células foram sedimentadas e o DNA foi isolado com o mesmo protocolo. DNA extraído foi diluído e utilizado directamente para a preparação de bibliotecas de sequenciamento.

fluxo de trabalho de preparação (A) Sample. DNA foi isolado de amostras de metástase hepática de ressecção congelados ou FFPE CRC frescos com Qiagen sangue e tecido ou FFPE kit, respectivamente. As amostras congeladas, em seguida, foram submetidos diretamente preparação biblioteca de sequenciamento, a partilha de bibliotecas, controlo de qualidade e de sequenciamento. amostras FFPE foram adicionalmente testados quanto à qualidade do DNA por qPCR. qualidade da biblioteca foi testada com Bioanalyzer. Para amostras com baixas quantidades de produtos de amplificação de DNA de tamanho corretamente (fragmentos de 310bp), novas bibliotecas foram preparadas com concentrações de ADN maior de partida e re-analisados ​​com Bioanalyzer. Foram excluídas as amostras com ainda pequenas quantidades de DNA com tamanho correto e DNA altamente fragmentado. (B) ΔCq-valores de controlo de qualidade PCR indicam má qualidade da amostra. concentração de DNA de fragmentos entre 250 pb e 450pb após preparação biblioteca foi calculada com Agilent Bioanalyzer e plotados contra os valores ΔCq de FFPE controle de qualidade PCR. (C) ΔCq valores mais altos correlacionam com menor profundidade média de sequenciamento. (D) a distribuição Cobertura de amplicons de todo FFPE pareado e as amostras congeladas, normalizados para a cobertura total da amostra. As amostras congeladas a uma profundidade média de 4.622, amostras FFPE 1.852.

amostras FFPE.

Tecido de metástases hepáticas foram fixados em formalina und embebidos em parafina durante a rotina patológica work-up . blocos adequados foram escolhidos e cinco de 10 um fatias foram utilizados para extração de DNA sem microdissection. Uma lâmina corada com hematoxilina e eosina (H E) de cada bloco foi utilizado para estimar o teor de células de tumor das fatias correspondentes por dois investigadores (TG e JB) usando um microscópio de duas pontas. O ADN foi isolado usando o Kit Qiagen QIAamp DNA FFPE de acordo com as instruções do fabricante. O DNA foi eluído em 40 uL Tampão de ATE e as concentrações foram medidas com NanoDrop 2000 (NanoDrop, Wilmington, EUA) e kit de Qubit BR (Life Technologies, Darmstadt, Alemanha). O isolamento produziu entre 4.8μg e 22.8μg (10.23μg dizer), medido com o kit Qubit BR. Informações detalhadas sobre a preparação de amostras FFPE podem ser encontrados na Tabela S2.

Biblioteca Preparação

qualidade do DNA de amostras de FFPE foi avaliada através da determinação da quantidade de DNA amplificável usando o FFPE QC PCR (Illumina, San Diego, EUA) de acordo com as recomendações do fabricante. ΔCq valor de todas as amostras FFPE média foi de 2,0 (mediana de 1,9, Min 0,9, Max 4.1). Nove amostras (47%) tinham um valor ΔCq maior do que a 2.0 (Tabela S2) recomendado. TruSeq Cancer Panel Amplicon (Cat. No. FC-130-1008, Illumina) bibliotecas foram preparadas com quantidades de ADN recomendados (150 ng de materiais e linhas celulares congelados frescos, 250 ng para amostras FFPE). O painel inclui 212 amplicons de 170-190bp comprimento, tendo como alvo os pontos quentes de mutação em 48 genes relacionados com o cancro. amplicão regiões estão representados na Tabela S3.

Bioanalyzer (Agilent Technologies, Böblingen, Alemanha) foi usada para confirmar a amplificação bem sucedida biblioteca e a qualidade das amostras de FFPE avaliando concentração de ADN com o tamanho aspirado (~ 310bp) e curto Os fragmentos de ADN ( 150bp). Para comparar quantidades de ADN dentro da região de tamanho desejado, foi calculada a concentração de produtos de amplificação de ADN na gama de 250-450bp. Concentração de DNA com um tamanho entre 250 pb e 450pb variou muito entre 51,7 e 93.831,9 pg /mL (média de 5.675,1 pg /mL, a mediana 672,2 pg /mL) nas bibliotecas de diferentes amostras e inversamente correlacionada com valores ΔCq (coeficiente de Spearman: -0.805 , Fig 1B, S2 Tabela). Para as amostras com baixas concentrações de DNA do fragmento amplificado 310bp, a preparação da biblioteca foi repetido usando maiores quantidades de ADN possíveis (S1 figo, S2 Tabela). Bioanalyzer revelou maiores concentrações de ADN em torno 250-450bp (365,3 pg /mL-5.669,8 pg /ul; significa 6190,9 pg /mL; mediana 1996,3 pg /mL), no entanto, com fundo significativo de fragmentos de ADN curtos. Depois de PCR clean-up de bibliotecas, fragmentos de DNA curta foram reduzidos, mas três amostras também apresentaram quantidades diminuídas de produto de amplificação 310bp e foram, portanto, excluído sequenciamento.

O processamento de dados

gasoduto análise bioinformática é mostrado na figura 2A. Lê foram alinhados contra genoma de referência hg19 usando o algoritmo BWA implementou o software MiSeq (MiSeq Reporter v2.2.29). arquivos BAM foram qualidade examinada com FASTQC (v.0.9.5; https://www.bioinformatics.babraham.ac.uk/projects/fastqc/). Indels em arquivos de alinhamento de sequências foram alinhadas à esquerda e realinhamento local em torno Indels foi feito com a RealignerTargetCreator e as ferramentas IndelRealigner do Genome Analysis Toolkit (GATK, versão 2,4-9) [8]. Base de dados de recalibração índice de qualidade foi realizado. Duplicar mapeamento e marcação não foi considerado adequado para sequenciação amplicon e, portanto, omitido.

fluxo de trabalho de análise (A) Sequencing. arquivos de alinhamento de sequências passou por locais-realinhamento torno Indels, o alinhamento à esquerda e recalibração índice de qualidade base. Após variante chamando com GATK Unified Genotyper, anotação e efeito previsão de variantes detectadas foi feito usando SnpEff. variantes primas de todas as amostras foram filtradas por parâmetros personalizados com SnpSift. Variantes incluídas nos dados de 1000 Genomas Projeto foram excluídos apenas para obter mutações somáticas no cancro. (B) de alta freqüência de mutações do gene TP53 e APC entre mutações somáticas identificadas no metástases hepáticas CRC (congelados e tecidos FFPE). campos coloridos representar a presença de um SNP de codificação nonsynonymous (azul), uma mutação que conduz a uma paragem-codão (cinzento) ou uma mutação de frameshift (laranja). Bares resumir mutações presentes em cada paciente (barras verticais) ou de cada gene mutado (barras horizontais). De nota, alguns genes contêm mais de uma mutação.

Unificação Genotyper gasoduto

Variante de chamada.

Unificação Genotyper do GATK (versão 2,4-9) foi usado para a variante de chamada. Todas as amostras foram processadas em paralelo e dividido em ficheiros variantes individuais para cada uma das amostras após a variante de chamada. A cobertura máxima por locus foi aumentada a partir do padrão de 250 a 9.000.000 de ter em conta a elevada profundidade de sequenciamento amplicon. (Downsampling à menor profundidade é feito em estudos de todo o exome para aumentar a velocidade de memória de poupança). O limite mínimo de confiança para chamar foi definido para 10, o limite mínimo de confiança para emitir a 30. SNPs e Indels foram avaliados simultaneamente. A lista de regiões de todos os amplicons foi utilizado para definir regiões de polimorfismo de nucleotídeo único (SNP) e Indel chamando para aumentar a velocidade de análise. Como alternativa, o gasoduto Genotyper Unified foi usado por processar cada amostra individual, caso contrário, foram utilizados os mesmos parâmetros

anotação Variant e efeito previsão

SnpEff (versão 2.0.5, http..: //snpeff.sourceforge.net/) [9] foi usado para anotação variante e previsão efeito ea ferramenta GATK VariantAnnotator foi executado com o-a opção SnpEff para adicionar as anotações SnpEff com a mais alta importância biológica para cada variante à chamada variante arquivos (FCR) de formato. Posteriormente, o arquivo VCF com informações sobre todas as amostras sequenciadas foi dividido em arquivos de variantes amostra individuais usando o programa GATK SelectVariants. Variantes foram anotados com as frequências de variantes em 1000 genomas projeto usando o SnpSift (https://snpeff.sourceforge.net/SnpSift.html) anotar recurso [9].

filtragem Variant.

SnpSift do pacote SnpEff foi usado para a filtragem de variantes matérias. Os seguintes critérios de filtro de qualidade foram aplicados: qualidade pela profundidade maior do que 0,8 (QD 0,8), a profundidade total para chamar variantes num locus específico maior do que 200 (DP 200) valor de p, Fisher Strand (Phred-dimensionado pelo teste exato de Fisher para detectar viés fio) menor do que 70 (FS 70), a confiança mínima variação superior a 1500 (QUAL 1500), a qualidade de mapeamento superior a 40 (MQ 40) e teste de mapeamento classificação de qualidade maior soma de -15 (! existe MQRankSum | MQRankSum -15). critérios de filtro foi otimizada por meio de análise exploratória. Além disso, apenas as variantes de codificação foram seleccionados com as seguintes expressões: (SNPEFF_EFFECT = ‘NON_SYNONYMOUS_CODING’) | (SNPEFF_EFFECT = ‘CODON_CHANGE_PLUS_CODON_DELETION’) | (SNPEFF_EFFECT = ‘CODON_DELETION’) | (SNPEFF_EFFECT = ‘FRAME_SHIFT’) | (SNPEFF_EFFECT = ‘STOP_GAINED’)). Todas as variantes presentes nos dados 1000 Genomas foram excluídos para obter apenas os dados de mutação somática e não incluem variantes da linha germinal comuns. Variant recalibração não foi feito devido à natureza dos dados de sequenciamento alvo eo relativamente pequeno conjunto de dados.

SAMtools mpileup /BCF-tools gasoduto

SAMtools (versão 0.1.18) mpileup foi usado para gerar variante matéria-chama com o u-(gerar a saída BCF uncompress), – f (faidx indexada arquivo sequência de referência), – D (produção por amostra DP), – (saída por exemplo viés P-valor cadeia) opções e hg19 S como genoma de referência, o processamento de todas as amostras em paralelo. Profundidade máxima per-amostra para Indel e SNP chamada foi definido para 10.000. Bcftools ver com-bvcg opções (formato de arquivo BCF saída, o produto potencial locais variantes única, chamada SNPs, chamar genótipos em locais variantes) foi utilizado para a variante de chamada. Os dados foram processados ​​e variantes foram anotados como para os dados GATK descritos acima. Variantes em loci com uma profundidade de menos do que 50 foram filtrados, bem como todos os não-codificante variantes e todas as variantes presentes nos dados de 1000G.

Ilumina somática Variante de chamada de condutas

na MiSeq software -board Somatic Variant Caller foi executado com parâmetros predefinidos. arquivos VCF contendo informações variante foram baixados da Basespace. Posteriormente, foram anotados com frequências variantes 1000G. Todos os não-codificantes, variantes silenciosos, sinónimas e desconhecidas foram filtrados, bem como todas as variantes presentes nos dados 1000G. Além disso, todas as variantes em um locus com cobertura de 200, variantes com uma frequência variante 0,05 ou com uma qualidade genótipo menos de 100 foram excluídos.

A análise dos dados e visualização

variantes filtradas foram exportadas a partir de arquivos de variantes em arquivos delimitados por tabulação usando SnpSift e concatenadas em uma única guia-delimitado arquivo, incluindo todas as variantes de todos os pacientes. estatística descritiva e visualização de dados foi realizada utilizando o Microsoft Excel e pacotes R (https://www.r-project.org/). diagramas de Venn foram feitas usando venny (https://bioinfogp.cnb.csic.es/tools/venny/index.html) e jvenn [10]. O Integrative Genomics Viewer foi utilizado para análise e visualização de loci mutação específica [11].

O sequenceing amplicon de dados de todas as amostras foram depositados na Nucleotide Arquivo Europeia (ENA) e pode ser acessado com o número de acesso PRJEB8754.

seqüenciamento Sanger

seqüenciamento Sanger foi realizada para avaliar KRAS exão 2 e BRAF exão 15 estados, conforme descrito aqui [12]. Resumidamente, o DNA genómico foi extraído de tecido tumoral FFPE depois macro-dissecção manual, utilizando o kit de DNA QIAamp Micro (Qiagen, Hilden, Alemanha). Os seguintes iniciadores de PCR foram utilizados para amplificação: 5-AACACATTTCAAGCCCCAAA-3 ‘(BRAF-F), 5′-GAAACTGGTTTCAAAATATTCGTT-3′ (BRAF-R), 5’-AGGCCTGCTGAAAATGACTGAATA-3 ‘(KRAS-F), 5’- CTGTATCAAAGAATGGTCCTGCAC-3 ‘(KRAS-R), 5’-

condições dos ciclos térmicos foram de 5 min a 94 ° C, seguido de 35 ciclos de 94 ° C durante 30 segundos, 53 ° C (BRAF) ou 60 ° C (KRAS) durante 30 segundos e 72 ° C durante 30 segundos, seguido por uma incubação final a 72 ° C durante 7 minutos. Após sequenciação dye-terminator utilizando os primers de amplificação por PCR, análises por eletroforese capilar foram realizados em um analisador de 3130 Genética (Applied Biosystems, Foster City, CA).

Resultados

Profundidade de sequenciamento correlaciona-se com qualidade DNA

Nós sequenciado 212 regiões amplicon em 48 genes relacionados com o cancro com Illumina MiSeq usando DNA isolado a partir de amostras de ressecção de 17 pacientes com metástases hepáticas CRC. De dez desses pacientes, emparelhado fresco congelado e tecido FFPE rotineiramente processadas estava disponível para estudo comparativo. estatísticas sequenciação e medições da qualidade do ADN foram analisadas para avaliar as diferenças de FFPE e material congelado (Fig 1A).

O número de leituras e emparelhado emparelhado lê mapeada foi significativamente maior em amostras congeladas em comparação com amostras de FFPE, no entanto, a percentagem mapeado de /raw lê foi apenas 78% em comparação com 96% em FFPE (Tabela 1). Significa qualidade sequenciamento (Phred marcar 38 vs. 37), foi gradualmente maior em amostras de FFPE em comparação com as amostras congeladas; Além disso, o teor de GC era mais elevado do que em FFPE em tecido congelado (49% vs 45%). estatísticas de sequenciação detalhados para cada amostra congelada e FFPE são mostrados na Tabela S4. As amostras congeladas a uma profundidade média de 4.622 lê, amostras FFPE de 1852 lê. Em amostras FFPE, investigou-se a correlação de profundidade sequenciação de ADN com uma qualidade medida pelo controlo de qualidade de PCR. Este passo é realizado antes da preparação da biblioteca e estima a quantidade de ADN amplif icável como um substituto para a qualidade funcional de ADN (Fig 1B e 1C). Descobrimos que os valores de ΔCq superiores, indicativos de qualidade inferior DNA, correlacionada com a menor profundidade média de sequenciamento (Pearson Coeficiente de -0,505, Fig 1C). De nota, ΔCq valores mais elevados também se correlacionou com maior conteúdo GC das amostras (Pearson Coeficiente 0,488, Fig S2), enquanto que a profundidade de sequenciação pareceu ser independente da significativo conteúdo GC da amostra sequenciado (Fig S2). A Fig 1D mostra histogramas da cobertura de amplicões para cada FFPE emparelhado e amostras congeladas, normalizada para a cobertura total da amostra. amostras FFPE tendem a ter uma distribuição mais equilibrada de cobertura sobre os diferentes produtos de amplificação do que as amostras congeladas.

Estes dados indicam que o desempenho sequenciamento correlaciona-se com a qualidade do DNA de amostras de FFPE seqüenciados.

High concordância de mutações identificadas em amostras congeladas e FFPE de metástases CRC

recentes projectos de grande escala identificaram as mutações mais comuns que ocorrem no CRC [1]. Sequenciamento 212 regiões amplicon em genes relacionados 48 com câncer, analisamos as chamadas variantes usando um pipeline de análise Genotyper adaptada Unificado.

Nas amostras de tumor sequenciado a partir de 16 pacientes (congelado e /ou FFPE), um total de 29 mutações foram identificado em onze genes após a exclusão de todas as mutações não-codificantes, todas as variantes sinónimas, e todas as variantes não prejudiciais presentes nos genomas de dados 1000 (Fig 2A-2B). O número de mutações por doente variou de zero a quatro, o número médio de mutações por paciente era de 1,8. Das mutações, 16 SNPs eram, quatro eram Indels levando a um desvio de enquadramento e nove para um codão de paragem. O gene mais frequentemente mutado foi TP53, que mostrou 10 mutações em nove dos doentes. Observou-se sete mutações de APC em seis pacientes, enquanto KRAS e PIK3CA foram mutados dois e árvores vezes, respectivamente (Figura 2B).

DNA de tecidos FFPE pode ter alterações devido ao processo de fixação em formalina. Foram comparadas as variantes identificadas em tecidos congelados e FFPE emparelhados. Em dez pacientes sequenciadas com tecidos congelados e FFPE emparelhado, 23 mutações foram identificadas em amostras de FFPE e 21 mutações em amostras congeladas, assim, uma concordância de 91% pôde ser observado (Figura 3A e 3B). As duas mutações não correspondentes (BRAF V600E e ATM E1971G) foram ambos identificados na FFPE mas não na amostra congelada de paciente 09. Sanger de sequenciação do ponto de acesso mutação no gene BRAF no exão 15 foi realizada, revelando mutação V600E. De nota, seis por cento dos 10.000 leituras no locus BRAF V600E na amostra congelada apresentou a base alternativa “T”, que no entanto não levou a uma chamada variante com gasoduto Genotyper Unificada (Fig 3C)

(a) GATK Unified variante Genotyper gasoduto ligando foi utilizado para identificar mutações de codificação não sinónimas em FFPE (verde) e as amostras congeladas (vermelho). (B) de Venn-Diagrama de mutações de codificação não sinónimas identificados em FFPE e amostras congeladas. (C) Imagens representativas de leituras mapeada para o local da mutação de BRAF V600E identificados em FFPE, mas não em tecido congelado de paciente 09, indicada com a Integrative Genomics Viewer. (D) a frequência Variant de mutações selecionadas e conteúdo da célula tumoral estimado da análise de amostras FFPE.

A correlação entre a percentagem observada de células tumorais em lâminas de FFPE representativos e frequência variante calculada para mutações seleccionadas foi moderada (Fig 3D ).

Estes dados mostram que a sequenciação de tecido FFPE pode levar a resultados globais semelhantes como material congelado sequenciamento e poderia, assim, ser uma abordagem viável para amostras clínicas de rotina.

Baixa reprodutibilidade da variante de pôr em FFPE e tecido congelado com diferentes gasodutos bioinformática

Baixa reprodutibilidade entre diferentes condutas variantes chamando foi relatado para os dados de sequenciamento de todo o genoma, ou conjunto-exome [7]. Para testar se este problema ocorre também com os dados de sequenciação do amplicon, foram comparados diferentes ferramentas para a variante de chamada, a fim de testar a reprodutibilidade dos resultados. Observamos diferenças marcantes entre variante chamando software diferente (Fig 4). Comparado ao gasoduto Genotyper Unificada (Fig 4A e 4B) Samtools /BCFtools encontrados cinco das mutações identificadas com o gasoduto Unified Genotyper (paciente 04 APC, paciente 09 CDH1, paciente 12 KRAS e TP53 e paciente 14 TP53). A mutação APC do doente 09 foi também identificado no mesmo locus, mas apenas na amostra congelada. No entanto, duas mutações adicionais frameshift APC em pacientes 03 e 13 foram chamados apenas por Samtools /BCFtools. Em contraste, as mutações 15 chamado com o oleoduto unifcada Genotyper tanto FFPE e congelado, bem como duas mutações chamados apenas no tecido FFPE não foram identificados com Samtools /BCFtools. Assim, Samtools /BCFtools como utilizados no nosso pipeline parece ser menos sensível, embora possa identificar pequenas Indels adicionais que conduzem a mutações frameshift (Fig 4C e 4D). Além disso, os resultados de Ilumina MiSeq gasoduto somática Variante do chamador de bordo são mostrados na Fig 4E e 4F. Notavelmente, este gasoduto parece chamar variantes em ambas as amostras congeladas e FFPE que não são identificados por outros gasodutos.

As mutações identificadas no tecido congelado e FFPE acompanhado de metástases hepáticas CRC detectados com (A, B) Genome Analysis Toolkit (GATK) Unified Genotyper (C, D) Samtools mpileup /Bcftools e (e, F) chamador variante somática. A cor verde representa amostras FFPE, o vermelho representa congelado, intensidades de cor representam número de mutações de codificação não-sinônimas por gene.

Em relação aos CRCs primários emparelhados analisados ​​de pacientes 04, 10, 11 e 14, Illumina somatic Variant Caller novamente chamado mais variantes do que outros, especialmente no paciente 04 (S5 Tabela). As linhas celulares que foram incluídos como controles são apresentados na Tabela S6. Nas linhas celulares, os resultados quase idênticos foram obtidos com o gasoduto Genotyper unificada e Illumina Somatic Variant chamador, enquanto Samtools mpileup /Bcftools foi menos sensível.

Todos os dados variantes de pacientes e das linhagens obtidas com diferentes gasodutos variantes chamando pode ser encontrado em S7 Table.

Estes dados indicam que as diferenças notáveis ​​existir entre os resultados de diferentes condutas variantes chamando, que não estão apenas relacionados com a qualidade da amostra de DNA.

a sensibilidade e especificidade do sequenciamento amplicon com relação a diferentes gasodutos variantes chamando usando tecidos congelados e FFPE

para avaliar a sensibilidade e especificidade do sequenciamento amplicon analisados ​​com diferentes ferramentas de bioinformática, realizamos Sanger seqüenciamento do KRAS exão 2. Como mostrado na Tabela 2, a sensibilidade e especificidade foram 100%, utilizando Unified Genotyper com DNA isolado a partir de amostras congeladas. Em amostras de FFPE, um caso discordante (paciente 02) foi observado, que teve KRAS c.38G Uma mutação de acordo com Sanger seqüenciamento. No entanto, de notar, a sequenciação de Sanger foi realizada com o material a partir do tumor primário e metastático da peça analisados ​​com sequenciação tinha amplicão do teor estimado do tumor de apenas 10%. Além disso, nenhuma das leituras tinham a variante mutada no locus da mutação (Fig S3). amostra de tumor congelado não estava disponível a partir deste paciente. Relativamente a outras condutas variantes chamando, Samtools /BCFtools não conseguiram identificar a mutação KRAS do paciente 04, enquanto Somatic Variant chamador de receber um telefonema falso positivo no paciente 02 amostras FFPE, faltando a mutação no códon 38.

Adicionalmente , linhas celulares de cancro humanas foram analisados ​​para testar a concordância da variante chamando pipelines independentemente da qualidade da amostra e avaliar a adequação dos critérios de filtro. Como mostrado na Fig S4, uma elevada concordância é observada entre os loci variante identificada em linhas de células de cancro após filtragem de baixa qualidade e variantes não nocivos. Além disso, quase todos os loci variante em linhas de células HCT116, HT55, HUH7 e SW480 identificado com gasoduto Genotyper Unified também foram identificados por grande linha de bancos de dados em escala celular Encyclopedia [13] e COSMIC [14], enquanto loci discordantes foram em grande parte eliminado do nosso dados sobre a filtragem (S4 Fig).

Assim, em metástases CRC pode ser observado diferenças substanciais entre os conjuntos de dados brutos e conjuntos de dados após a filtragem variantes por medidas de qualidade e anotações funcionais. Variante contagem é substancialmente reduzida, enquanto que a concordância entre congelado e FFPE, bem como entre as diferentes variantes de ligando condutas aumenta. Os resultados são apresentados na S5 Fig.

Processamento de todos os arquivos de alinhamento de sequências em conjunto para a variante de chamada é mais sensível do que

separadamente

Processamento de muitas amostras em conjunto para a variante de chamada é geralmente recomendado para todo o genoma ou whole- dados de sequenciação exome, a fim de aumentar o número de leituras em loci específicos. No entanto, não se sabe se esta é também benéfico para a sequenciação de amplicão profunda, uma vez que pode reduzir o impacto das variantes raros presentes apenas num subconjunto de células tumorais em algumas amostras. Em contraste, pode aumentar a sensibilidade para mutações comuns presentes em diversas amostras. Observou-se um aumento geral na sensibilidade para a variante chamada quando as amostras foram processadas em paralelo (Fig S6A e S6B Fig) em comparação com o processamento separado com critérios de oleodutos e filtro idênticos (S6C figo e S6D FIG). Separada chamada variante identificada nenhuma mutação adicional em comparação com vocação variante combinada, mas perdeu três mutações em amostras congeladas e cinco mutações em amostras FFPE.

Deixe uma resposta