PLOS ONE: Next-Generation Sequencing de RNA e DNA isolado de Emparelhados fresco congelado e fixadas em formalina amostras de parafina-embedded de câncer humano e Normal Tissue

Abstract

fixado em formalina, embebido em parafina (FFPE ) tecidos são um recurso valioso para a investigação clínica. No entanto, os ácidos nucleicos extraídos de tecidos FFPE são fragmentados e quimicamente modificado tornando-os um desafio para usar em estudos moleculares. Foram analisados ​​23 fresco congelado (FF), 35 FFPE e 38 pares de amostras de FF /FFPE, representando seis tipos diferentes de tecido humano (bexiga, próstata e carcinoma de cólon; fígado e tecidos normais do cólon; amígdala reativa), a fim de examinar o uso potencial de amostras FFPE em sequenciamento de próxima geração (NGS) com base estudos clínicos retrospectivos e prospectivos. Dois métodos de ADN e três métodos de extracção de RNA de tecidos FFPE foram comparados e verificou-se afectar a quantidade de ácido nucleico e de qualidade. DNA e RNA a partir de FFPE seleccionado e emparelhados espécimes FF /FFPE foram usadas para análise de transcriptoma e exome. As preparações de ADN de bibliotecas exome-seq era mais difícil (29,5% de sucesso) do que a de as bibliotecas de ARN-Seq, presumivelmente devido a modificações em DNA derivado de tecido FFPE. Bibliotecas ainda pode ser preparado a partir de ARN isolado a partir de duas décadas de idade tecidos FFPE. Os dados foram analisados ​​usando o CLC Bio Genomics Workbench e revelou diferenças sistemáticas entre FF e bibliotecas de ácido nucleico derivadas de tecido FFPE. Apesar disso, a análise de pares de DNA dados exome-Seq mostrou concordância para 70-80% de variantes em FF e amostras FFPE armazenados por menos de três anos. dados de RNA-Seq apresentaram alta correlação dos perfis de expressão em pares FF /FFPE (Pearson Correlações de 0,90 +/- 0,05), independentemente do tempo de armazenamento (até 244 meses) e tipo de tecido. Um conjunto comum de 1.494 genes foi identificado com perfis de expressão que foram significativamente diferentes entre amostras pareadas FF e FFPE independentemente do tipo de tecido. Nossos resultados são promissores e sugerem que NGS pode ser usado para estudar amostras de FFPE em ambos os estudos prospectivos e retrospectivos baseados em arquivo no qual as amostras FF não estão disponíveis

Citation:. Hedegaard J, K Thorsen, Lund MK, Hein A-MK, Hamilton-Dutoit SJ, Vang S, et al. (2014) Next-Generation Sequencing de RNA e DNA isolado de Emparelhados fresco congelado e fixadas em formalina amostras de parafina-embedded de câncer humano e tecido normal. PLoS ONE 9 (5): e98187. doi: 10.1371 /journal.pone.0098187

editor: Zhuang Zuo, UT MD Anderson Cancer Center, Estados Unidos da América

Recebido: 14 Março, 2014; Aceito: 10 de abril de 2014; Publicado em: 30 de maio de 2014

Direitos de autor: © 2014 Hedegaard et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. O autores confirmam que todos os dados subjacentes às conclusões estão totalmente disponíveis sem restrições. O acesso aos dados de sequência, contendo informações pessoa identificar, precisa de assinatura em um formulário de acesso controlado, e pode ser acessado pelo The European Genome-phenome Archive [25] com o estudo ID EGAS00001000737 seguinte pedido à Comissão de Acesso a Dados do MOMA. matrizes de expressão estão disponíveis sem restrições através ArrayExpress [REF: www.ebi.ac.uk/arrayexpress] sob adesão:. E-MTAB-2523

Financiamento: Este trabalho foi financiado por doações do Danish National Advanced Technology Foundation (https://hoejteknologifonden.dk/), The John e Birthe Meyer Foundation e The dinamarquês Cancer Society (https://www.cancer.dk/). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:. Anne-Mette K. Hein e Bjarne Knudsen são empregados por bio CLC, que é uma empresa QIAGEN. Mette Katrine Lund e Mogens Kruhøffer são empregados por AROS Biotecnologia Aplicada. Isto não altera a adesão dos autores para todas as políticas PLoS ONE em dados e materiais de compartilhamento.

Introdução

formalina-fixo, (FFPE) amostras de tecido embebidos em parafina armazenados em arquivos de diagnóstico da patologia representam um biobanco de valor inestimável para a investigação clínica retrospectiva. Além disso, as amostras de FFPE pode ser útil em estudos prospectivos omitindo a coleção de espécimes fresco congelado (FF). Infelizmente, os ácidos nucleicos são mais difíceis de extrair a partir de tecido FFPE por causa da necessidade de remover a parafina e para contrariar as interacções proteína-ADN covalentes que resultam do processo de fixação. Além disso, o atraso de fixação (isto é, tempo de isquemia peri-operatória), o processo de fixação, a preparação do tecido, embebidos em parafina, e de armazenamento de arquivo contribuir para a fragmentação, a reticulação e modificação química de ácidos nucleicos derivadas de tecido FFPE. Estas alterações interferem com muitas análises moleculares clássico que requerem ácidos nucleicos de alta qualidade. Avanços no sequenciamento de última geração tecnologias (NGS) permitem a investigação de genomas, epigenomas e transcriptomes usando material de amostra limitada. Além disso, esta análise pode ser feita a um custo relativamente modesto, considerando o grande aumento na quantidade de informação que pode ser obtida. O poder da NGS para analisar em profundidade um grande número de sequências curtas potencialmente torna esta uma tecnologia ideal para aplicar aos ácidos nucleicos normalmente fragmentados que podem ser extraídos de amostras de FFPE. O desenvolvimento de métodos baseados em NGS confiáveis ​​para uso com FFPE ácidos nucleicos derivadas de tecido de baixa qualidade iria abrir os arquivos de patologia de diagnóstico para profiling de alto rendimento, facilitando extensos estudos clínicos retrospectivos. Da mesma forma, a capacidade de utilizar as amostras para análise molecular de FFPE em estudos prospectivos seria de grande utilidade, por, potencialmente, reduzir ou mesmo eliminar a necessidade para a recolha e armazenamento de amostras clínicas criopreservados tedioso

.

enquanto que os ácidos nucleicos isolados a partir de tecidos FFPE anteriormente principalmente sido estudado utilizando PCR-e métodos baseados em microarrays, agora existem relatórios sobre a aplicação da NGS ao material FFPE. Um dos primeiro veio de Schweiger

et ai.

Relatado que a análise à base de NGS de ADN (DNA-SEQ) isolado a partir de amostras de FFPE [1]. Os autores encontraram uma boa correlação entre FF combinados e amostras de câncer de mama FFPE a partir de um único paciente ao analisar alterações no número de cópias do genoma e freqüências variantes com base em baixa cobertura de sequenciamento de genoma completo [1]. Posteriormente, Madeira

et al.

Pooling combinado de amostras e redução na quantidade de DNA de entrada para estudar alterações no número de cópias do genoma nas amostras de FFPE [2]. Um outro papel a partir do grupo Schweiger mostrou que estudos de variações genómicas baseado em sequenciação de ADN a partir de tecido FFPE beneficiaram com o aumento da cobertura obtida utilizando resequenciamento alvo, reduzindo o impacto do ruído induzida por fixação [3]. Recentemente, Tuononen

et al.

Aplicado resequencing DNA alvo para a tela FFPE não-pequenas células carcinomas pulmonares para clinicamente importante

EGFR

,

KRAS Comprar e

BRAF

mutações e encontraram uma correlação significativa com os resultados de PCR em tempo real análises baseadas realizados em paralelo [4]. Spencer

et al.

Aplicado resequencing alvo de genes relacionados 27 cancerosas para 16 FF /FFPE emparelhado adenocarcinomas do pulmão e descobriu que, apesar dos efeitos demonstráveis ​​do processo de fixação, variantes de nucleotídeo único idênticos poderiam ser detectados de forma confiável [ ,,,0],5]. Fanelli

et al.

Têm relatado um método de sequenciamento de alto rendimento para o perfil epigenético baseada no chip-seq, amostras FFPE de um modelo de rato leucemia e de uma gama limitada de cancros humanos (um seminoma e seis carcinomas da mama) , que permitem a análise das modificações de histonas e fator de transcrição de ligação em grande escala do genoma [6], [7]. Gu

et al.

[8], [9] mostrou que a baixa de entrada equivale DNA derivadas de tecido FFPE poderia ser usado em conjunto com representação reduzida seqüenciamento bissulfito (RRBS) para permitir estudos de perfis de metilação do DNA do genoma em amostras clínicas de arquivamento.

Weng

et al.

foram um dos primeiros a descrever a análise baseada em NGS de RNA (RNA-Seq) isolados de amostras de FFPE [10]. Estes autores relataram resultados de expressão comparáveis ​​de profunda sequenciamento de miRNAs derivados de FF emparelhados e carcinomas de células renais FFPE. Além disso, eles descobriram uma correlação elevada comparando os resultados de NGS com os obtidos em paralelo utilizando microarrays e metodologias de RT-PCR. Recentemente, Meng

et al.

Relatou o sucesso da aplicação de sequenciamento miRNA-base de ligação para amostras de câncer armazenados até 9 anos [11]. Embora seja conhecida a partir de estudos utilizando técnicas moleculares tradicionais que as moléculas de ARN menores tais como miARN são mais capazes de resistir a formalina fixação [12], existe uma expectativa geral de que as moléculas de ARN mais longos tendem a ser mais susceptíveis a fragmentação e modificações, tornando assim -los modelos pobres para RNA-Seq. Um estudo de base NGS de moléculas de ARN mais longos tem sido relatada por Sinicropi

et al.

Que descobriu que os dados de RNA-Seq derivados de FFPE cânceres de mama primário era de qualidade suficiente para permitir a descoberta de biomarcadores [13]. Adiconis

et ai.

Relataram uma análise comparativa de cinco métodos para a ARN-Seq aplicado ao RNA de baixa qualidade (por exemplo, que isolado a partir de tecido FFPE) e de baixa quantidade de ARN [14]. Recentemente, Norton

et al.

Aplicado RNA-Seq para nove conjuntos de amostras de tumores de mama FF e FFPE armazenados por até quatro anos e encontraram boa correlação entre os perfis de expressão emparelhados FF e FFPE [15].

Nós expandir estes estudos em termos de número e diversidade de espécimes humanos investigados e relatórios de uma análise sistemática do uso potencial de criação de perfil baseada em NGS de amostras FFPE humanos em estudos clínicos retrospectivos e prospectivos. Nosso estudo inclui (1) a avaliação de diferentes estratégias de isolamento de ácidos nucleicos a partir de amostras de FFPE humanos e FF correspondentes e amostras FFPE; (2) a preparação de genoma segmentado (DNA exome-Seq) e transcriptoma todo (RNA-Seq) bibliotecas de sequenciamento; e (3) uma análise minuciosa dos dados NGS obtido. Os principais objetivos foram identificar e caracterizar os efeitos sistemáticos do processo de fixação dos resultados obtidos, bem como os parâmetros críticos no fluxo de trabalho de uma cirurgia aos dados NGS analisados. Kits de extracção disponíveis foram avaliados no que diz respeito à purificação de ARN e de ADN a partir de amostras humanas FFPE seleccionados (normal do fígado, carcinoma do fígado, amígdalas reactivo, carcinoma do pulmão, carcinoma da mama, pele normal a partir da mama, e carcinoma da bexiga; com correspondentes amostras FF do fígado e as amostras de amígdalas). Isto foi seguido por avaliação da extracção de ARN e de ADN a partir de amostras humanas FFPE (carcinoma colorrectal, do fígado normal, carcinoma da bexiga, e tonsila) com diferentes tempos de armazenagem de arquivo de rotina (até 244 meses). Finalmente, o ADN e ARN foram extraídos a partir de FF e correspondentes amostras humanas (FFPE bexiga, próstata e carcinomas do cólon, bem como a partir de tecido de cólon normal). DNA extraído e RNA foram utilizados para a preparação de genoma segmentado (DNA exome-Seq) e transcriptoma todo (RNA-Seq) bibliotecas de sequenciamento e os dados NGS obtido foi analisado, com foco na descoberta de efeitos sistemáticos do processo de fixação.

métodos e materiais

declarações de Ética

Todos os experimentos deste estudo foram realizados em amostras de origem humana seleccionados entre os biobancos tecido congelado no Hospital Universitário Aarhus, na Dinamarca e do bloco de FFPE de diagnóstico arquivo do Instituto de Patologia do Hospital Universitário Aarhus, na Dinamarca. Os tecidos foram removidos no decurso dos procedimentos cirúrgicos de rotina e foram excedentários de diagnóstico. As amostras foram anónimos antes da utilização no presente estudo. O estudo foi aprovado pelo Comitê de Ética em Pesquisa da Saúde da Dinamarca Região Central e da Agência de Protecção de Dados dinamarquesa.

amostras clínicas e grandes objectivos

fluxos de trabalho de estudo de uma cirurgia para análise final do NGS dados estão ilustrados na Figura S1 em conjunto com os parâmetros de chave investigados. As amostras foram seleccionados para maximizar a gama de variáveis ​​(por exemplo, tempo de armazenamento desde a colheita de tecido e tipo) com um impacto previsto sobre os resultados. Os conjuntos de amostras são descritos nesta seção, na Tabela 1 e na Tabela S1. Foram incluídos no estudo um total de 23 FF, 35 e 38 FFPE emparelhados espécimes FF /FFPE, representando seis tipos diferentes de tecido humano (bexiga, da próstata e do carcinoma do cólon; fígado e de tecido de cólon normal; amígdala reactivo). Um total de 16 FF e Espécimes de FFPE foram seleccionadas diferentes tecidos para os testes iniciais de purificação de ADN e ARN (

conjunto de teste

). Para estudar o impacto do tipo de tecido e o tempo de armazenamento após a fixação, foram seleccionados a partir de blocos de FFPE quatro tecidos (colorrectal e carcinoma da bexiga, e normal do fígado e da amígdala), cada um com quatro tempos de armazenamento (2-3, 13-15, 60-62 241-244 e meses). Esta experiência é denotado

o tempo FFPE de armazenamento Set Online. O maior experimento,

o emparelhado cólon FF /FFPE Set Online, incluiu 19 amostras pareadas FF /FFPE tumor colorretal (tanto benignos e malignos) e 13 FF amostras de correspondência de tecido do cólon normal, que tinham sido recolhidas 2 – 13 anos anteriormente. Para testar a detecção de variantes específicas de nucleotídeo único, um conjunto de 11 amostras de cólon foram selecionados com variantes conhecidas no

KRAS Comprar e

BRAF

(

o KRAS cólon /BRAF variantes de detecção set

). Além disso, sete amostras de carcinoma da próstata FF /FFPE emparelhados coletadas 2 – 11 anos antes (

o emparelhado próstata FF /FFPE Set Online), oito amostras de carcinoma da bexiga FF /FFPE emparelhados coletadas 5 – 9 anos antes (

o emparelhado bexiga FF /FFPE set Online) e as amostras de 10 FF carcinoma da bexiga

a conservação assinatura FF bexiga set Online) foram selecionados (para estudo. DNA e RNA foram isolados a partir de cada amostra e utilizado para gerar bibliotecas de sequenciação exome e sequenciação de ARN total. O principal objectivo das experiências ADN exome-seq foi comparar a detecção de variação genómico em amostras de FF e FFPE correspondentes, incluindo ambas as variantes específicas de relevância clínica, bem como variações globais. Os experimentos de RNA-Seq foram conduzidos para permitir que sejam feitas comparações das informações da transcrição obtida a partir de amostras de FF e FFPE combinados, incluindo (1) informação global sobre a atividade transcricional; (2) os níveis de expressão específicas em relação ao estado biológico (isto é contrastante amostras benignas e malignas em

o emparelhado cólon FF /FFPE Set Online); e (3) descrição de uma assinatura de expressão para a progressão do tumor da bexiga (em

FF assinatura bexiga conservação Set Online e

o emparelhado bexiga FF /FFPE Set Online).

purificação de DNA e RNA a partir de FFPE FF e tecido

Para identificar métodos de extracção, resultando em qualidade óptima de ácido nucleico e de rendimento, de ARN e de ADN foram purificados a partir dos blocos de FFPE do teste

Set Online (Tabela 1 e Tabela S1) utilizando kits disponíveis comercialmente, conforme descrito abaixo. Até seis secções de 10 um foram cortadas a partir de cada bloco de tumor e colocado em tubos de 1,5 ml de centrífuga estéril pronto para a extracção. Os tubos contendo secções de corte FFPE para a purificação de ARN foram armazenadas a -80 ° C até à sua utilização. DNA e RNA a partir de purificações as amostras de fígado e de amígdalas foram FF correspondente feito usando um robô QiaSymphony em combinação com o QIAsymphony DSP DNA Mini Kit e QIAsymphony ARN Mini Kit (ambos da Qiagen). O ADN foi purificado a partir de amostras de DNA QIAamp FFEP FFPE Tecidual (QIAGEN) e NucleoSpin FFPE kits de DNA (Machery-Nagel); RNA foi purificado a partir de amostras FFEP miRNeasy FFPE (QIAGEN), NucleoSpin FFPE RNA (Machery-Nagel) e ExpressArt FFPE RNAready (Amp Tec) kits. A fim de testar a purificação em paralelo de ARN e ADN a partir das mesmas secções FFPE, foram incluídos no kit de NucleoSpin FFPE ARN /ADN (Machery-Nagel) e um estojo de isolamento RECOVERALL total de ácido nucleico para FFPE (Ambion). Finalmente, a fim de testar os procedimentos de purificação automatizados, DNA e RNA foram purificados num robô QiaSymphony utilizando programas especializados FFPE e o Kit Mini QIAsymphony DSP ADN e ARN QIAsymphony Mini Kit (QIAGEN), respectivamente. Todas as extracções foram realizadas em triplicado, em cada três secções FFPE. Devido a uma quantidade limitante de material, extracção a partir de amostras da mama com Recuperar Todos foi feito em apenas duplicados. Purificações foram realizadas seguindo os protocolos dos fabricantes, com a seguinte modificação: Deparaffinisation antes da extracção do ADN e ARN, utilizando o QIAamp DNA FFPE e kit ExpressArt FFPE RNAready, respectivamente, foi feito usando da QIAGEN Deparaffinisation solução, em vez de o xileno incluídos nos kits. Todas as amostras de ADN foram tratadas com RNase e todas as amostras de RNA foram tratadas com DNase durante a purificação. A seguir à purificação, todas as amostras foram lavadas em placas de filtro de UF e eluída em tampão de eluição da QIAGEN (EB, [10 mM de Tris-HCl, pH 8,5]). Os perfis de fragmentação do ARN purificado e o ADN foram estimados por electroforese em chip de uma amostra de 1 uL num Agilent Bioanalyzer 2100 (Agilent Technologies). Uma vez que apenas de cadeia dupla (ds) de ADN é activo na formação de biblioteca TruSeq, tanto a absorvância total a 260 nm (NanoDropND-1000 Spectrophotometer), bem como um ensaio específico de ADNcd (Qubit dsDNA BR Assay Kit /Qubit 2,0 Fluorómetro, Invitrogen) foi utilizada para quantificar a concentração de ADN. A concentração de ARN foi determinada utilizando apenas a absorvância total a 260 nm.

Esta purificação inicial foi seguido por extracção de ADN e de ARN a partir de tecidos FFPE que tinham sido rotineiramente armazenados no arquivo de patologia para períodos de tempo variáveis ​​após a fixação. Este estudo tempo de armazenamento incluiu quatro tecidos: amígdalas (normal reativa), fígado (normal não-neoplásica), bexiga (carcinoma) e cólon (carcinoma). Cada tecido foi representado com quatro blocos FFPE armazenados por 2-3, 13-15, 60-61 e 241-244 meses, respectivamente (Tabela 1 e Tabela S1). Foram utilizados apenas os dois kits de extração mais promissores: purificações de DNA foram feitas usando QIAamp DNA FFPE tecido e kits Ambion RECOVERALL. RNA purificações foram realizadas utilizando kits miRNeasy FFPE e AmpTec ExpressArt. Todas as extrações foram realizadas em duplicado utilizando três secções de tecido.

O estudo tempo de armazenamento foi seguido por purificação de DNA e RNA de amostras pareadas FF /FFPE de cólon (19 amostras), bexiga (8 amostras) e próstata ( 7 amostras) carcinomas (Tabela 1 e Tabela S1). Além disso, 12 FFPE amostras de carcinoma do cólon com mutações conhecidas no KRAS e BRAF foram incluídos (

o KRAS cólon /BRAF variantes de detecção Set Online, Tabela 1 e Tabela S1). Todas as extracções a partir de material FF foram realizados utilizando o QiaSymphony como descrito acima. O ARN foi extraído manualmente a partir de blocos usando os kits de FFPE AmpTec ExpressArt e o ADN foi extraído a partir de semi-automaticamente blocos FFPE no QiaSymphony. O ARN foi extraído em duas reacções paralelas; um tratado com DNase I e o outro foi adicionalmente tratada com Exonulcease I que catalisa a remoção de nucleotídeos do DNA de cadeia simples (ss).

Preparação e sequenciamento de DNA exome-Seq bibliotecas

bibliotecas de DNA genómico foram preparados a partir de FF- e ADN utilizando ADN TruSeq preparação kits biblioteca (Ilumina, seguindo o protocolo livre de gel) FFPE derivada seguida por enriquecimento exome utilizando kits TruSeq exome (Ilumina). preparação biblioteca gDNA foi feito de acordo com o manual do fabricante com as seguintes modificações. (1) A fim de evitar tampão efeitos, 1,2 ug de ADNcd foi processado utilizando uma placa de filtro QIAGEN UF, lavadas duas vezes em tampão de EB ([10 mM de Tris-Cl, pH 8,5], Qiagen) e ressuspensas em 50 uL Tampão EB antes de ser usado como entrada para a preparação da biblioteca TruSeq gDNA. (2) O número de ciclos de PCR utilizados para a amplificação de bibliotecas derivadas de FFPE foi aumentada de 10 a 11. (3) Após o passo final do grânulo-purificação das bibliotecas ADNg amplificados, 10 uL Tampão EB foi adicionado para as bibliotecas, trazendo o volume final até 40 mL. A distribuição do tamanho das bibliotecas ADNg foi estimada por electroforese em chip (DNA 1000 chip de ADN) de uma amostra de 1 uL num Agilent Bioanalyzer 2100 (Agilent Technologies). A concentração de ADN das bibliotecas foi estimada utilizando o KAPA Biblioteca Quantificação Kit (Kapa Biosystems). Resumidamente, quantificação foi realizada usando 10 volumes de reacção de l contendo 6 mL KAPA mistura reagente /iniciador e 4 uL 1.000.000 vezes amostra diluída, seguindo o procedimento recomendado e os padrões fornecidos. A quantificação foi levada a cabo em três diluições de cada amostra independentes. Exome direccionador foi realizada em piscinas de até seis bibliotecas ADNg utilizando 500 ng de cada biblioteca de ADNg de acordo com as recomendações do fabricante. ADNg bibliotecas preparadas a partir de amostras de FF e não FFPE foram reunidas. Após o passo final do grânulo-purificação do exome capturado e amplificado bibliotecas ADNg, 30 uL Tampão EB foi adicionado para as bibliotecas, levando o volume final até 60 mL. As distribuições de tamanho das bibliotecas capturados foram estimados por electroforese em chip (chip de ADN alta sensibilidade) de uma amostra de 1 uL num Agilent Bioanalyzer 2100 (Agilent Technologies). A concentração de ADN das bibliotecas foi estimada utilizando o kit de Quantificação KAPA biblioteca tal como descrito acima. O exome capturado bibliotecas gDNA foram combinados em 2 stocks nM reunidas, desnaturados e diluído até dez horas com tampão de hibridação pré-refrigerado e carregado em TruSeq PE v3 células de fluxo em um CBOT Illumina seguido por indexado sequenciamento-end emparelhado (101 + 7 + 101 pb ) em um Illumina HiSeq 2000 utilizando TruSeq SBS Kit v3 química (Illumina).

estado mutacional em

KRAS Comprar e

BRAF

mutação BRAF e KRAS

análise das 11 amostras em

o KRAS cólon /BRAF variantes conjunto de detecção

foram realizadas como descrito [16]. Resumidamente,

KRAS

códon 12, 13 e 61 e

BRAF V600E

e códon 442-474 foram examinadas usando o Lightscanner (Tecnologia Idaho). As amostras com divergente curvas de fusão foram ainda validados por seqüenciamento Sanger na 3130X Genetic Analyzer (Applied Biosystems)

Preparação e sequenciamento de bibliotecas de RNA-Seq

Para permitir uma análise aprofundada da RNA-Seq de dados, o que é necessário o método utilizado para a preparação de bibliotecas de RNA-Seq para fornecer específica vertente-(direcional) e informações de-final emparelhados, bem como facilitar o sequenciamento multiplex. Devido à degradação esperada do ARN a partir dos tecidos FFPE, o método de preparação da biblioteca não deve ser baseada na selecção de poli (A) + como esta iria prejudicar a preparação da biblioteca ou, pelo menos, um resultado em viés 3 ‘. A obtenção de dados de total de RNA-Seq teria ainda a facilitar uma visão mais completa do transcriptoma. Quando o estudo foi iniciado em 2011, o único kit comercializado cumprindo todos os requisitos foi a tecnologia Ribo-Zero (Epicentre, uma empresa Illumina) para o esgotamento de rRNA seguido de preparação da biblioteca usando a tecnologia ScriptSeq (Epicentre, uma empresa Illumina). Citoplasmática e mitocondrial ARNr foram removidos a partir do ARN total utilizando o Kit de ouro Magnética ribo-zero (humano /murganho /rato, Epicentre, uma empresa Ilumina) seguindo as instruções do fabricante. Resumidamente, solução de remoção de rRNA foi adicionada a 500 ng de RNA total e incubou-se durante 10 min a 68 ° C, em seguida 15 min à temperatura ambiente. Sondas com rRNA hibridada foram removidas por adição da mistura de ARN-sonda a esferas magnéticas lavadas seguido de incubação durante 5 minutos à temperatura ambiente, misturando com vortex, incubação durante 5 minutos a 50 ° C, a magnetização e a transferência do sobrenadante para uma RNase tubo livre. O rRNA empobrecido RNA foi purificado utilizando Agencourt RNAClean XP kit (Beckman Coulter, Inc., Brea, CA, EUA). Resumidamente, foi adicionado um volume de 1,8x AMPure RNAClean XP Grânulos para o rRNA empobrecido ARN seguida por incubação durante 15 min à temperatura ambiente, duas lavagens com etanol a 80% e eluição em água 30 mL RNase. A qualidade do rRNA empobrecido RNA foi estimada por eletroforese em chip (Picochip) de uma amostra de 1 uL num Agilent Bioanalyzer 2100 (Agilent Technologies). Savant Speed-Vac (Thermo Fisher Scientific) foi usada para reduzir o volume restante amostra para 9,5 mL seguido por síntese da direccional, emparelhado-fim e bibliotecas de ARN-Seq indexados usando o kit ScriptSeq V2 (Epicentre, uma empresa Ilumina) seguindo o recomendado procedimento. Resumidamente, o ARN foi empobrecido rRNA quimicamente fragmentado (a menos que o ARN severamente degradadas a partir de tecido FFPE foi usada, caso em que a fragmentação adicional foi omitido), seguindo o procedimento descrito no apêndice no manual ScriptSeq e ADNc foi sintetizado a partir de um hexâmero aleatório com etiquetas. O cDNA foi etiquetado utilizando um terminal de extremidade 3 ‘bloqueada e marcou oligo seguido por MiniElute (QIAGEN) de purificação. O cDNA etiquetado di-se então usado como molde para PCR (10 ciclos para as amostras de FF, 13 ciclos para as amostras de FFPE) utilizando o PCR FailSafe Enzima (Epicentre, uma empresa Ilumina), um iniciador directo e um /iniciador reverso com código de barras indexado. As bibliotecas amplificados foram purificados utilizando Agencourt XP kit (Beckman Coulter). Resumidamente, foi adicionado um volume de 1,0x AMPure XP Grânulos (Beckman Coulter) de cada reacção de PCR seguido por incubação durante 15 min à temperatura ambiente, duas lavagens com etanol a 80% e eluição em água 20 mL RNase. As qualidades das bibliotecas de ARN-Seq foram estimados por electroforese em chip (chip de ADN de alta sensibilidade) de uma amostra de 1 uL num Agilent Bioanalyzer 2100 (Agilent Technologies). A concentração de ADN das bibliotecas foi estimada utilizando o kit de KAPA Biblioteca de Quantificação (Kapa Biosystems) seguindo o procedimento recomendado e os padrões fornecidos. As bibliotecas de RNA-Seq foram combinados em ações combinadas de 2 nm, desnaturado e diluído a 10 horas, com tampão de hibridação pré-refrigerado e carregado em TruSeq PE v3 células de fluxo em um CBOT Illumina seguido por indexado sequenciamento-end emparelhado (101 + 7 + 101 pb ) em um Illumina HiSeq 2000 utilizando TruSeq SBS Kit v3 química (Illumina).

A análise da sequência

O fluxo de trabalho analítico é descrito nesta seção e graficamente apresentados na Figura S2. arquivos fastq de-multiplexado emparelhados foram gerados usando software casava (Illumina) e controle de qualidade inicial foi realizada utilizando FastQC [17] ou casava.

arquivos fastq de-multiplexado pares de bibliotecas de DNA-exome foram importados para a CLC Genomics Workbench (CLC Bio, versão 6.0.1) em execução no CLC Genomics Server (CLC Bio, a versão 5.0.1). sequências adaptadoras e bases com baixa qualidade foram aparadas e as leituras foram mapeados para HG19. A segunda via

remover mapeados lê

ferramenta foi utilizada para remover emparelhado lê-se que tem as mesmas coordenadas iniciais e finais e são, assim, provavelmente duplicatas PCR. Variantes foram detectados nos dados exome com a CLC Bio probabilística Variant chamador usando os seguintes parâmetros: cobertura mínima = 10; Variant probabilidade = 90,0; variantes máxima esperada = 4; Exigência de lê em ambos os sentidos de apoio à chamada.

emparelhados arquivos fastq de-multiplexado de bibliotecas de RNA-Seq foram aparadas para trechos de sequências de adaptador, juntou-se uma única leitura, se possível, seguido por qualidade de corte usando comandos do celular Assembleia CLC (CLC Bio, versão 4.012.84829). Isto resultou em três arquivos fastq diferentes: Dados de gama emparelhado, dados single-finais depois de entrar de emparelhado lê, e os dados single-final, após a eliminação de um dos emparelhado lê devido a, por exemplo, baixa qualidade. Todos os três tipos de arquivos fastq foram então importados por lotes para o CLC Genomics Workbench (CLC Bio, versão 6.0.1) rodando em um CLC Genomics Server (CLC Bio, versão 5.0.1) usando ferramentas de linha de comando CLC Server (CLC Bio, versão 1.7.1). A alta qualidade importados leituras foram mapeadas para as regiões de genes e transcritos anotados pelo NCBI RefSeq Humana 30 de outubro de 2012, em dois ensaios da ferramenta de RNA-Seq Análise do CLC Genomics Workbench. A ferramenta de RNA-seq foi executado com o

Uso de referência com anotações

opção. Com esta opção, as leituras são mapeados contra sequências correspondentes às sequências de genes e transcritos anotados. Na primeira execução, corresponde apenas à vertente para a frente dos genes foram aceitos (usando a opção específica para a frente passadas); na segunda corrida, as leituras que não foram mapeados na primeira corrida foram mapeados permitindo que apenas corresponde à cadeia reversa dos genes (usando a opção específica do fio e para trás). Para estimar a contaminação com rRNA, lê-se que não mapear para o transcriptoma humano, tal como definido pela RefSeq, foram mapeados vertente específica para a frente para rRNA humano (HSU13369, HSU13369, HSU13369 e NC_012920) e não-mapeado lê foram então mapeados vertente específica para trás em direcção humana rRNA.

Relatórios de Mapeamento

e

Relatórios detalhados de mapeamento

foram gerados a partir de cada análise de RNA-Seq para cada amostra, exportados da CLC Genomics Workbench no formato Microsoft Excel, salvos como arquivos de texto delimitados por tabulação individuais, e dados específicos foram subsequentemente extraído e analisado. Para cada experiência, matrizes de mapeamento de genes-wise de ambos para a frente e para trás, analisa RNA-Seq contra o transcriptoma humano foram exportados da CLC Genomics Workbench como arquivos de texto delimitados por tabulação para a exploração e análise estatística no ambiente de computação R (versão 3.0.1 para Windows [18]). Estas matrizes de mapeamento de genes-wise resumir os resultados do mapeamento em colunas de valores RPKM e contagens de leituras de mapeamento para diferentes regiões, como o gene, exão, exão-exão e exon-intron. Matrizes de “exão total de lê” contagens foram selecionados a partir das matrizes de mapeamento de genes-wise e analisadas no pacote de R

análise empírica dos dados Gene Digital expressão em R

(Edger, versão 3.2.3 [19] – [ ,,,0],23]), utilizando a ferramenta de escalonamento multidimensional (MDS) para análise exploratória e as diferentes ferramentas estatísticas disponíveis para a identificação de genes diferencialmente afetadas. O pacote de R Hexbin foi usada para traçar perfis de expressão baseados RNA-Seq (base em valores RPKM) por caixas hexagonais. especificidade Strand foi estimada como a fracção do total do gene lê mapeamento na direcção para a frente em relação ao número total de leituras mapeamento em ambas as direcções. Genes com menos de 10 lê mapeamento na direção de avanço foram omitidos. Para estimar a fração de sequências duplicadas no mapeamento pós dados RNA-Seq (para a frente), arquivos BAM foram exportados da CLC Genomics Workbench e analisados ​​utilizando a ferramenta MarkDuplicates em ferramentas Picard (Picard-tools-1,47, [24]).

Adesão de dados

Todos os dados subjacentes às conclusões descritas no manuscrito estão totalmente disponíveis sem restrições. O acesso aos dados de sequência, contendo informações pessoa identificar, precisa de assinatura em um formulário de acesso controlado, e pode ser acessado pelo The European Genome-phenome Archive [25] com o estudo ID EGAS00001000737 seguinte pedido à Comissão de Acesso a Dados do MOMA. matrizes de expressão estão disponíveis sem restrições através ArrayExpress [26] sob adesão E-MTAB-2523.

Resultados

baseados em NGS

Nós estudamos o uso potencial de amostras FFPE em estudos clínicos retrospectivos e prospectivos, focado na detecção de efeitos sistemáticos do processo de fixação sobre as chamadas variantes em ADN-SEQ e nos perfis de expressão de RNA-Seq.

Deixe uma resposta