PLOS ONE: mRNA Angiogênica e microRNA Gene Expression Assinatura prevê um novo subtipo de câncer de ovário seroso

Abstract

O câncer de ovário é a quinta maior causa de morte por câncer em mulheres em os EUA eo sétimo mais fatal no mundo inteiro. Embora o câncer de ovário é notável pela sua sensibilidade inicial para terapias à base de platina, a grande maioria dos pacientes eventualmente desenvolver câncer recorrente e sucumbir à doença resistente à platina cada vez. Modernos, medicamentos contra o câncer alvo intervir na sinalização celular, e identificar mecanismos da doença principais e vias iria avançar muito nossas capacidades de tratamento. A fim de lançar luz sobre a diversidade molecular de câncer de ovário, foi realizada perfil transcricional abrangente sobre 129 estágio avançado, cancros do ovário seroso de alto grau. Implementamos uma versão, re-amostragem de base do algoritmo de descoberta de classe ISIS (Risis: robusta ISIS) e aplicou-a todo o conjunto de perfis de transcrição de câncer de ovário. Risis identificada uma estratificação paciente previamente não descrita, ainda apoiada por perfis de expressão micro-RNA, e do gene definido análise enriquecimento encontrou forte apoio biológico para a estratificação por matriz extracelular, adesão celular, e genes de angiogênese. A “assinatura angiogênese” correspondente foi validada em dez conjuntos de dados de expressão de genes do câncer de ovário independentes publicados e está significativamente associado à sobrevida global. Os subtipos que definimos são de interesse potencial translacional como eles podem ser relevantes para a identificação de pacientes que podem se beneficiar da adição de terapias anti-angiogénicos que agora estão sendo testadas em ensaios clínicos

Citation:. Bentink S, Haibe -Kains B, Risch t, ​​Ventilador JB, Hirsch MS, Holton K, et al. (2012) mRNA Angiogênica e Gene Expression microRNA Assinatura prevê um novo subtipo de câncer de ovário seroso. PLoS ONE 7 (2): e30269. doi: 10.1371 /journal.pone.0030269

editor: Chad Creighton, Baylor College of Medicine, Estados Unidos da América

Recebido: 19 Outubro, 2011; Aceito: 12 de dezembro de 2011; Publicação: 13 de fevereiro de 2012

Direitos de autor: © 2012 Bentink et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiada por doações do Dana-Farber /câncer Cancer Program Harvard Centro de Mulheres, o Adams Barr Foundation Claudia, a Fundação Kittredge, eo Fundo de High tech Instituto de Câncer Dana-Farber. Apoio adicional foi fornecido por um subsídio do Instituto Nacional do Câncer (3P50 CA105009-05S1). Os ensaios DASL foram fornecidos pela Illumina, Inc. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:. Os ensaios utilizados na determinação do angiogênico assinatura de pacientes no Dana-Farber Cancer Institute e Hospital Brigham and Women foram realizados por cientistas da Illumina, que comercializam o DASL. Autores Jian-Bing Fan, Craig Abril, Jing Chen e Eliza Wickham-Garcia são empregados pela Illumina, Inc., uma empresa comercial. Isto não altera a adesão dos autores para todos os PLoS ONE políticas sobre a partilha de dados e materiais e todos os dados foram depositados em ArrayExpress.

Introdução

câncer epitelial de ovário avançado é notável para a sensibilidade inicial a platina e quimioterapia baseada em taxano [1], [2], mas a grande maioria das mulheres irá desenvolver cancro do ovário recorrente no prazo de 12 a 24 meses e acabará por morrer de doenças cada vez platina e quimioterapia-resistente. Uma razão possível que o cancro do ovário refractário a terapia permanece é que existem subtipos moleculares distintas, que diferentes propriedades celulares, cada uma das quais pode necessitar de diferentes abordagens terapêuticas para o tratamento eficaz da doença.

A expressão de genes de perfil de dados representa a maior fonte de dados genômicos que podem ser de uso na identificação de subtipos clinicamente relevantes nos câncer de ovário, e vários estudos têm explorado a sua utilização para encontrar biomarcadores preditivos e subtipos clinicamente relevantes no cancro do ovário [3], [4], [5], [6], [7], [8], [9], [10], [11]. Tothill et ai. [10] utilizado um agrupamento sem supervisão de perfis de expressão de gene e propôs a existência de seis subtipos de cancro epitelial do ovário (denotado C1-C6) e um sétimo grupo de tumores inclassificáveis ​​(NC); o subtipo C1, que tinha a pior prognóstico, foi encontrada para ser caracterizada pela expressão de uma assinatura estromal responsivo. Dressman e colegas [5] usou uma abordagem estatística supervisionada para prever a resposta ao tratamento à base de platina a partir de dados de expressão gênica; eles encontraram evidências ligando chemoresistance a Src e atividade da via Rb /E2F. Recentemente, o consórcio “The Cancer Genome Atlas” (TCGA, https://cancergenome.nih.gov) lançou um conjunto de 500 perfis de expressão genética a partir de 500 amostras de tumores de câncer de ovário seroso que eles usaram para inferir a existência de vários subtipos [12] . No entanto, nenhum dos subtipos identificados até à data têm visto a aplicação clínica generalizada e muitas vezes não conseguem validar em conjuntos de dados independentes.

Nosso objetivo foi identificar subtipos moleculares robustas de câncer de ovário seroso de alto grau e conjuntos de classificação funcionalmente definida genes que possam dar uma visão sobre terapias potenciais. Começamos com uma coleção de 129, embebidos em parafina (FFPE) FIGO estágio III e estágio IV amostras de alta qualidade fixados em formol clinicamente anotados seroso do ovário previamente utilizados para construir um tissue microarray [13], [14] e usou a Illumina DASL ™ plataforma BeadArray ™ ao perfil de expressão de mRNA nestes pacientes; Em paralelo, perfilado o nível de 743 não-codificante micro-RNAs de expressão.

Depois de ter recolhido e normalizou os dados de expressão gênica, corremos o algoritmo de descoberta de classe Risis [15] e submetido os subtipos candidatos resultantes para um rigorosa validação e esquema de avaliação, incluindo a inicialização baseada avaliação da estabilidade e integração de perfis de microRNA, e depois validados os subtipos resultantes e associada gene assinatura em dez conjuntos de dados de expressão de genes independentes que representam dados de 1.606 pacientes com câncer ovariano.

Métodos

identificação do paciente

a aprovação foi obtida a partir do Dana-Farber /Harvard Cancer Center Institutional Review Board (IRB) para analisar todos os relatórios de patologia, entre janeiro de 1999 e dezembro de 2005 no Brigham and Departamento Hospital da Mulher de Patologia base de dados que incluía o diagnóstico de “cancro do ovário” e recolher dados clínicos associados com esses pacientes. Os doentes elegíveis tinham um diagnóstico de fase tardia (todo o FIGO estadio III-IV, exceto um caso de IIc) alto grau papilar carcinoma do ovário seroso, blocos de patologia disponíveis para a geração de um microarray de alta densidade do tecido (HTMA) [13]. características clínicas e demográficas dos pacientes foram extraídos incluindo: idade no momento do diagnóstico, o estágio da doença, procedimentos cirúrgicos, tratamento de quimioterapia dada, a resposta à quimioterapia, data do diagnóstico, data da primeira recorrência da doença e data da morte ou última visita documentada a um prestador de serviços médicos .

extração de RNA e hibridação microarray

RNA foi extraído a partir de blocos FFPE originalmente utilizados para a construção TMA. H E lâminas foram revistos por um patologista dedicado ginecológica (MSH), e três núcleos de tecido de 0,8 mm foram retiradas das amostras correspondentes de FFPE em locais adjacentes aos núcleos originais TMA; áreas seleccionadas para amostragem foram baseados em ter baixos níveis de infiltração, necrótico ou outro contaminante de tecido não-tumoral. O ARN mensageiro foi extraído utilizando o kit Qiagen RNeasy FFPE com; a qualidade e a integridade de ARN foi avaliada utilizando perfis no Agilent Bioanalyzer e 129 amostras passando esta análise básica QC foram analisados ​​utilizando um protótipo Ilumina BeadArray DASL contendo aproximadamente 12.000 ARNm seleccionado (ArrayExpress matriz desenho Adesão A-MEXP-931) [16]; doze amostras foram testadas em duplicado para permitir estimar a reprodutibilidade do ensaio. Além disso, usamos uma expressão microRNA-base DASL protótipo de perfil sondas BeadArray contendo a 743 microRNAs (ArrayExpress matriz Projeto Adesão A-MEXP-1678) [17] para examinar os padrões de atividade microRNA nas amostras. Os dados resultantes foram normalizados utilizando uma transformação variância estabilizador combinada com normalização quantil como implementado no pacote de Bioconductor Lumi [18], [19]. Ambos os conjuntos de dados foram submetidos ao repositório de dados ArrayExpress (ArrayExpress Experiment Adesão E-MTAB-386).

A análise dos dados

Para identificar subtipos de câncer de ovário, as amostras tumorais 129 foram divididos em um treinamento set (n = 82) e um conjunto de seleção de modelos (n = 47). Genes no microarray foram filtrados para selecionar o mais altamente variável 1000 em seus níveis de expressão através amostras, mas que também teve baixa variabilidade entre os doze conjuntos de duplicatas. Foi utilizado o algoritmo de descoberta de classe Risis com estes 1000 genes para identificar partições distintas das amostras de treinamento 82 e para selecionar os 100 genes que forneceram o apoio estatística mais significativa para a partição. Em seguida, testamos o nosso conjunto candidato inicial de partições contra o 47 modelo de seleção de conjunto de teste de amostras e manteve quatro que manteve significância estatística (estabilidade de classificação de 95% durante a inicialização). No conjunto de seleção de modelos

Os dados expressão MicroRNA a partir de 743 miARNs humanos conhecidos perfiladas nas mesmas amostras de tumores 129 foram testados utilizando-PAM (análise de previsão de microarrays) [20], em combinação com uma abordagem aninhada transversal validação [21] para a sua capacidade de prever de forma independente as etiquetas de atribuição de classe Risis.

análise de conjunto enriquecimento Gene (GSEA) de processos biológicos GO foi aplicado para identificar temas biológicos associados com os subtipos candidatos (FDR 10%).

a validade dos subtipos Risis foi ainda validado em cada dez conjuntos de dados independentes (Tabela 1). Os dados de cada estudo foram normalizados, sondas mapeadas para identificadores ENSEMBL, os níveis de expressão do gene robustamente dimensionada para o intervalo [-1, 1], e as amostras classificadas utilizando uma pontuação baseada nos pesos determinados a partir nossa análise discriminante linear no conjunto de dados original. Detalhes adicionais sobre os métodos computacionais utilizados são fornecidos em S1 texto.

Resultados

estratificação dos pacientes com base em 4 assinaturas de expressão de genes independentes

Gene estratificação de baseada em expressão cancer em subtipos distintos transcricionalmente tem provado ser extremamente poderoso em separar os pacientes com características clínicas peculiares, e lançar luz sobre os genes e os mecanismos responsáveis ​​pela condução distinções subtipo. No entanto nenhuma classificação molecular robusto no ovário foi encontrado, apesar de um grande número de conjuntos de dados de expressão disponíveis. Isto pode ser devido ao facto de que muitos estudos incluem múltiplos subtipos histológicos, reduzindo o seu poder identificar de forma eficaz novos fenótipos moleculares [22], [23], [24], [25], [26].

para superar as limitações desses estudos anteriores, geramos um grande conjunto de tumores consistindo apenas em alto grau, no final do estágio carcinomas serosos dados de expressão de genes e usado estes para descoberta subtipo. Estamos focados em tumores seroso de alto grau, pois representam, de longe, o subtipo histológico mais comum de cancro do ovário e um dos mais responsiva à quimioterapia. Nós desviado da estratégia amplamente utilizado de aglomeração os doentes, com base na semelhança global das suas perfis de expressão de gene tal como descrito no Tothill et ai. [10] porque tais abordagens podem ser co-fundada pelo expressão do gene de fundo e, em vez focado em encontrar características modulares compactos dentro dos perfis de expressão tumor. A nossa abordagem é consistente com os modelos mecanicistas de subtipos de câncer em que a expressão de grupos funcionalmente relacionados-distintos de genes e vias distintas pode definir fenotipicamente e clinicamente grupos distintos [27].

Foi utilizado o algoritmo de descoberta de classe sem supervisão ISIS [15], que divide a amostra definida em subconjuntos e testa o significado das partições usando análise discriminante linear com os 100 genes mais importantes. Em contraste com a mais ampla algoritmos de agrupamento utilizados, que retornam sempre uma partição de um conjunto de dados, ISIS não relatar um resultado, se os dados não suportam a presença de subtipos dentro de uma coorte especificado.

Na análise aqui apresentada implementamos uma versão robusta do algoritmo ISIS, Risis, que inclui uma etapa de inicialização adicional para identificar apenas as partições das amostras no conjunto de teste que não são dependentes da composição do conjunto de amostras formação inicial. Para fazer isso Risis escolhe subconjuntos aleatórios das amostras de treinamento, procura por partições subtipo e treina os classificadores para cada um deles, e monitora a consistência das previsões sobre as amostras de teste independentes. partições Só previstos foram consistentes nas amostras de testes independentes são guardados e usados ​​para análise posterior.

Usando Risis encontramos quatro, partições binárias robustas independentes, ou “Splits”, em nossa expressão do gene do cancro do ovário de perfis de dados (S1 -S4), cada um apoiado pela expressão de um conjunto definido de 100 genes (módulos), como mostrado na Figura 1. para cada uma dessas divisórias binários, os dois subtipos de pacientes foram marcadas G0 e G1, para os subconjuntos maiores e menores, respectivamente, de modo que S1 consiste em S1g0 e S1g1, S2 é dividido em S2g0 e S2g1 para Split2, etc. a lista de genes nos módulos que definem cada uma das partições binários está incluído no ficheiro S1.

o ISIS algoritmo identificou quatro classificações independentes binários de partição (fendas) de 129 amostras de cancro do ovário. Cada classificação binária é apoiado por um conjunto selecionado de forma independente de 100 genes (módulo). O painel de topo desta figura mostra quatro barras horizontais representam a classificação das 129 amostras de tumor (colunas), com respeito aos módulos de genes. O vermelho indica que o paciente foi classificado no grupo de menor resultante da respectiva divisão (G1) e o branco indica a classificação para o grupo maior (G0). O mapa de calor no painel inferior representa os perfis dos módulos de genes que suportam os quatro classificações binárias de expressão. Cada linha representa um gene, cada coluna de um paciente e cada célula correspondem a um seu nível de expressão do gene e; amarelo indica um nível de um gene acima de sua média entre os pacientes e azul abaixo de sua média de expressão.

perfis de expressão MicroRNA fornece suporte para Dividir 1

Deixe uma resposta