PLOS ONE: Estratégia de Dados Similarity-Base para Meta-análise de perfis de transcrição em Cancer

Abstract

Fundo

assinaturas de transcrição robustos em câncer podem ser identificados por dados meta-driven similaridade análise de perfis de expressão de gene. Um imparcial integração de dados e estratégia de interrogatório não foi anteriormente disponível.

métodos e resultados

Nós implementado e realizado um grande meta-análise de perfis de expressão do gene do cancro da mama a partir de 223 conjuntos de dados contendo 10.581 materno humano amostras de câncer usando uma abordagem baseada em similaridade de dados novel (exaltar iterativa). assinaturas de expressão gênica do câncer extraídos de conjuntos de dados individuais foram agrupadas por semelhança de dados e consolidados em uma meta-assinatura com um recorrentes e padrão de expressão gênica concordantes. A análise de sobrevivência retrospectiva foi realizada para avaliar o poder preditivo de um romance de meta-assinatura deduzida a partir de estudos de perfil de transcrição de cancro da mama humano. coortes de validação que consistem em 6.011 pacientes com câncer de mama a partir de 21 conjuntos de dados de câncer de mama diferentes e 1.110 pacientes com outras doenças malignas (cancro da próstata e pulmão) foram utilizados para testar a robustez de nossas descobertas. Durante a análise exaltar iterativa, 633 assinaturas foram agrupadas por sua semelhança de dados e formados 121 grupos de assinatura. A partir dos clusters de assinatura 121, identificamos uma meta-assinatura única (BRmet50) com base em um conjunto de 11 assinaturas compartilhando um fenótipo relacionado ao câncer de mama altamente agressivo. Em pacientes com câncer de mama, não houve associação significativa entre BRmet50 e evolução da doença, e o poder prognóstico da BRmet50 era independente de co-variáveis ​​clínicas e patológicas comuns. Além disso, o valor prognóstico da BRmet50 não era específica ao câncer de mama, como também previu a sobrevivência em cânceres de próstata e de pulmão.

Conclusões

Temos criado e implementado um meta-driven semelhança romance de dados estratégia -Análise. Usando essa abordagem, identificamos uma transcrição meta-assinatura (BRmet50) no câncer de mama, eo desempenho prognóstico da BRmet50 era robusta e aplicável em uma ampla gama de populações de cancro no paciente

Citation:. Qiu Q, Lu P, Xiang Y, Shyr Y, Chen X, Lehmann BD, et al. (2013) Estratégia D Dados Similarity-Base para Meta-análise de perfis de transcrição em Câncer. PLoS ONE 8 (1): e54979. doi: 10.1371 /journal.pone.0054979

editor: Aedín C. Culhane, Harvard School of Public Health, Estados Unidos da América

Recebido: 29 de maio de 2012; Aceito: 22 de dezembro de 2012; Publicação: 29 de janeiro de 2013

Direitos de autor: © 2013 Qiu et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado em parte por uma concessão de Howard Temin do National Cancer Institute dos Institutos Nacionais de Saúde (CA114033 a YY), American Cancer Society-Institucional Research Grant (# IRG-58-009-51 para YY), ea Vanderbilt Clinical e Prêmios Translational ciência (CTSA) UL1 RR024975 do Centro Nacional de investigação Recursos (NCRR), uma parte dos Institutos Nacionais de Saúde (NIH), (CRC1838 para YY). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer de mama é o tipo mais comum de cancro nas mulheres ea segunda principal causa de morte por câncer entre as mulheres nos Estados Unidos. Um biomarcador molecular que pode prever a probabilidade de progressão do câncer de doença invasiva ou metastática pode guiar quão agressivamente os pacientes são tratados inicialmente [1]. Há uma clara necessidade de um melhor entendimento de como os perfis molecular relacionar com fenótipos de câncer e os resultados clínicos e de novos biomarcadores de câncer com desempenho definível e reprodutível em diversas populações de doentes.

A introdução de escala genoma perfil de expressão gênica levou à identificação de biomarcadores de transcrição específicos, conhecidos como assinaturas de expressão do gene. A descoberta de assinaturas de expressão do gene a partir de um único estudo bem alimentado é relativamente simples. Algumas assinaturas têm utilidade biomarcadores como transcrição de classificação de pacientes com significativamente diferentes resultados de sobrevivência no cancro da mama [2], [3]. Por exemplo, perfis de transcrição de cancro da mama primário foi usado anteriormente para identificar uma assinatura 70-gene (comercializado como MammaPrint mas designada aqui como BRsig70) [3], uma assinatura 76-gene distinto (BRsig76) [2], e outros ( Oncotype DX [4], [5], TAMR13 [6], Genius [7], GGI [8], PAM50 [9] e PIK3CAGS278 [10]). Típico de outros biomarcadores da transcrição, tanto BRsig70 BRsig76 e foram derivados a partir de um conjunto de treino de um único estudo e, em seguida, validado com um conjunto de teste a partir das mesmas coortes retrospectivos paciente. Quando submetido a validação externa, a maioria das assinaturas só poderia ser validado usando um conjunto de dados (NKI295) [11] ou alguns conjuntos de dados menores, com amostras retrospectivamente acumulados. Este método de validação tem limitações inevitáveis ​​de poder estatístico ou viés de seleção da amostra. Como resultado, uma fraqueza comum desta abordagem é a falta de consistência e reprodutibilidade [12] – [16].

Com centenas de conjuntos de dados de expressão de genes do cancro da mama depositados em bancos de dados públicos, agora temos a capacidade de utilizar esses dados para o seu pleno potencial e descobrir assinaturas de expressão gênica recorrentes e confiáveis ​​para previsão prognóstico do câncer de mama. No entanto, a identificação de uma assinatura de expressão através de prognóstico meta-análise de perfis de expressão de gene do cancro disponíveis publicamente representa uma oportunidade pouco explorado. Há vários relatos de quadros de meta-análise que utilizam vários conjuntos de dados de câncer de mama para construir e validar classificadores prognósticos [7], [17], [18]. Estas abordagens foco sobre a seleção preditores de conjuntos de treinamento combinados, utilizando média Cox-scores [18] ou tendo em conta os subtipos moleculares de amostras [7], [17]. No entanto, uma questão sem resposta é como identificar padrões de expressão gênica homogêneos usando um método de selecção refinada e imparcial [19]. A fim de extrapolar assinaturas prognósticos validados para uma população mais ampla do paciente, são necessários novos métodos biostatistical usando análise baseada em similaridade de dados [20].

Para evitar as fraquezas de assinaturas individuais derivados de estudo e para gerar uma nova estratégia para melhor utilizar os dados de expressão de genes disponíveis de estudos independentes, temos desenvolvido uma estratégia de meta-análise chamado exaltar (expressão Analysis Tool) [21], [22]. A característica essencial de exaltar é um banco de dados contendo milhares de assinaturas de expressão de genes extraídos de estudos publicados que permite comparações de assinatura. Neste estudo, foram utilizados exaltar de forma iterativa (exaltar iterativo) para realizar uma meta-análise de dados de similaridade-driven e elucidar as assinaturas de transcrição com valor prognóstico reforçada no cancro da mama. Nós demonstramos que as assinaturas heterogêneas de 223 conjuntos de dados públicos contendo amostras de câncer de mama 10581 poderia ser sistematicamente organizada por seus elementos de dados comum (isto é, similaridades intrínsecas e fenótipos da doença) e montados em um novo tipo de dados de assinatura chamado de meta-assinatura. Identificamos uma meta-assinatura específica que consiste em 50 genes (BRmet50) que é robustamente preditivo de prognóstico do câncer em 6.011 pacientes com câncer de mama de 21 conjuntos de dados diferentes de cancro da mama, bem como em outras doenças malignas incluindo pulmão e cancro da próstata. Estes resultados ilustram o valor de BRmet50 no prognóstico do câncer de mama independente de variáveis ​​de tratamento e indicam que exaltar iterativa é um método meta-análise novela capaz de executar a descoberta informativo e robusta de meta-assinaturas no câncer.

Resultados

Extração de Human Cancer Assinaturas

Para organizar os dados de transcrição complexas, nós estabelecemos uma estrutura de dados hierárquica. O nível superior consiste nos estudos de transcrição, e cada estudo da transcrição foi dividido em três níveis: conjuntos de dados, grupos e amostras. Um estudo podem incluir um ou mais conjuntos de dados de acordo com o seu desenho experimental [21]. A partir de 56 estudos de câncer de mama (Tabela S1), recolhemos 223 conjuntos de dados de câncer de mama representam 10,581 amostras de câncer de mama. amostras de cancro da mama primárias dentro de cada conjunto de dados foram agrupados por seus atributos clínicos. Cada conjunto de dados incluiu pelo menos dois grupos de amostras de tumores com vários fenótipos clínicos (Figura 1 Painel superior). Por exemplo, os fenótipos relacionados com a recidiva de câncer ou mau prognóstico incluem o tamanho do tumor, o envolvimento nodal, grau, invasão linfática, o estado de p53, a mutação BRCA1, BRCA2, receptor de estrogénio (ER) e status de crescimento epidérmico humano do receptor do factor 2 (HER2) [23], [24]. Dois ou mais grupos por conjunto de dados foram necessários para gerar comparações estatísticas. Um total de 633 listas de genes significativa ( “assinaturas simples”) de todas as possíveis comparações entre os grupos de pares foram geradas em conformidade usando um teste t de Student [21]. Todos os 633 “assinaturas simples” foram então armazenadas em um banco de dados de assinatura câncer humano (HuCaSigDB) que é acessível on-line (https://seq.mc.vanderbilt.edu/exalt/) [22]. As principais etapas de procedimento para extração de assinaturas são fornecidas nos métodos S1.

O fluxo de trabalho do método exaltar iterativa inclui três processos principais. (1) Extracção de 633 assinaturas de cancro da mama. Todos os grupos de amostras pareadas dentro de cada conjunto de dados de câncer de mama (n = 223) foram comparados com base em todas as co-variáveis ​​clínicas e patológicas possíveis, tais como tamanho do tumor, envolvimento ganglionar, grau, estado marcador, invasão linfática, a recidiva, metástase, o estado de p53, BRCA1 e BRCA2 mutações. O teste t de Student foi então realizada para todas as comparações em pares, e um total de 633 assinaturas de câncer de mama foram gerados e enviados para um banco de dados (HuCaSigDB). (2) clusters de assinatura e classificação. busca iterativa foi realizada utilizando cada um dos 633 assinaturas como a assinatura de uma consulta (ancorado ou semente) contra HuCaSigDB repetidamente para identificar assinaturas homólogas com similaridade de dados significativa definida por exaltar. 121 de 633 assinaturas de consulta encontrou pelo menos uma assinatura semelhante em HuCaSigDB e formou 121 grupos, enquanto os restantes 512 (singletons) não conseguiu gerar clusters. Dois resultados típicos são representados pela descrição esquemática marcado com assinaturas ancorados: o singleton Sig21 eo Sig24 conjunto incluindo 11 membros de assinatura como Sig544, Sig128, Sig140, etc. análise baseada no conhecimento dos fenótipos de assinatura e tamanhos foi realizada entre 121 conjuntos de assinatura. Oito grupos tiveram fenótipos metástase óbvias. Dos oito aglomerados, o maior aglomerado ancorado pela assinatura de consulta (sig24) foi seleccionado para posterior análise. (3) Identificação de BRmet50 meta-assinatura. Todos os genes 6,526 assinatura das 11 assinaturas do cluster Sig24 foram montados juntos para formar uma assinatura sintético (BRmet). Os genes dentro BRmet foram classificados com base na frequência de repetição e concordância de expressão diferencial representado por um mapa meta-calor. Os primeiros 50 genes (BRmet50) representadas em filas foram determinados por um perfil de concordância recorrente frequência e expressão gênica de 100% entre os 11 assinaturas representados nas colunas. As cores no mapa meta-fogo representam a direção da expressão diferencial de genes dentro de um determinado perfil transcricional (vermelho para cima, verde para baixo, e preto para um jogo em falta). A intensidade da cor reflete os níveis de confiança de expressão diferencial.

A assinatura de expressão gênica ( “simples assinatura”), conforme definido pela exaltar é um conjunto de genes significativos com a sua pontuação de estatística e dos códigos de sentido a expressão do gene correspondente ( Para cima ou para baixo). Alguns “assinaturas simples” são biologicamente relacionado a prognóstico do câncer de mama, mas eles foram derivados de estudos de perfis de transcrição individuais e são, muitas vezes, de fraca potência, truncado, ou de baixa qualidade. Existem limitações inerentes de qualquer estudo de perfil individual, incluindo pequeno tamanho da amostra em relação ao grande número de potenciais preditores, limitações de plataformas tecnológicas, a variação da amostra, e bioinformática ou viés método estatístico. Um pressuposto subjacente que fizemos na formulação dessa abordagem é que qualquer estudo de perfil transcricional indivíduo não decodificar uma assinatura de expressão inteira. Pelo contrário, estas “assinaturas simples” representam apenas fragmentos de um perfil transcricional completo e comum (meta-assinatura).

Identificação de um Breast Cancer Novel Meta-assinatura

Nossa hipótese é que uma meta- assinatura com maior poder preditivo pode ser descoberto através de dados orientado a semelhança meta-análise de perfis de transcrição de vários estudos relacionados. análise exaltar forneceu a base para o agrupamento ou o agrupamento “assinaturas simples” que partilham similaridade dados significativos. O processo iterativo exaltar reuniram assinaturas homólogas de “assinaturas simples” e consolidou-los em meta-assinaturas (Figura 1 média e painel inferior). Resumidamente, cada assinatura de câncer de mama foi comparada com todas as assinaturas de câncer de mama em HuCaSigDB e pares de assinatura com semelhança significativa foram agrupadas. A relação intrínseca entre assinaturas de pares foi determinada pela primeira vez por jogo símbolo do gene e concordância no sentido da mudança de expressão gênica. Em seguida, uma pontuação total identidade normalizado foi calculado com base em valores de Q a partir das duas assinaturas. O nível de semelhança significativa foram determinados por análise de simulação [21], como explicado nos métodos S1.

Foram realizadas análises exaltar iterativa em que todos-contra-todos pesquisas de similaridade de assinatura foram realizadas. Mais especificamente, cada um dos 633 “assinaturas simples” de HuCaSigDB serviu como uma semente (também chamado de consulta ou assinatura ancorado) para consultar todas as “assinaturas simples” em HuCaSigDB repetidamente e trazer outras assinaturas homólogas entre si por seus elementos comuns (isto é, intrínseca semelhanças). Este processo iterativo “agrupados” ou “cluster” assinaturas com base em suas semelhanças (Figura 1 painel do meio). pares de assinatura que eram suficientemente semelhantes (p 0,05) foram ligados em conjunto para formar aglomerados. Após comparações iterativos, cada assinatura sementes, quer permaneceu como um singleton (ou seja, uma assinatura semente que auto-compatíveis, mas não encontrou nenhum outras assinaturas) ou formado um cluster com outras assinaturas.

Este processo iterativo exaltar começando com 633 assinaturas de sementes resultou em 121 conjuntos de assinatura e 512 singletons (Figura 1 painel do meio). Estamos focados em oito grupos específicos porque as oito assinaturas de sementes e todas as outras assinaturas em cluster em cada um dos oito foram claramente relacionada com a metástase do câncer. Os 113 grupos restantes não tinha fenótipos metástase do câncer consistentes e óbvias. Para os clusters oito relacionados com metástase, cada um continha vários membros de assinatura que se sobrepõem associados com fenótipos que são conhecidos fatores de risco para a metástase do câncer, como tumores de alto grau, o estado ER-negativo, tipo de célula basal-like, e reincidência do câncer. Destes, nós seleccionado o maior aglomerado de assinatura contendo 11 assinaturas relacionadas com metástases (Figura 1 e Tabela 1) [2], [3], [6], [8], [11], [25] – [29]. Porque cada assinatura no cluster foi derivada de uma comparação entre os cânceres de mama altamente agressivos e menos agressivos, esta comparação rendeu um “pobre-prognóstico” assinatura gene (Tabela 1).

Cada um dos 11 assinaturas compreende várias centenas de genes. A fim de identificar um padrão de expressão do gene de repetição e concordante no cluster assinatura metastático, todos os genes, que incluíam as 11 assinaturas (n = 6,526) foram reunidos em uma assinatura sintético designado como BRmet. Os genes dentro BRmet foram classificados com base na frequência de repetição e direção de expressão diferencial (meta-sentido) entre todas as 11 assinaturas. A frequência de repetição de 100% foi aplicada para selecionar os 50 melhores genes para a meta-assinatura (BRmet50) (Figura 1 painel inferior). Assim, perfis BRmet50 são concordantes entre todas as 11 assinaturas simples cluster (Tabela 1). genes BRmet50 representam significativamente genes diferencialmente expressos não só dentro de suas próprias bases de dados, mas também por 11 outros conjuntos de dados relacionados (Figura 1).

Anotação de genes BRmet50 é fornecida na Tabela S3. Apenas cinco genes em BRmet50 sobreposto com BRsig70, e dois foram encontrados em comum com BRsig76. O número de sobreposição entre os genes BRmet50 e os outros seis assinaturas cancerosas (Oncotype DX, TAMR13, Genius, GGI, PAM50, e PIK3CAGS278) é relativamente baixa (1% -27%), sugerindo que BRmet50 é uma assinatura distinta. Porque BRmet50 foi deduzida a partir de um conjunto de assinaturas que comparam cânceres de mama altamente agressivos e menos agressivos, previmos que BRmet50 estaria associada com mau prognóstico no câncer de mama como a reincidência do câncer, metástase e morte. A característica geral prognóstico da BRmet50 pode ser diferente do que os de BRsig70 /76 (BRmet70 e BRmet76), porque eles foram projetados especificamente para prever metástases à distância em pacientes com câncer de mama em estágio inicial com o estatuto de linfonodos negativos linfático [2], [3]. Assim, percebemos que nem BRsig70 nem BRsig76 foi totalmente comparáveis ​​aos BRmet50. Ao contrário, eles serviram como assinaturas de controle de prognóstico neste estudo.

Meta-validação de BRmet50 no cancro da mama

Uma vez que o BRmet50 foi deduzida a partir de um cluster de assinatura comparando mais e menos agressivas de câncer, retrospectivamente examinaram a capacidade de BRmet50 para predizer o prognóstico em 21 conjuntos de dados, incluindo 11 conjuntos de dados de validação independentes não utilizadas durante o processo de assinatura de agrupamento (Tabela 2).

para verificar a estabilidade do método exaltar iterativo e para evitar over-instalação de nove conjuntos de dados de treinamento, usamos uma estratégia de “leave-one-out ‘de validação cruzada para deduzir nove assinaturas de controle BRmet50 para os correspondentes nove conjuntos de dados de treinamento. Em cada ensaio leave-one-out, as assinaturas constantes permaneceram em cluster. Além disso, todas as assinaturas de controle BRmet50 de o procedimento “leave-one-out” dividiu o conjunto central dos 50 genes. Em seguida, testamos essas controle meta-assinaturas em conjuntos de dados de treinamento (Tabela S2) correspondente e descobriu que suas performances prognósticos eram tão bons quanto BRmet50 (Tabela 2). Os dados sugerem que iterativo processo de agrupamento baseado em exaltar é um método estável e confiável, que não é afetado por qualquer membro assinatura em particular no cluster BRmet.

Os 11 conjuntos de dados de validação independentes foram utilizados para avaliar o desempenho prognóstico BRmet50. testes de log-rank foram conduzidos para avaliar as diferenças na análise de sobrevivência. Os valores de p dos testes de log-rank comparando BRmet50, BRsig70, BRsig76, e os outros seis assinaturas de câncer publicados (Oncotype DX, TAMR13, Genius, GGI, PAM50 e PIK3CAGS278) estão resumidos (Tabela 2 e Tabela 3). Cada assinatura foi avaliada pela sua capacidade de classificar os indivíduos com cancro da mama em ‘bons’ e ‘pobres’ grupos prognósticos. valores de expressão para cada assinatura foram recuperados a partir de cada conjunto de dados correspondente, agrupamento hierárquico, em seguida, sem supervisão foi realizada utilizando o posto de correlação de Spearman, e trabalhos de grupo foram determinados em cada conjunto de dados com base na primeira bifurcação dos dendrogramas agrupamento [30]. BRmet50 distinção entre os bons e maus grupos prognósticos com sucesso em todos os conjuntos de dados (Tabela 2), enquanto BRsig70 e BRsig76 não poderia discriminar grupos de prognóstico em quatro e seis conjuntos de dados, respectivamente. O fracasso da BRsig70 e BRsig76 para estratificar grupos prognósticos nesses conjuntos de dados persistiu amostras usando os algoritmos originais (por exemplo, depois de se re-classificado, o método de correlação de Pearson [3] ou o método de pontuação de recaídas com base em valores de coeficiente de regressão ponderada de Cox [2] ). Assim, estes resultados eram independentes de métodos estatísticos. Resultados semelhantes também foram obtidos entre os outros seis assinaturas de câncer bem estabelecidas, porque nenhum deles poderia discriminar grupos de prognóstico em todos os conjuntos de dados de 11 testes (Tabela 3). Como outra medida de desempenho, foi calculado o c-índice para as assinaturas de câncer em 11 conjuntos de dados de validação (Tabela 3), que é uma generalização da área sob a curva ROC (ROC) [31]. O valor prognóstico (c-index) para BRmet50 e as outras assinaturas de câncer foram comparados. Para qualquer conjunto de dados de teste, BRmet50 c-índice é semelhante aos das outras assinaturas de câncer, sugerindo que o BRmet50 e outras assinaturas cancerosas fornecer informações prognóstico comparável.

Medidas de desempenho no BR1042

de Kaplan-Meier foi usada para ilustrar a sobrevivência livre de doença em diferentes BR1042 entre os três tipos de assinaturas, incluindo BRmet50, uma assinatura de controlo BRmet50, e duas assinaturas previamente identificados (e BRsig70 BRsig76) (Figura 2). Os resultados demonstram uma diferença significativa na sobrevida livre de recidiva entre os bons e maus grupos de prognóstico como previsto para o BR1042 conjunto de dados por BRmet50, bem como a assinatura de controle BRmet50 (BRmet [-1042]) do processo de leave-one-out (

P

0,05). Entre os pacientes para quem BRmet50 previstos um bom prognóstico, a taxa de sobrevida livre de recidiva de 10 anos foi de 79%, contra apenas 47% entre aqueles com um prognóstico pobre (Figura 2, painel superior esquerdo). O risco de recaída previsto por BRmet50 foi significativamente maior entre os pacientes no grupo de prognóstico pobre do que entre aqueles no grupo de bom prognóstico. No entanto, para o mesmo conjunto de dados, nem BRsig70 nem BRsig76 distingue uma diferença significativa na sobrevida livre de metástases entre os bons e maus subgrupos prognósticos.

Os dados de 108 tumores do BR1042 conjunto de dados foram estratificados em dois grupos por BRsig70 e BRsig76 (painéis inferiores), a assinatura de controlo (BRmet [-1042]) a partir do método leave-one-out, ou BRmet50 (painéis superiores) perfis de expressão gênica. Em cada parcela sobrevivência, dois tipos de sobrevida livre de recidiva foram comparados: um grupo de mau prognóstico (preto linha tracejada) e um bom grupo prognóstico (linha sólida vermelha). O tempo livre de doença em dias é mostrada no eixo dos x, e o eixo y mostra a probabilidade de sobrevivência livre de doença. O p

valores indicam a significância estatística das diferenças de tempo de sobrevivência entre os dois grupos

O desempenho dos BRmet50 (c-index:. 0,6573, p

valor

:

0,002) foi melhor do que os de BRsig70 e BRsig76 (c-index: 0,5839 ou 0,5172, respectivamente, valor-p 0,14) ao examinar o conjunto de dados BR1042. Nossos resultados indicam que o poder preditivo de BRmet50 é robusta e aplicável em uma ampla gama de conjuntos de dados independentes.

Para avaliar se associação BRmet50 com o resultado prognóstico era específica, geramos 1.000 assinaturas de tamanho idêntico (50 genes) usando seleccionados aleatoriamente a partir de genes no genoma humano. Todas as assinaturas aleatórias foram testados no mesmo painel de 21 conjuntos de dados de teste. Depois de 1.000 permutações aleatórias das assinaturas de gene, a distribuição valor de p (p-valor -log) a partir de cada conjunto de dados de teste foi gerado, e os valores de p de BRmet50 e os outros seis assinaturas cancerosas publicados também foram representados graficamente no eixo dos X do as parcelas de distribuição (Figuras S2 e S3)

Apesar de algumas assinaturas aleatórias são significativamente (

p Art 0,05). associada a resultados de câncer de mama em vários conjuntos de dados, as associações são mais fortes para os sete assinaturas de cancro da mama em mais de metade dos conjuntos de dados de teste. Estes resultados do controlo fornece uma base estatística válida para a sua relevância prognóstico. Além disso, percebemos que a maioria dos valores de p de BRmet50 estavam no lado extremo direito da p aleatória

– distribuições de valor

(Figuras S2 e S3). Em seguida, em relação à associação de BRmet50 resultado do paciente para aquelas de 1000 assinaturas aleatórias de tamanho idêntico (Figura S2 e S3), e confirmou-se que BRmet50 mostraram uma associação mais forte do que a grande maioria de ( 95%) assinaturas aleatórias. Assim, a probabilidade de obter os mesmos valores p como BRmet50 por acaso nos mesmos conjuntos de dados de teste na Tabela 2 é significativamente baixo (

p Art 0,05).

Predictive Power of BRmet50 é independente da Common clínicas e patológicas covariáveis ​​

Porque BR1141 conjunto de dados [6] inclui 269 pacientes com câncer de mama e um painel cheio de co-variáveis ​​clínicas e patológicas comuns, testamos se a associação de BRmet50 com o resultado de mau prognóstico foi independente da critérios clínicos e patológicos estabelecidos utilizando o conjunto de dados BR1141 robusta examinado por Cox modelos de riscos proporcionais de (Tabela 4 e Tabela S4). A associação entre BRmet50 eo risco de mau resultado clínico foi significativo, independentemente do tamanho do tumor, o estado do nó de linfa, ou tratamento com tamoxifeno (

p Art 0,05). Além disso, o BRmet50 poderia segregar tumores com diferenciação intermediária ou ER-positivo em bons e maus prognósticos subcategorias (taxa de risco de mau prognóstico: 2,5;

p

≤0.001), mas não para aqueles que eram ER-negativo. Nem BRsig70 BRsig76 nem foi capaz de se estratificar com tumores boa ou má diferenciação em qualquer subconjunto de BR1141 excepto subconjunto tratamento com tamoxifeno (Tabela 4). Porque BR1141 estava entre os conjuntos de dados de treinamento, nós também testou uma assinatura ‘leave-one-out “controle BRmet50, e encontraram associações significativas idênticos (Tabela S4). A associação entre BRmet50 e desfecho recaída no subconjunto BR1141 de pacientes sem tratamento com tamoxifeno é ainda descrito nos métodos S1.

Cinco dos 21 conjuntos de dados usados ​​para avaliar o desempenho BRmet50 (BR1042, BR1095, BR1128, BR1141, GSE7390) representou 1.183 tumores e tinha dados sobre um conjunto comum de características clínico-patológicas, incluindo o tamanho do tumor, grau, status do nó de linfa, e Índice de Nottingham prognóstico (NPI) [32], [33]. Análises univariada e multivariada desses cinco conjuntos de validação foram realizados para avaliar melhor o desempenho de BRmet50 em comparação com outros factores de prognóstico, ou seja, BRsig70, BRsig76, idade, tamanho do tumor, grau, status do nó de linfa, e NPI. Foram determinados os não ajustados (Tabela S5) e ajustado (Tabela 5 e Tabela S6) taxas de risco de esses fatores e assinaturas.

univariada Cox análise de riscos proporcionais de demonstrar que BRsig70, BRsig76, ou qualquer indivíduo comum fator prognóstico (tamanho do tumor, grau, status do nó de linfa, ou NPI) não poderia prever com sucesso prognóstico de câncer em todos os cinco conjuntos de dados. No entanto, BRmet50 era o único capaz de diferenciar significativamente amostras de tumores em dois grupos de prognóstico em todos os cinco conjuntos de validação. O valor prognóstico da BRmet50 foi maior do que cada um dos fatores de risco estabelecidos (Tabela S5). Por exemplo, as taxas de risco não ajustados ideais (HR) (alto risco versus baixo risco) em BR1128 foi de 2,8 (IC 95%: 1,5-4,9; p 0,001) (controle BRmet50), 1,9 (95% CI: 1,1-3,3; p = 0,01) (BRmet70), 2.0 (95% CI: 1,1-3,5; p = 0,02) (BRmet76), e 2.2 (95% CI: 1,6-2,9; p 0,01) (NPI), respectivamente. Os dados sugerem que o BRmet50 foi mais eficiente na previsão de sobrevida livre de recidiva em BR1042, BR1141 e GSE7390 ea sobrevida livre de doença em BR1095 e BR1128 de fatores prognósticos estabelecidos.

multivariada Cox análise de riscos proporcionais de foi usada para determinar se BRmet50, BRsig70 ou BRsig76 acrescentou informação prognóstica independente para outras características clinicopatológicas padrão. Neste multivariada Cox análise de riscos proporcionais de (Tabela 5), ​​associações significativas (

p Art 0,05) foram observados em todos os cinco conjuntos de dados de teste entre BRmet50 e tempo ou livre de doença livre de recidiva paciente após o ajuste para o padrão covariáveis ​​clínicos. Assim, BRmet50 contribuiu nova e importante informação prognóstica além da fornecida pelo preditores clínicos estabelecidos. Para a maior parte, BRsig70 e BRsig76 não mostraram associações significativas nestas análises.

Predictive Power of BRmet50 em outros tipos de câncer

Porque BRmet50 previu com sucesso prognóstico do câncer de mama e porque alguns eventos oncogênicos moleculares são conservado entre os vários tipos de câncer [34], a hipótese de que BRmet50 pode representar um perfil transcricional conservado para mau prognóstico em vários tipos de câncer.

para examinar a especificidade prognóstico da BRmet50, nós investigamos se BRmet50 poderia predizer o prognóstico em outra cancros epiteliais, tais como cólon, pulmão, ou cancro da próstata. Três conjuntos de dados, um para cada tipo de cancro: cancro do cólon (n = 73) [35], o cancro do pulmão (n = 441) [36], e doentes com cancro da próstata (n = 596) (Tabela 6) [37] foram sujeitos a univariada e multivariada. Com base nas assinaturas de expressão de genes (BRsig70, BRsig76, ou BRmet50), 1.110 amostras de doentes foram separados em dois grupos (Tabela 6). Todos os três assinaturas não conseguiram prever a reincidência do câncer no câncer de cólon [35] (p 0,05). No entanto, BRmet50 mas nem BRsig70 nem BRsig76 previu com sucesso sobrevida específica da doença no câncer de próstata ea sobrevida livre de recidiva do cancro do pulmão (

p Art 0,01), sugerindo que os perfis de transcrição para o mau-prognóstico pode ser mais conservadas em da mama, pulmão, e cancro da próstata. No conjunto de dados de câncer de pulmão, os bons grupos de prognóstico previstos por BRmet50 teve a maior sobrevida livre de recidiva ( 40% e

p Art 0,01) entre as 3 assinaturas. Nós também determinar se a associação entre as três assinaturas e os resultados clínicos em pacientes com câncer de próstata, pulmão e câncer de cólon foi independente de critérios clínicos e patológicos estabelecidos (Tabela 6). Os resultados sugerem que BRmet50 pode servir como um biomarcador de prognóstico para o câncer de mama e não-materno e pode representar um perfil transcricional conservado entre os vários tipos de câncer.

Discussão

Os dados gerados pela de alto rendimento estudos de transcrição de câncer se rapidamente acumulada e há um crescente interesse em traduzir essa informação em valor clínico. Embora a análise de estudo de único pode ser informativo, muitas vezes é afetada por limitações inerentes. Essas limitações podem ser superadas através da combinação de estudos independentes relacionados em uma meta-análise. Nosso estudo demonstrou que as assinaturas heterogêneas de estudos de câncer individuais podem ser sistematicamente organizados em uma meta-assinatura (BRmet50) com base em suas semelhanças de dados intrínsecos por uma estratégia de meta-análise novel (exaltar iterativa). Esta abordagem meta-análise pode aumentar o poder estatístico, minimizar falsa descoberta, reduzir os efeitos de lote, e melhorar a generalização dos resultados.

Deixe uma resposta