PLOS ONE: subtipos moleculares em Câncer de Cabeça e Pescoço apresentam padrões distintos de cromossómica ganho e perda de genes do cancro Canonical

Abstract

carcinoma de células escamosas de cabeça e pescoço (CECP) é uma doença heterogênea frequentemente fatal. Para além do papel de vírus do papiloma humano (HPV), sem caracterização molecular validado da doença tem sido estabelecida. Usando uma análise genômica integrada e metodologia de validação confirmamos quatro classes moleculares de CECP (basal, mesenquimal, atípica e clássico) consistente com assinaturas estabelecidos para carcinoma escamoso do pulmão, incluindo a desregulamentação da via estresse oxidativo KEAP1 /NFE2L2, a utilização diferencial de a marcadores de linhagem SOX2 e TP63, e preferência para o PIK3CA oncogenes e EGFR. Para o potencial uso clínico as assinaturas são de cortesia para a classificação por estado de infecção do HPV, bem como o elevado risco marcador CCND1 ganho de número de cópias putativo. A etiologia molecular para os subtipos é sugerido pelos ganhos cromossômicas estatisticamente significativas e perdas e celular diferencial de padrões de expressão de origem. sistemas modelo representativo de cada um dos quatro subtipos são também apresentados

Citation:. Walter V, Yin X, Wilkerson MD, CABANSKI CR, Zhao N, Du Y, et al. (2013) subtipos moleculares em Câncer de Cabeça e Pescoço apresentam padrões distintos de cromossómica ganho e perda de genes do cancro Canonical. PLoS ONE 8 (2): e56823. doi: 10.1371 /journal.pone.0056823

editor: Muy-Teck Teh, Barts A London School of Medicina e Odontologia, Queen Mary University of London, Reino Unido

Recebido: 01 de outubro de 2012; Aceito: 15 de janeiro de 2013; Publicação: 22 de fevereiro de 2013

Direitos de autor: © 2013 Walter et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Clínica /Prêmio Translational da Cancer Center UNC Lineberger Comprehensive; https://unclineberger.org/research/research/research/developmental-research-awards K12-RR-023248; https://www.nih.gov. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

carcinoma de células escamosas de cabeça e pescoço (CECP) é uma doença heterogênea que representa a sétima forma mais comum de câncer nos Estados Unidos. Para além do papel de vírus do papiloma humano (HPV), sem caracterização molecular validado da doença foi estabelecida [1] – [4]. a expressão do gene para caracterizar ainda mais a diversidade de HNSCC, assim como outros tumores, o nosso grupo e outros sugeriram (GE) subtipos como um meio de dar prioridade aos padrões dominantes genómicos dentro de um grupo específico de tumor [5] – [11]. subtipos validados baseados principalmente na GE perfil de câncer de mama, glioblastoma, cancro do pulmão, e outros têm recebido grande interesse [5] – [7], [9] – [11]. Trabalho preliminar sugeriu que os subtipos clinicamente relevantes também são encontradas no cancro da cabeça e pescoço [8], mas os resultados não foram replicados, há sistemas de modelos têm sido propostos, e a etiologia dos subtipos é obscura. Em outros tipos de tumor a validação de assinaturas moleculares tem sido estabelecida através da seguinte abordagem: (i) os subtipos foram demonstrou ser estatisticamente válida, (ii) alterações genómicas subjacentes aos subtipos foram documentados, e (III) sistemas de modelo representativo da expressão foram identificados subtipos. O presente estudo foi concebido para abordar cada um dos pontos mencionados acima. Como o objetivo deste estudo foi detectar padrões de expressão gênica e eventos genômicos subjacentes que estão presentes em CECP, o desenho do estudo não incorporam quaisquer subtipos moleculares que foram definidos a priori – por exemplo, subtipos classificados pelo status do HPV.

Resultados

Unsupervised Descoberta de HNSCC Expressão subtipos

A fim de abordar a questão de saber se estatisticamente significativos subtipos de expressão do gene pode ser detectada em CECP, realizamos agrupamento hierárquico de forma não supervisionada e imparcial, utilizando técnicas bem estabelecidas e objectivos [7]. Como no trabalho anterior por Chung et ai. [8], que documentou a presença de quatro subtipos de expressão de genes. heatmaps expressão gênica (Figura 1A) e lotes produzidos por ConsensusClusterPlus [12] (Figura S1 A – C) não suportam a presença de agrupamentos estatisticamente significativas adicionais neste conjunto de dados. Um conjunto representativo de genes conhecidos ou suspeitos de ser relevante para o câncer de cabeça e pescoço é mostrado na Figura 1B e estatísticas de teste para a associação de todos os genes no conjunto de dados com o subtipo de tumor são fornecidos na Tabela S1. SigClust [13] A análise mostrou que os valores p para todas as comparações de pares dos subtipos de expressão foram significativos a nível the.05 depois de aplicar uma correção de Bonferroni para comparações múltiplas (Figura s1d). Referimo-nos aos subtipos de expressão como basal (BA), mesenquimal (MS), atípica (AT), e clássica (CL) com base em características biológicas de genes altamente expressos em cada subtipo.

mc_ui_heatmap dos valores de expressão dos genes de classificador 840 (a) e seleccionar genes associados com HNSCC (B) para cada um dos subtipos de expressão. heatmaps validação das distâncias à base de centroid entre os centróides dos subtipos de expressão no presente estudo e os de Chung et al. (C) e os subtipos de Wilkerson LUSC et ai. (D).

Características Clínicas

As características clínicas dos pacientes incluídos no estudo representam uma ampla seção transversal de pacientes com CECP que é altamente representativa da população visto em uma prática clínica típica (Tabela 1). Não houve correlação do subtipo de tumor com a idade, sexo, raça, uso de álcool, anos-maço, ou o tamanho do tumor. subtipos de tumor foram estatisticamente associados com o site, apesar de todos os sites tinham tumores em cada um dos subtipos de expressão, com uma exceção (hipofaringe não apresentaram BA). Além disso, nenhum local contribuiu com mais de 58% de suas amostras para um subtipo de expressão. Nenhuma subtipo expressão era constituída por mais de 68% dos tumores a partir de um único local. Portanto, ao contrário de outros marcadores moleculares, tais como HPV ou p16, conclui-se que os subtipos de expressão capturado uma dimensão de biologia que não foi limitado a um único local anatómico [14]. Houve associações estatisticamente significativas adicionais entre subtipo do tumor e status do HPV, tratamento, status do nó, e estágio global. É notável que mais tenderam BA no sentido de ser bem diferenciado, ao passo que 13 de 16 tumores pouco diferenciados ou eram MS ou CL, embora essa diferença não foi estatisticamente significativa.

Validação de subtipos

em seguida, voltou a atenção para a questão de saber se os subtipos de expressão detectados no conjunto de dados atual correspondeu aos anteriormente relatados por Chung et al. [8]. Wilkerson et ai. [7] apresentaram um método para a comparação de padrões de expressão de genes encontrados em subtipos de expressão em vários estudos. Usamos o mesmo procedimento, que é descrita mais completamente na secção de Métodos. Resumidamente, centroids de subtipos de expressão medir os valores de expressão gênica média, e subtipos com padrões de expressão concordantes produzir centroids que são mais altamente correlacionados do que os subtipos com padrões de expressão discordantes. Uma correspondência claro foi observado (Figura 1C), com BA, MS, AT, e CL demonstrando os mesmos padrões de expressão como o Chung subtipos 1, 2, 3, e 4, respectivamente. Tendo descoberto quatro subtipos utilizando conjuntos de dados e métodos independentes e imparciais, consideramos esses quatro subtipos de expressão para ser validado.

Processos biológicos distintos e Semelhanças com Lung Carcinoma de células escamosas

Os padrões de expressão encontrados no subtipos sugerem a presença de diferenças fundamentais na biologia subjacente dos tumores associados (Tabela S2). A expressão de genes em BA mostrou uma forte semelhança com o assinatura encontrada nas células basais no epitélio das vias respiratórias humanas, incluindo a alta expressão de genes, tais como

COL17A1 de viajantes, que está associada com a matriz extracelular, do receptor do factor de crescimento e

TGFA

e

EGFR

, eo fator de transcrição

TP63

[14]. Os tumores em MS foram exemplificados por expressão elevada de genes associados com o epitelial para mesenquimal transição (EMT), incluindo o mesenquimais marcadores

VIM

e

DES

, o factor de transcrição

TWIST1

, e o fator de crescimento

HGF

[15], [16]. AT tumores tinham uma forte HPV + assinatura, como evidenciado pela expressão elevada de

CDKN2A, LIG1

, eo fator de transcrição

RPA2

[17]. Tumores em CL, o subtipo com a história mais pesado de fumar, mostrou alta expressão de genes associados à exposição à fumaça de cigarro, incluindo o metabolismo de xenobióticos genes

AKR1C1 /3

e

GPX2

[7], [18], [19] e do fator de transcrição

NFE2L2

[10]

carcinomas de células escamosas de diferentes locais do share corpo uma série de características moleculares -. por exemplo, perda do cromossomo 3p eo ganho do cromossomo 3q [20], [21] – portanto, a hipótese de que uma correspondência entre os nossos subtipos de expressão e informou recentemente pulmonares escamosas subtipos de expressão carcinoma de células (LUSC) [7] seriam observados. Para investigar um fenótipo mais amplo de carcinomas de células escamosas do trato aerodigestivo superior, estendemos a metodologia preditor centróide e avaliada a correspondência de centroids de LUSC e HNSCC (Figura 1D). Notavelmente, um claro padrão de correlação foi observada em que o BA, subtipos MS, CL e de HNSCC correspondeu à basal LUSC, secretora, e subtipos clássicos, respectivamente, de Wilkerson et ai. [7]. Após análise dos dados TCGA LUSC [10] fornecido muitas evidências adicionais das ligações subjacentes entre os subtipos de expressão nos dois locais de tumor (Figura S2). A correspondência entre os subtipos basais é notável porque Wilkerson et al. [7] descrito tempo do curso experiências que envolvem células epiteliais brônquicas humanas em cultura no qual os padrões de expressão de gene em pontos de tempo iniciais mostraram uma forte semelhança com as observadas no subtipo basal de LUSC. Do mesmo modo, como mostrado na Tabela S3, observou-se que o subtipo basal de HNSCC é mais semelhante ao ponto de tempo do dia 3 no curso de tempo dos dados a partir da interface de ar líquido modelo (ALI) [22].

ADN Análise cópia por subtipo

em seguida, virou a nossa atenção para as alterações genômicas de HNSCC medida pelo número de cópias matrizes (CN). Primeiro, confirmou muitas regiões previamente relatados como alterados em CECP, incluindo o ganho de cromossomos 3T, 7P, e 11Q (ganhos estatisticamente significativos são vistos tanto em 11q13 e 11q22) e perda de cromossomos 3p, 9p, e 14q (Tabela S4). Como foi visto em outros tumores [11], existem padrões tanto concordantes e discordantes de alteração do número de cópias em regiões-chave do genoma como uma função do subtipo do tumor (Figura 2, Tabela S5). Por exemplo, os ganhos de 3T variar por subtipo expressão (p = 0,01), ao passo que não há diferenças significativas entre os subtipos de NC foram detectados em 11q13, que contém

CCND1

(p = 1). O ganho HNSCC 7P canônica ocorreu em uma região que contém

EGFR

, mas essas alterações foram encontradas em BA, MS, e CL, não AT (p = 0,01). valores NC em 3p não foram significativamente diferentes entre os subtipos (p = 0,47). Perdas da região 9p que contém

CDKN2A

foram encontrados em BA e só CL, e as diferenças NC foram significativos (p = 0,01). perda CN Focal foi encontrado em 14q32 para MS, CL, e é particularmente pronunciada em AT, mas embora este não fez não atingiu significância estatística. Esta região contém miR203, o que é notável porque ele atinge ΔNp63 [23], um dos seis produtos de proteína de

TP63

. instabilidade cromossômica também variaram consideravelmente por subtipo (p = 2.2e-4), como visto na Figura S3.

Gráficos dos valores numéricos cópia médios nos subtipos de expressão HNSCC após a suavização e remoção outlier, tanto genoma-wide (a) e para os cromossomos ou regiões específicas de interesse (B).

Copy Number alterações e expressão diferencial de genes em 3T Cromossoma por Expression subtipo

Uma das alterações genômicas por excelência associado com carcinomas de células escamosas é o ganho de 3T [20], [21], e na seção anterior notamos que os valores NC nesta região variada por subtipo expressão. Curiosamente, houve um diferencial uso proporcional distinta dos três genes normalmente discutidos como as metas do amplicon:

TP63, PIK3CA,

e

SOX2

(Figura 3). O CL e AT subtipos demonstrado proporcionalmente maior expressão de

SOX2

em relação ao MS e BA, que na verdade parecia expressar menos

SOX2 que os controles da amígdala normais. Em contraste, o subtipo BA expressaram níveis dramaticamente mais elevados de

TP63

do que qualquer outro grupo. Do mesmo modo, embora as cópias MS subtipo exibiu ganhos Número no 3T, nenhum dos genes alvo putativas parece ser expresso a níveis mais elevados do que o normal de amígdalas. Kruskal-Wallis mostrou que a expressão de cada um

TP63, PIK3CA,

e

SOX2

foi associada com o subtipo expressão depois de um ajuste de Bonferroni para múltiplos testes (Tabela S6). Essa observação levanta a possibilidade de que a heterogeneidade do CECP pode em parte ser explicada pelo uso diferencial dos fatores de transcrição (

SOX2

e

TP63

) e oncogene (

PIK3CA

) no amplicão 3T, que é mais complexa do que foi relatado anteriormente [24]. Ele também sugere que o uso diferencial dos fatores de transcrição e oncogenes, promovido em parte por alterações no número de cópias distintas, podem contribuir para as assinaturas de expressão de genes que definem os subtipos de expressão.

O número médio de cópia e de genes valores de expressão específica do gene nos subtipos de expressão HNSCC e amostras de amígdalas normais (NL) para genes do amplicon 3T.

Eventos número de cópias que envolvem genes do cancro da Canonical

Anteriormente, observou que os valores numéricos cópia em regiões de ganho e de perda foram associados com o subtipo expressão. Agora nós descrevemos resultados semelhantes que foram obtidos quando os valores de número de cópias específico do gene para genes conhecidos por desempenhar um papel na HNSCC –

CCND1, CDKN2A,

e

EGFR viajantes – foram consideradas, não a mais ampla regiões discutido acima. Na discussão acima dissemos que os ganhos de 11q13 não foram significativamente diferentes entre os subtipos e Tabela 2 mostra que resultados semelhantes foram encontrados quando a atenção foi restrita aos ganhos de

CCND1

. Em contraste, a frequência de

EGFR

ganhos variaram de 0% no AT para 31% em CL (p = 0,069), enquanto que a frequência de

CDKN2A

perdas variaram entre 10% em MS a 63% em CL (p = 0,004). Ambos os resultados são concordantes com os achados nas regiões mais amplas de 7P e 9p, respectivamente, descritos acima.

Estudos anteriores detectaram associações entre acontecimentos genómicos distintos, e estes resultados forneceram uma visão sobre tanto o biologia subjacente ou o manejo clínico de pacientes com câncer [25], [26]. Em HNSCC, simultâneas

CCND1

ganhos e

CDKN2A

perdas têm sido estudados por Okami et al. [27] e Namazie et al. [28], com Namazie et ai. detectar uma associação entre esses eventos genômicos. Descobrimos que

CCND1

ganhos NC foram associados com

CDNK2A

perdas em todos os subtipos (Tabela S7), e que o evento conjunto foi associado com os subtipos de expressão (Tabela 2), confirmando assim e estendendo os resultados de Namazie et al.

resultados Clínicos por subtipo Expressão e Focais Genomic Alterações

Depois de ter analisado o conjunto de cerca de 140 tumores CECP em subtipos de expressão, e à luz dos fatores de risco conhecidos tais como HPV, tabagismo e uso de álcool, consideramos se a estratificação adicional para os resultados dos pacientes poderia ser sugerido. Em primeiro lugar, investigou se a vantagem de sobrevivência relatado por Chung et al. para “subtipo 1” pode ser reproduzida na coorte atual. Não fomos capazes de confirmar este resultado, e no presente estudo não houve associação entre a sobrevida livre de recorrência e subtipo do tumor, tanto geral (Figura 4A) ou quando nós restringimos para pacientes em estágio final (não mostrado). Estas diferenças podem ser explicadas pela heterogeneidade clínica da doença combinada com o fato de que as distribuições do site tumor nos dois estudos são marcadamente diferentes.

Gráficos de Kaplan-Meier e valores-p teste log-rank comparando livre de recidiva tempos de sobrevivência em todos os subtipos de expressão de (a), o HPV + versus sujeitos HPV-(B), em todos os subtipos de expressão sujeitos HPV-(C), e AT versus não-AT em indivíduos HPV-(D). A significância estatística foi avaliada utilizando o Rank Test Log.

A fim de esclarecer se conhecidos ou suspeitos de fatores de confusão pode ter afetado nossa capacidade de detectar diferenças específicas de subtipo em resultado do paciente, foi avaliado o impacto do estado HPV na sobrevivência global. Observou-se um efeito relativamente grande, mas imprecisa devido ao pequeno número total de HPV + pacientes (Figura 4B). Nós considerado razoável para reavaliar a coorte com HPV + pacientes excluídos. Exclusão de HPV + pacientes revelou que o subgrupo AT demonstrado um resultado particularmente desfavorável (Figura 4C), e esta diferença foi estatisticamente significativa quando comparado com todos os outros subtipos combinados (Figura 4D). Nós então acessado um conjunto independente de 122 tissue microarray amostras (TMA), em um esforço para validar esta conclusão. Por causa da GE e da imuno-histoquímica (IHQ) os valores de coloração baseadas em matrizes não são comparáveis, que não era viável para prever o subtipo de tumor de cada amostra TMA. Em vez disso, usou baixo EGFR e coloração alta p16 como um proxy para o status AT. A diferença de tempos de sobrevivência não foi estatisticamente significativa, mas obteve resultados semelhantes aos descritos acima (Figura S4).

Nós também investigou se os eventos no número de cópias focais foram associados com o resultado clínico. Estudos anteriores já haviam detectado uma correlação entre ganhos CCND1 e diminuição do tempo de sobrevida livre de recidiva em HNSCC [29]. Obtivemos resultados semelhantes quando analisados ​​os valores CN para todas as amostras de tumor (Figura S5), embora os nossos resultados são marginalmente significante (p = 0,07). Notavelmente alguns em assuntos expostos

CCND1

ganhos (Tabela 2), o que sugere a presença de dois grupos distintos em grande parte dos pacientes com resultados clínicos pobres: aqueles com

CCND1

ganhos e aqueles que são HPV – e AT. Figura S6 suporta esta conclusão.

Os subtipos expressão no modelo de sistemas

A linha celular de cancro Encyclopedia [30] contém os dados genéticos de mais de 900 linhas de células cancerosas humanas, incluindo tanto os dados da GE e da NC de 19 esofágica e 18 linhas de células no trato aerodigestivo superior. Aplicou-se a centróide preditor para os dados a partir da GE estas linhas celulares e descobriu que todos os quatro subtipos de expressão estavam presentes (Tabela S8). Estes resultados são particularmente atraente à luz da relevância clínica dos subtipos de expressão porque eles fornecem a base para futuros estudos envolvendo sistemas modelo. Figura S7 fornece exemplos para ilustrar que os eventos NC específicos do subtipo também são vistos nas linhas celulares

Discussão

O nosso resultado primário foi a detecção de quatro subtipos de expressão gênica em CECP -. Basais, mesenquimal , atípica e clássico. Nós também mostrou que estes subtipos têm relevância biológica e clínica, e, portanto, eles fornecem um mecanismo útil e informativo de classificar tumores CECP que complementa os métodos existentes com base na histologia e local do tumor. Análise de expressão de conjuntos de dados publicamente disponíveis revelou que estes subtipos são reprodutíveis em [8] HNSCC e são notavelmente semelhantes aos encontrados em LUSC [7], [10]. Embora os padrões de expressão do gene para o subtipo LUSC secretora são semelhantes às observadas no subtipo de HNSCC mesenquimal, nós favorecemos a nomenclatura alternativa. Os dados que confirmam a origem glandular da HNSCC é menos atraente que a comparação para o pulmão, e evidência de uma assinatura mesenquimais é abundante [7]. Embora seja possível usar os dados existentes para produzir um preditor gene para a infecção por HPV, que não tenta fazer isso, porque os resultados desta natureza foram apresentados por Martinez et ai. [31]. Regiões de cópia de ADN de repetição ganho e perda número foram detectados, alguns dos quais contêm oncogenes conhecidos e supressores tumorais. Os valores do número de cópia em certas regiões aberrantes foram associados com o subtipo do tumor, o que sugere que os eventos de número de cópias pode contribuir para o desenvolvimento de subtipos de expressão. Todos os subtipos de expressão foram detectados em linhas de células de carcinoma epidermóide, uma descoberta que fornece a base para futuros estudos.

Temos agora discutir brevemente as definições dos subtipos de expressão. Basal e clássica foram escolhidos porque os padrões de expressão nestes subtipos mostrou fortes semelhanças com os basais e clássicos subtipos de LUSC. Wilkerson et ai. comparação dos padrões de expressão dos subtipos LUSC para dados do curso do tempo de desenvolvimento de células epiteliais brônquicas humanas, e descobriram que o subtipo basal teve padrões de expressão semelhantes aos observados em pontos de tempo precoces quando as células basais são os mais comuns. Do mesmo modo, como mostrado na Tabela S2, observou-se que o subtipo basal de HNSCC é mais semelhante ao ponto de tempo do dia 3 no curso de tempo dos dados do modelo de LPA [22]. O subtipo clássica apresenta alterações genômicas canônicos associados com carcinoma de células escamosas – por exemplo, exclusão de 3p e 9p, amplificação do 3T, e amplificação focal de ambos

EGFR

e

CCND1

. Mesenquimais foi seleccionado com base na análise de uma via indicativo epitelial para mesenquimal. Finalmente, atípica foi escolhido por causa da falta de qualquer

EGFR

amplificação ou supressão de 9p.

As diferenças nos padrões de expressão encontrado nos subtipos são clinicamente relevantes.

TP63

produz seis proteínas distintas, e ΔNp63 é a isoforma mais abundante em HNSCC [32]. Yang et ai. [33] mostram que ΔNp63 promove a proliferação celular. Chatterjee et ai. [32] notar-se que a exposição a cisplatina conduziu a uma diminuição dos níveis de ΔNp63, de modo que este tratamento pode ser particularmente eficaz para pacientes de BA. Barbieri et ai. [34] mostraram que a perda de

TP63

em linhas de células de carcinoma epidermóide levou à aquisição de um fenótipo mesenquimal, que é atraente tendo em conta os níveis de baixa expressão

TP63

visto em MS. Martin e Cano [35] indicou que a expressão elevada de

TWIST1

ou

BMI1

em linhas de células de carcinoma epidermóide poderia aumentar a probabilidade de invasão e migração. Como os tumores MS exibiram um fenótipo de EMT e aumento da expressão de ambos

TWIST1

e

BMI1

, estes assuntos podem ser mais propensos a desenvolver metástases distantes. O fato de que

EGFR

é sobre-expresso na grande maioria dos tumores CECP [36] torna

EGFR

inibidores uma opção de tratamento atraente para esta doença. No entanto, essas terapias têm menos probabilidade de ser eficazes em tumores em Devido

EGFR

expressão foi inferior do que nos outros subtipos de expressão.

SOX2

e

ALDH1

foram altamente expressa em AT e CL, e ambos os genes são marcadores de células-tronco do câncer putativos por causa de suas contribuições para a auto-renovação e um fenótipo pleuripotent [37], [38]. O produto de proteína de

PIK3CA

é p110α, que fosforila AKT. AKT Activado contribui para a sobrevivência de células tumorais, e, assim, a transformação oncogénica [39]. Oeste et ai. [40] demonstraram que a exposição de células epiteliais normais de pulmão a nicotina facilita a activação de Akt por tornando-se dependentes de PI3K sozinho. Esta observação, combinado com os altos níveis de fumar visto no CL, sugere que PI3 inibidores da quinase fornecer uma opção de tratamento atraente para tumores CL.

Há várias limitações para este estudo. Em primeiro lugar, nós não temos GE, CN, e os dados clínicos para todos os sujeitos do estudo, o que limitava a nossa capacidade de analisar em conjunto estas variáveis. Além disso, embora os rótulos subtipo foram objectivamente definida por um algoritmo de agrupamento e os padrões de expressão de genes foram validados de forma independente, as associações clínicas não foram. número de cópias matrizes foram gerados para todas as amostras com qualidade e quantidade de ADN suficiente. Infelizmente, mais de 20% das matrizes não conseguiu satisfazer as métricas de qualidade padronizada. Além disso, não ficou claro que isoforma (s) de

TP63

foram analisadas pelos nossos matrizes de expressão de genes, e, infelizmente, o papel que o

TP63

joga no subtipo basal não pode ser totalmente apreciado sem o conhecimento destas isoformas. Porque o HPV + amostras foram retiradas na realização de nossa análise de sobrevivência secundária, estes resultados devem ser vistos como exploratória e, portanto, devem ser validados de forma independente. Finalmente, o status de HPV de todos os pacientes não estava disponível.

Em conclusão, confirmou quatro classes moleculares de CECP (basal, mesenquimal, atípica e clássico), consistente com assinaturas estabelecidos para carcinoma escamoso do pulmão. Usando uma análise genômica integrada e metodologia de validação, documentamos subtipos identificados pelos genes e oncogenes supressores de tumor canônicas, incluindo a desregulamentação do

KEAP1 /NFE2L2

via do estresse oxidativo, a utilização diferencial dos marcadores de linhagem

SOX2

e

TP63

, e preferência para os oncogenes

PIK3CA

e

EGFR

. Para o potencial uso clínico, as assinaturas são de cortesia para a classificação por estado de infecção do HPV, bem como o marcador de alto risco putativo

CCND1

copiar ganho número. A etiologia molecular para os subtipos é sugerido pelos ganhos cromossômicas estatisticamente significativas e perdas e celular diferencial de padrões de expressão de origem. sistemas modelo representativo de cada um dos quatro subtipos também foram apresentados.

Materiais e Métodos

Collection Tumor e Ensaios genética

Depois de receber consentimento informado por escrito, congelados, extraídos cirurgicamente, tumores de cabeça e pescoço macrodissected foram coletados na Universidade da Carolina do Norte sob o protocolo Institutional Review Board # 01-1283. ARN do tumor foi extraído e a expressão de ARNm foi testada usando Agilent 44K microarrays. ADN do tumor foi extraído e o número de cópias de ADN foi doseada utilizando Affymetrix genomewide SNP 6,0 fichas. Um resumo de todos os dados genéticos utilizados neste estudo podem ser encontrados na Tabela S9.

Análise mRNA Expression

procedimentos de controle de qualidade foram aplicados aos arquivos de intensidade de nível sonda microarray. Um total de 138 séries de tumores permaneceu após a remoção de matrizes de baixa qualidade, matrizes duplicados, e matrizes de amostras de não-CECP. A correção de fundo normexp e procedimentos de normalização loess [41] foram aplicadas aos dados de nível de sonda. Depois de log

2 transformação, as sondas foram pareados a um banco de dados genético comum para produzir valores de expressão para 15597 genes.

Expression Unsupervised subtipo Descoberta

O processo aqui descrito é semelhante ao que apareceu em Wilkerson et ai. [7]. Depois de valores de expressão foram mediana gene centrada, a variabilidade genética foi calculado usando o desvio absolvição mediana. Foram selecionados os 2500 genes mais variáveis. ConsensusClusterPlus [12] foi usado para realizar o agrupamento não supervisionada para estes genes nas matrizes 138. Este procedimento foi realizado com 1.000 conjuntos selecionados aleatoriamente de amostras de microarranjos utilizando uma proporção de amostragem de 80% e uma distância métrica igual a um menos o coeficiente de correlação de Pearson.

significância estatística de Padrões de Expressão Gênica em subtipos Expressão

Para confirmar a significância estatística dos quatro grupos, SigClust [13] foi aplicado usando o conjunto dos 2.500 genes mais variáveis ​​descritas acima. Todas as comparações de pares dos subtipos foram examinadas utilizando 1000 amostras simuladas e o método de estimativa de covariância inicial.

genes diferencialmente expressos e vias metabólicas

genes diferencialmente expressos foram detectados com o samr pacote de R [42] usando um limiar mediano of.01 FDR. Para cada um dos subtipos de UNC foram comparados os valores de expressão de genes no subtipo de todos os outros subtipos combinados. DAVID [43] foi então usada para encontrar vias KEGG que apresentaram enriquecimento para os genes altamente expressos em cada subtipo. Além disso, expresso diferencialmente genes com categorias funcionais conhecidos, e.g. fatores de transcrição, foram encontrados comparando as listas de genes específicos do subtipo às categorias ontologia gene conhecido [44].

Expression dados publicados

Os microarrays arquivos de intensidade de nível sonda produzidos por Chung et al. [8] foram sujeitos a correcção do fundo, normalização, e procedimentos de compactação de nível de genes semelhantes aos descritos acima. Esta expressão do gene produziu os valores para 60 indivíduos e 8224 genes. Os rótulos subtipo para estes 60 matrizes que apareceram em [8] são referidos como Chung subtipos 1, 2, 3 e 4.

Os valores RPKM Resumo de 20.502 genes e 178 indivíduos foram obtidos com base nos dados RNA-Seq apresentado em [10]. Os valores de log foram RPKM

2 transformada, e qualquer gene que continha, pelo menos, um valor em falta foi removido a partir da análise. Este valor expressão do gene produzido para 15,314 genes.

Validação de Expressão subtipos

Consenso agrupamento atribui um rótulo subtipo de cada array. Como resultado, algumas matrizes podem não ser representativos do seu subtipo. Usando larguras silhueta [45], identificamos um conjunto de 125 amostras “core” cujos padrões de expressão eram mais semelhantes aos dos membros de sua própria subtipo do que outros subtipos. ClaNC [46], um método de classificação com base na centroides mais próximo, foi então aplicado aos dados de expressão de UNC das amostras do núcleo, num esforço para criar um conjunto de genes classificador cuja assinatura de expressão poderiam ser usadas para classificar as novas amostras. Minimizando a taxa de erro de validação cruzada elaborou uma lista de 840 genes classificador (210 genes por subtipo).

Foram identificados os genes classificadores cujos valores expressão também estão presentes no conjunto de dados de expressão Chung, e, em seguida, restringiu a UNC e Chung conjuntos de dados de expressão para estes genes. Após mediana gene centragem cada conjunto de dados separadamente, encontramos o centróide para cada um dos subtipos de UNC e Chung, calculando o valor médio para cada expressão de gene sobre todas as matrizes que têm a etiqueta subtipo apropriado. Tal como em [7], as distâncias entre o centróide UNC e Chung foram calculados utilizando uma distância métrica igual a um menos o coeficiente de correlação de Pearson. Este processo de validação foi repetido usando os dados de Wilkerson LUSC et ai. [7]. Os dados RNA-Seq a partir de [10] foi tratado da mesma forma com as seguintes diferenças: (i) valores de expressão gênica da UNC e log

2 (RPKM) valores dos conjuntos de dados TCGA foram separadamente mediana centrados e padronizadas pelo gene, (ii)

Deixe uma resposta