PLOS ONE: Impacto no desenvolvimento da doença, Genomic Localização e função biológica de Copy Number Alterações na não-pequenas células do pulmão Cancer

Abstract

O cancro do pulmão, dos quais mais de 80% é não-pequenas células, é a principal causa de morte relacionada ao câncer nos Estados Unidos. alterações no número de cópias (CNAs) no câncer de pulmão foram mostrados para ser

posicionalmente

agrupados em certas regiões genômicas. No entanto, ainda não está claro se os genes com alterações no número de cópias são

funcionalmente

agrupado. Usando uma matriz densa polimorfismo de nucleotídeo único, foi realizada número de cópias do genoma análise de uma grande coleção de tumores do pulmão de células não pequenas (n = 301). Propusemos um teste estatístico formal para CNAs entre os diferentes grupos (por exemplo, de pulmão não-envolvidos vs. tumores, os primeiros vs. final tumores fase). Nós também personalizou o gene definido análise de enriquecimento (GSEA) algoritmo para investigar a representação de genes com CNAs em vias biológicas pré-definidas e conjuntos de genes (isto é,

funcional

de clustering). Descobrimos que eventos CNAs aumentar substancialmente a partir da linha germinativa, fase inicial de tumor fase tardia. Além disso a posição genómico, CNA tendem a ocorrer fora dos locais de genes, especialmente na linha germinal, de tecido e fase inicial de tumores não envolvidos. Essa tendência diminui a partir da linha germinal de fase inicial e, em seguida, para os tumores de fase tardia, sugerindo um relaxamento da selecção durante a progressão tumoral. Além disso, os genes com ANC em tumores do pulmão de células não-pequenas foram enriquecidas em determinados conjuntos de genes e vias biológicas que desempenham papéis cruciais na oncogénese e progressão do cancro, o que demonstra o aspecto funcional de ANC no contexto de vias biológicas que foram negligenciados anteriormente. Conclui-se que o aumento CNAs com a progressão da doença e CNAs são ambos

posicionalmente

e

funcionalmente

agrupado. Os potenciais capacidades funcionais adquiridas através CNA pode ser suficiente para as células normais de se transformar em células malignas

citação:. Huang Y-T, X Lin, Chirieac LR, McGovern R, Wain JC, Heist RS, et ai. (2011) Impacto sobre o desenvolvimento da doença, Genomic Localização e função biológica de Copy Number Alterações na Non-Small Cell Lung Cancer. PLoS ONE 6 (8): e22961. doi: 10.1371 /journal.pone.0022961

Edição: Pan-Chyr Yang, National Taiwan University Hospital, Taiwan

Recebido: 28 Março, 2011; Aceito: 02 de julho de 2011; Publicação: 02 de agosto de 2011

Direitos de autor: © 2011 Huang et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo é suportado pelo US National Institutes of Health (https://www.nih.gov/) não concede. CA092824 (D.C.C.), CA074386 (D.C.C.), CA090578 (D.C.C.); e norueguês Cancer Society (https://www.kreftforeningen.no/english)(A.H.). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o cancro do pulmão, dos quais mais de 80% é tipo não-pequenas células (CPNPC), é o segundo câncer mais comum ea principal causa de morte relacionada ao câncer nos Estados Unidos [1]. Tem sido demonstrado em estudos anteriores que o tumor NSCLC tem alterações genômicas mais na região específica dos cromossomos, incluindo os ganhos no número de cópias de braços cromossômicos parciais ou integrais em 1q, 3q, 5p e 8q, e as perdas de cópia na 3p, 6q, 8P, 9p, 13q 17q e [2], [3]. Ou seja, alterações no número de cópias no câncer de pulmão não ocorrem aleatoriamente no genoma, mas são

posicionalmente

agrupado. Todavia, quando a não-aleatoriedade vem, e, além disso, se os genes com alterações no número de cópias também são

funcionalmente

cluster permanece obscuro. O objetivo deste estudo é caracterizar os perfis no número de cópias do genoma do cancro do pulmão de células não pequenas, tanto

posicionalmente

e

funcionalmente

.

Reunimos 301 NSCLC amostras de tumor, juntamente com 63 amostras de sangue emparelhados e 50 amostras de tecidos normais adjacentes emparelhados. Entre as amostras de tumor, um subconjunto deles são de fase final (n = 25). Com a heterogeneidade das amostras, somos capazes de estabelecer um modelo genômico de desenvolvimento da doença a partir do genoma da linha germinativa (sangue) ou genoma pré-cancerosa (tecido não-envolvidos ao lado), a genoma do tumor fase inicial e, em seguida, a genoma do tumor fase tardia. Este modelo também nos permite estudar as tendências no padrão de alterações no número de cópias do genoma (CNAs) e seus efeitos de selecção. Além de se concentrar sobre o perfil CNAs em amostras de tumor, como estudos anteriores, aqui nós investigado mais a diferença de CNAs no tecido não-envolvidos, fase inicial e fase tardia, bem como entre o adenocarcinoma eo carcinoma de células escamosas. Para realizar um teste estatístico formal do padrão de CNAs do genoma entre os diferentes grupos, propusemos um teste global baseada permutação, em que as comparações múltiplas, a correlação do número de cópias e localização dos loci sonda são totalmente ajustado.

análise set Gene enriquecimento (GSEA) foi originalmente desenvolvido para análises de matrizes de expressão e foi usado para identificar a sobre-representação de genes pertencentes a uma determinada categoria biológica que estão associados com fenótipos biológicos (por exemplo, estágio, histologia) [4]. Molecular base de assinatura (MSigDB) é uma coleção de conjuntos de genes curadoria para uso com GSEA. Aqui nós mostramos que, com a modificação do regime de permutação, GSEA pode ser adaptado para explorar a sobre-representação de genes com CNAs em conjuntos pré-definidos de genes MSigDB (ou seja, “

funcional agrupamento”).

na “teoria cromossômica do câncer”, tumorigênese é iniciada por aneuploidias [5], [6]. Para tumorigênese, seis capacidades adquiridas necessárias tenham sido propostas: a auto-suficiência em sinais de crescimento, insensibilidade aos sinais anti-crescimento, apoptose fugir, potencial replicativo ilimitado, angiogênese sustentado e invasão de tecidos e metástases [7]. Uma vez que a hipótese de que existe agrupamento funcional de genes com CNAs, procurou-se investigar se CNAs são uma estratégia mecanicista suficiente para adquirir as capacidades acima; ou seja, se o agrupamento funcional de genes com CNAs fornece provas para a teoria cromossômica do câncer.

Materiais e Métodos

Declaração de Ética

O consentimento informado foi obtido a partir todos os pacientes. O estudo foi aprovado pelos conselhos de revisão institucionais do MGH, da Harvard School of Public Health, e da Inspecção de Dados da Noruega, e do Comité Regional local para a investigação médica.

População do estudo e espécimes

Uma série de 301 amostras de tumores congelados instantaneamente a partir de pacientes com NSCLC foram coletados durante a cirurgia ou biópsia do Hospital Geral de Massachusetts (MGH), Boston, MA e do Instituto Nacional de Saúde Ocupacional, Oslo, Noruega. Também incluiu 50 amostras adicionais de emparelhado parênquima pulmonar não-neoplásica dos pacientes noruegueses e 63 amostras de sangue emparelhados dos pacientes MGH, todos os quais foram usados ​​como grupo de referência do número de cópias de estimação.

qualidade do DNA, histopatologia e GeneChip

amostras de DNA foram extraídas de tumores e parênquima pulmonar não-neoplásica após microdissecção o manual de 5-u seções histopatológicas. Para DNAs de pacientes MGH, um patologista (L.R.C.) que não tinha conhecimento da informação clínica e genética revisado todas as seções para cada paciente. Cada amostra foi avaliada para a quantidade e qualidade das células tumorais e histologicamente classificadas segundo os critérios da OMS. Os espécimes foram todos norueguesa ressecado recolhido e preparado da mesma maneira. As amostras com celularidade cancro inferior a 70%, a concentração de DNA inadequado ( 50 ng /mL), ou um padrão de manchas em electroforese em gel não foram incluídos para genotipagem. Um total de 414 amostras de DNA (301 de tumores, 63 de amostras de sangue emparelhados e 50 a partir de amostras de pulmão não-envolvidos emparelhados) foram hibridizados em Affymetrix 250K Nsp GeneChip®, que contém 262,264 sondas (256,554 sondas nos cromossomos somáticos e 5.710 sondas sobre sexo cromossomo).

pré-processamento de dados

número de cópias foram obtidas com software dChip [8]. As intensidades de sonda foram calculados pela expressão baseado em modelo após conjunto normalização invariável. Para cada SNP, em cada amostra, o número de cópias em bruto foi calculado como sinal de × 2 ÷ (sinal de amostras de referência neste SNP média) utilizando sangue e amostras de tecido não-neoplásicas como a referência. número de cópias inferidos foram calculados a partir dos números de cópias matérias por mediana de suavização com a janela de 11 SNPs para cada local de 262,264 SNPs. Foram analisados ​​apenas 256.554 sondas nos cromossomos somáticos. As sondas de SNP foram mapeados para os genes RefSeq com 2 extensão kb a montante ea jusante usando o navegador UCSC Genome. Entre os 256,554 sondas nos cromossomos somáticos, 104,256 sondas foram mapeados para 11.700 genes.

A análise estatística

número de cópias ganhos e perdas foram analisados ​​separadamente. número de cópias ganhos foram definidos como números de cópias inferidas (CN) ≥2.7 e copiar as perdas numéricas foram definidos como inferido número de cópias ≤1.3. Os pontos de corte foram escolhidos para detectar número de cópias ≥3 e ≤1 tolerando 30% a contaminação de tecido normal. Note-se que 70% da celularidade câncer era o limite para o nosso check-patológico de qualidade. A prevalência dos indivíduos com ANC foi representada graficamente em todo o genoma. Para cada locus, foram assumidos os números de pacientes que têm a CNA segue uma distribuição binomial com o tamanho da amostra como o número total de sujeitos e a probabilidade nula estimado empiricamente a partir dos dados: Total de sondas com CN≥2.7 (ou CN≤1.3) ÷ (256,554 tamanho × amostra). Significância em alterações no número de cópias do genoma foi determinado através do cálculo dos valores exactos de p para cada um dos loci de 256554, e os valores de q foram calculados para controlar para comparações múltiplas em todo o genoma utilizando a taxa de falso descoberta [9], [10]. Para cada gene mapeado por várias sondas, a sonda com a maior proporção de amostras tendo CNAs, ou equivalentemente, o menor valor de p foi escolhido para representar o recurso CNAs do gene.

Aqui nós propôs uma base de permutação- teste global para os padrões CNAs genoma escala entre dois grupos eram diferentes, foram aplicados testes de duas amostragens para dados binomiais calculando a diferença padronizada de duas proporções para cada locus como: onde

p

ji

é a proporção estimada (estabilizado por adição de 0,5 no numerador) de ganhos NC (ou perdas) para o grupo

j Restaurant at lócus

i

e

n

j

é o tamanho da amostra no grupo

j

. Nós resumiu

d

i

2 sobre

i

entre os 256,554 loci para calcular a diferença padronizada total observado ao quadrado (

D

observado ) em todo o genoma. Permutando os dois grupos e realizando o procedimento acima para 10.000 vezes, obteve-se uma distribuição nula não paramétrico (

D

nulo

). Em seguida, os valores de p foram obtidos comparando

D

observado e

D

nulo

. A vantagem deste teste proposto é que ele fornece um teste global válido para a diferença global de todo o genoma pela contabilidade para comparações múltiplas e correlação dos CNAs entre loci diferentes.

Usando o teste global, descrito acima, foi testada a padrões CNAs do genoma entre sangue e tumores, pulmão não-envolvidos e tumores, estágio inicial e tumores fase tardia, adenocarcinoma estágio inicial e tumores carcinoma espinocelular (Figura 1). Para confirmar ainda mais os resultados, realizamos as seguintes análises correspondentes. Uma vez que o sangue e amostras de pulmão não-envolvidos foram pareados para subconjunto de amostras de tumor, podemos comparar a diferença de CNAs genoma escala restrita àqueles com amostras disponíveis no sangue e tumores ou de não-envolvidos e tumores. Para cada tumor fase tardia, que selecionou uma amostra de tumor fase inicial correspondente com maços-anos mais próximos fumadores. A distribuição de anos-maço sexo, histologia e fumantes não mostraram diferença significativa nos tumores estágio combinados precoce e tardia. As análises combinadas mostrou resultados semelhantes aos da Figura 1. (Figura S2)

O eixo x representa localizações genômicas, que foram encomendados pelos cromossomos somáticos. O eixo y representa a prevalência (%) de pacientes com NSCLC que têm número de cópias ≥2.7 (vermelho ou rosa) e ≤1.3 (azul ou azul claro) no tecido não-envolvidos pulmão e tumor total (A), tumor fase inicial e fase tardia tumor (B), tumor de fase inicial de adenocarcinoma (C) e do tumor fase precoce do carcinoma de células escamosas (SCC) (D). Os lotes correspondentes de

10 (q) valores -log foram mostrados na Fig. S1. Os valores de p de comparação de padrões de CNAs do genoma entre amostras de tecido não-envolvidos e tumores totais são 0,0001 para ganhos e 0,40 para as perdas pelo teste global baseada em permutação com detalhes descritos em Métodos. Os valores de p comparando fase precoce e tumores fase tardia são 0,0001 para ganhos e 0,046 para perdas; os valores de p comparando adenocarcinoma fase inicial (C) e carcinoma de células escamosas fase inicial (D) são 0,016 para ganhos e 0,027 para perdas.

Tanto as sondas totais (TP) e as sondas localizar dentro de genes (GP), no qual foram detectados ANC foram calculados para cada indivíduo. Comparação de TP e GP em diferentes subgrupos permite estudar o padrão de seleção de regiões genômicas onde CNAs ocorrem, sob a suposição de que as sondas no chip foram escolhidos aleatoriamente sem considerar o desequilíbrio de ligação. A relação de GP vs TP (denominado como razão G /T) foi calculada para estimar a selecção de ANC no que diz respeito à localização do gene. Sob a hipótese nula de que CNAs ocorrem aleatoriamente em relação a onde genes localizar, esperamos que a proporção nula de 104.256 /256.554 = 40,64%, em que 104.256 é o número de sondas localizadas em genes no chip. Ao comparar os rácios de g /t para o nulo relação de 40,64%, fomos capazes de testar se CNAs ocorreu preferencialmente longe de genes. Comparando G /T em diferentes subgrupos (por exemplo, vs linha germinal do tumor) permitiu-nos investigar a magnitude desta selecção preferencial entre os diferentes grupos. As comparações de proporções entre dois grupos TP, GP ou G /T foram realizadas por meio do teste do estudante frente e verso t não pareado assumindo variâncias desiguais.

análises conjunto de genes foram realizadas utilizando o algoritmo modificado Gene Set Análise de Enriquecimento (GSEA) . GSEA foi originalmente proposto para a expressão dos genes entre os grupos [4]. Uma vez que não tentar associar o CNAs com outras variáveis, mas simplesmente investigar o enriquecimento de CNAs em um único grupo, nós modificamos o algoritmo em relação à geração de distribuição nula da pontuação enriquecimento. Estamos interessados ​​em saber se CNAs em um conjunto de genes são significativamente mais elevados do que outros conjuntos de genes. Em vez de permutando o rótulo de grupo, nós permutado os rótulos gene para 20.000 vezes para criar a distribuição nula. A descoberta (n = 151) e conjuntos de validação (n = 150) colhidos aleatoriamente a partir dos 301 tumores foram semelhantes em muitas características clínicas e demográficas. (Tabela S1) análise primária foi realizada utilizando os dados de descoberta e validação foi realizada utilizando o conjunto de dados de validação. Apenas os conjuntos de genes que foram significativas (P 0,05) em ambos os conjuntos foram relatados. Os conjuntos de genes analisados ​​neste estudo foram retirados do banco de dados assinaturas moleculares (MSigDB) do /Instituto Broad do MIT Harvard, incluindo famílias de genes, conjuntos de genes com curadoria e Gene conjuntos de genes ontologia. Somente 1.619 conjuntos de genes com pelo menos 15 membros de genes em nossos dados foram analisados ​​para alcançar robustez.

Resultados

CNAs e desenvolvimento doença

Uma série de 301 amostras de tumor foram recolhidos a partir de doentes com NSCLC, as características do qual são mostrados na Tabela S1. O genoma de sangue ou tecido do pulmão não-envolvidos tinham substancialmente menos do que os eventos de ANC no genoma do tumor, especialmente em ganhos no número de cópias (perdas: p = 0,038 no sangue versus tumor, P = 0,40 em tecido não-tumoral versus envolvido; Rendimento: p 0,0001 em ambos) (Figura 1A). As taxas de falsos valores de descoberta (Q) do loci de 256.554 para o sangue, tecido não-envolvidos, tumores (no total, por estágio clínico ou por histologia) são mostrados na Figura S1. Havia CNAs substanciais nos cromossomos 3, 5 e 8, ilustrado nas figuras S3, S4 e S5. Porque sondas GeneChip Affymetrix® 250K NSP foram selecionados aleatoriamente em todo o genoma, é razoável supor que o número de sondas que detectam alterações no número de cópias é proporcional ao tempo de genômica de eventos CNAs. O número médio de sondas que detectam ganhos no número de cópias foi 718 em sangue e tecidos não-envolvidos, que foi muito mais baixa do que o 19469 no tumor (p 2,20 x 10

-16) (Figura 2A). O padrão foi também encontrada em perdas número de cópias (950 vs. 2586, p = 0,0029) (Figura 2B). Além disso, há mais ganhos no número de cópias do que perdas no número de cópias em tumores (p 2,20 × 10

-16), o que sugere que as perdas no número de cópias são mais deletério [11]

A, B. , contagens do total de sondas (TP) onde os eventos CNAs (a: número de cópias ganhos, B: perdas no número de cópias) ocorrem foram plotados de sangue e tecido não-envolvidos, tumor total, o tumor fase inicial, tumor fase tardia, adenocarcinoma estágio inicial (ACA) e carcinoma de células escamosas fase inicial (SCC). C, D, contagens das sondas dentro de genes (GP) em que os eventos CNAs (C: Número ganhos cópia, D: perdas no número de cópias) foram detectados nos mesmos seis subgrupos. E, F, médio e seu intervalo de confiança de 95% dos rácios g /t nos seis subgrupos para ganhos no número de cópias (E) e perdas (F); e as linhas tracejadas representam a relação L /T nulo sobre o chip (104256/256554 = 40,64%). Não tumor: sangue (n = 63) e o tecido não envolvido (n = 50); Todos tumor: total de 301 tumores NSCLC; tumor precoce: tumores fase I e II NSCLC (n = 246); tumorais tardio: fase III e IV NSCLC tumores (n = 25); ACA início: tumores estágio de adenocarcinoma precoce (n = 208); SCC início: estágio escamosas tumores de carcinoma de células iniciais (n = 93)

A prevalência de eventos CNAs entre pacientes com NSCLC foi associada com o estágio clínico, especialmente na amplificação.. A proporção de doentes com alterações no número de cópias do tumor em estádio tardio era mais do dobro do que na fase inicial. (Figura 1B) entre os dois grupos, foram realizados os ensaios globais para a diferença emparelhada de a proporção de ANC para cada locus em todo o genoma, e mostrou diferença altamente significativa em ganho ( 0,0001) e uma diferença marginalmente significativa nas perdas ( p = 0,046) após a contabilização de comparações múltiplas. De modo semelhante, o número médio de sondas que detectam número de cópias foi ganhos 14029 em fase precoce e em fase tardia 45792 (p = 4,94 x 10

-14) (Figura 2A). Para as perdas de número de cópias, que eram 2419 e 4395, respectivamente (p = 0,076) (Figura 2B). Excluindo aqueles com quimioterapia adjuvante ou radioterapia ainda preservada a tendência significativa e os números correspondentes (valor p) foram 8.501 e 41.608 (p = 5,43 × 10

-5) em ganhos e 2.099 e 5.947 (p = 0,017) . Adenocarcinoma e carcinoma de células escamosas subtipos mostram uma diferença significativa no teste emparelhado proporção (Figura 1C e 1D) (p = 0,016 em ganhos e p = 0,027 em perdas), mas não houve diferença no total de eventos CNAs (Figura 2A e 2B) (p = 0,44 em ganhos e p = 0,29 em perdas), indicando que as ANC padrões de todo o genoma dos dois tipos de células pode ser diferente, mesmo que o número de eventos no total são semelhantes.

CNA selecção da localização do gene e doença desenvolvimento

através do cálculo da razão G /T (ver Materiais e Métodos), investigou-se a selecção de ANC no que diz respeito aos locais de genes durante o desenvolvimento do cancro. Em tecidos de sangue ou não envolvidos, as proporções G /T foram mais baixos do que o nulo (40,64%) em ganhos (31,71%, p = 0,00098) e as perdas (30,38%, p = 0,0014) (Figura 2E e 2F), que indica que os acontecimentos ANC são mais prováveis ​​de acontecer genes fora da linha germinal como um resultado da selecção natural. No genoma do tumor, o efeito de seleção ainda existe, mesmo que tenha sido relaxado, até certo ponto. Isto é, as proporções G /T em tumores foram significativamente mais elevados do que aqueles na linha germinal (p = 3,28 x 10

-5 em ganhos, p = 0,015 em perdas), mas ainda assim eram significativamente mais baixa do que a proporção nula (39.16 %, P = 0,0068 em ganhos; 37,17%, p = 0,0052 em perdas). No entanto, um tal efeito de selecção não foi observada em tumores de fase tardia, ou seja, eventos ANC tem uma chance semelhante a ocorrer dentro e fora genes.

ANC em oncogenes e genes supressores tumorais

104256 ( 40,64%) de 256,554 sondas de cromossomos somáticos no chip foram mapeados para 11.700 genes com 2 extensão kb a montante ea jusante para incluir promotor e regiões flanqueadoras. Havia 32 oncogenes conhecidos em que 10% dos pacientes apresentaram número de cópias ganhos (Tabela 1) e 16 genes supressores de tumor em que 1% dos pacientes tiveram perdas no número de cópias (Tabela 2). Nós também identificou 45 genes (incluindo oncogenes e não-oncogenes) com 35% (p≤1.50 × 10

-42) com amplificações número de cópias (Tabela S2) e 9 genes (

CSMD1

,

SGCZ

,

PDZRN3

,

Nisch

,

CACNA2D3

,

UBE2E2

,

MCPH1

,

PHF7

e

DOCK5

) com 10% (p≤1.53 × 10

-21) com supressões no número de cópias

conjuntos de genes. enriquecida com genes CNAs

Uma vez que os genes com CNAs estavam sob seleção, a hipótese de que esses genes devem estar envolvidos em funções biológicas semelhantes, que favorecem posteriormente a aptidão das células durante tumorigênese e /ou proliferação de células cancerígenas. Portanto, nós investigado se os genes com CNAs foram enriquecidos em 1619 conjuntos de genes pré-definidos. Para evitar resultados falsos positivos ao testar 1619 conjuntos de genes, as análises foram feitas com um processo de descoberta e validação. No conjunto descoberta, os genes com o número de cópias amplificações foram significativamente enriquecida em 152 conjuntos de genes (p 0,05); 119 deles foram validados na validação fixado em nível de significância de 0,05. Para número de cópias eliminações, 109 conjuntos de genes foram encontrados no conjunto de descoberta (p 0,05) e 52 foram validados. Nós também investigou os 119 e 52 conjuntos de genes validados na fase inicial e tumores fase tardia e somente aqueles significativamente enriquecida em ambos os subgrupos são relatados (89 em ganhos e 27 em perdas; Tabelas S3 e S4) Nós apresentamos 26 conjuntos de genes, com especial relevância para a biologia do tumor que têm o enriquecimento de ganhos no número de cópias ou perdas em nossas amostras nas Tabelas 3 e 4 e as correspondentes conjunto de genes parcelas de enriquecimento nas Figuras S6 e S7. Além disso investigar o enriquecimento conjunto de genes no tecido pulmonar arterial e não envolvidos, encontramos muitos dos conjuntos de genes 89 e 27 validados também foram enriquecidos no genoma de tecido não-envolvidos pulmão, incluindo ganhos de proteína G via de sinalização,

EDG1

caminho, caminho de migração celular mediada por integrina e perdas em regulamentos de autofagia e ciclo celular mitótico. (Tabelas S3 e S4)

Discussão

O padrão CNAs de todo o genoma de nossas análises é similar aos publicados na literatura anteriores [2], [3], [12]. Muitos dos oncogenes com amplificações número de cópias aqui relatados também é consistente com estudos anteriores [13], [14], [15], [16]. A grande força deste estudo é o seu tamanho de amostra grande, disponibilidade de sangue emparelhado e amostras de tecido não-envolvidos e informações clínicas /demográficas detalhada, processo de descoberta-validação e as novas análises estatísticas. O teste global proposto para CNAs do genoma nos fornecer as oportunidades para testar CNAs diferença, tomando simultaneamente os locais genómicos, correlação do número de cópias e comparações múltiplas em conta. O GSEA personalizado para CNA, por outro lado, pode servir como um instrumento útil para analisar os números de cópias do genoma no contexto funcional e biológico, que liga os dados ANC sofisticadas para o conhecimento de categorias de genes, percursos biológicos e estudos anteriores. Existem ainda limitações em nosso estudo. Em primeiro lugar, o sangue e amostras de tecido não-envolvidos pode ser obtido a partir de apenas subconjunto dos 301 pacientes. Em segundo lugar, não somos capazes de coletar os dados CNAs de indivíduos normais ou pacientes sem cancro do pulmão, o que pode nos fornecer uma melhor visão sobre a forma como o perfil CNAs de todo o genoma em pacientes com NSCLC difere daquele em indivíduos normais ou pacientes não-cancerosas. Em terceiro lugar, apesar de o gene define análises podem servir para formular hipóteses biológicos, mais investigação para estudar os papéis de conjuntos de genes /vias com SNAC na tumorigénese é necessária.

Os materiais de DNA analisadas neste estudo provêm de todos NSCLC pacientes, de modo que o genoma de sangue e de tecido não-envolvidos não podem ser vistos como um genoma normal. Usamos DNAs de sangue, tecido de pulmão não-envolvidos, tumor em estágio inicial e tumor em estágio final para representar as etapas sequenciais de desenvolvimento e progressão do câncer. Descobrimos que alterações no número de cópias aumentar com o desenvolvimento do câncer, mas que a seleção no que diz respeito à localização gene diminui. Ou seja, há um aumento contínuo do número de cópias alterações a partir de sangue e de tecido do pulmão não-envolvidos, a fase inicial e, em seguida, para os tumores de fase tardia. (Figuras 2A e 2B), por outro lado, copiar alterações Número tendem a ocorrer

distância a partir da localização de genes no sangue ou tecido não-envolvidos, mas esta tendência diminui em tumores, especialmente na fase tardia. (Figuras 2E e 2F) O aumento de CNA reflecte a acumulação de número de cópias somática muda devido à instabilidade genómica, em que o stress hipóxico celular no cancro pode desempenhar um papel-chave através de perturbação da replicação do ADN e replicação de segmentos de DNA não contíguas [17 ], [18].

da mesma forma, esperamos ver a acumulação do número de conjuntos de genes atingidos por CNAs do sangue, tecido não-envolvidos e, em seguida, ao tumor, em vez de a ocorrência abrupta no tumor. Fora dos nossos 89 conjuntos de genes relatados de número ganhos de cópia, o número de conjuntos de genes significativos são 7 no sangue, 46 no tecido não-envolvidos, 89 em tumores. (Tabela S3) Dos 27 conjuntos de genes relatados de perdas no número de cópias, os números são 2 em sangue, 8 em tecido não-envolvidos, 27 em tumores. (Tabela S4)

Seleção de CNAs em relação à localização de genes durante a evolução também é relatada em

Drosophila

[11]. Aqui, mostramos um efeito semelhante selecção no genoma do tumor, embora seja relaxada, em certa medida. Nós supomos que a selecção de tumor ocorre durante o desenvolvimento precoce do cancro da na parte superior da sequência de selecção evolutiva como reflectido na linha germinativa. Estes resultados ilustram que a selecção de purificação que ocorre na linha germinativa, como o resultado da evolução de espécies podem também ocorrer no tumor como um efeito de selecção durante a oncogénese e a progressão do tumor. Nós também a hipótese de que os caminhos biológicos com CNAs que observamos nas Tabelas S3 e S4 são a consequência de tal seleção. Isto é, as alterações em larga escala pode atingir muitos genes diferentes e vias biológicas aleatoriamente, mas apenas as células que adquirem a vantagem de crescimento através de ANC (por exemplo, amplificado via de sinalização de oncogene ou gene supressor de tumor via suprimidas) irão sobreviver e tornar-se dominante. A constatação de que ANC tendem a ocorrer fora do gene também reflecte a não ocorrência de aleatoriedade CNA.

Os oncogenes podem imitar o crescimento normal de sinalização de modo a que a célula do cancro reduz a dependência de estimulação do crescimento exógeno. Assim, a amplificação de oncogenes é um passo essencial na tumorigénese. oncogenes no câncer de pulmão,

KRAS

,

MYC

,

EGFR

, e

ERBB

família são bem conhecidas [19], [20], [21], [22], e todos eles foram encontrados para ser altamente significativo no ganho de número de cópias. Além disso, genes com amplificações número de cópias foram também sobre-representados nos oncogenes como uma categoria definida pelo censo de genes de câncer humano [23]. Esta descoberta sugere que oncogênese também pode resultar de diferentes conjuntos de oncogenes, para além dos que estão acima bem conhecidos.

Genes com CNAs em NSCLC também são encontrados para ser altamente associada a genes envolvidos em outros tipos de câncer, incluindo fígado , da mama, rim e pâncreas. Descobrimos que os genes com ganhos de número de cópias em NSCLC são mais susceptíveis de serem os genes altamente expressos em hepatite carcinoma hepatocelular relacionados-C [24] (p = 0,00005) e de carcinoma de células renais [25], [26] (p = 0,020) . Genes com número de cópias amplificações também são enriquecidas significativamente nos genes dos pobres assinatura prognóstico do câncer de mama [27] (p 0,00005), o que pode explicar o pior prognóstico de cancro do pulmão do que o câncer de mama. Além disso, nossa análise mostrou os genes com ganhos no número de cópias no pulmão foram enriquecidos nos genes nos cromossomos 7 e 8, mostraram ter expressão copy-número-impulsionado em adenocarcinoma do pâncreas [28] (p = 0,0033 e 0,00005, respectivamente) , e aqueles com perdas no número de cópias foram enriquecidos nos genes com ANC no cromossoma 9, também associada com a expressão do gene em tumores do pâncreas (p 0,00005). Isto sugere que a dosagem de gene, por assim dizer, de genes com ANC em NSCLC pode também ser positivamente relacionada com o nível de expressão. Estes resultados também sugerem que as células cancerosas emergentes de diferentes origens tecido compartilhar máquinas semelhantes para oncogênese e invasão tumoral

A nossa análise conjunto de genes sugere que as células podem adquirir as capacidades comuns de tumor [7] através CNAs:. Ganhos de oncogenes (auto-suficiência em sinais de crescimento; evadir apoptose), os ganhos em

Calpain

via (insensibilidade aos sinais anti-crescimento; invasão de tecidos e metástases, angiogênese sustentada), os ganhos em

EDG1

via ( evadir a apoptose e auto-suficiência em sinais de crescimento), os ganhos em

ERBB

sinalização (auto-suficiência em sinais de crescimento), os ganhos em

WNT

sinalização (auto-suficiência em sinais de crescimento), as perdas na regulação da autofagia (evasão de apoptose), ganhos de telomerase transcriptase reversa (

TERT

) (ilimitado potencial replicativo) e perdas na junção apertado e adesões celulares (invasão de tecidos e metástases). Tais resultados apresentem provas da “teoria câncer cromossômica” [5], [6]: o câncer é uma doença causada por aneuploidia ou grande escala alterações do cromossomo. É por causa a duplicação em larga escala ou deleção é mais provável que altere o número de cópias de um grande número de genes em vários processos biológicos. No entanto, os nossos resultados não discordo com a noção de que a duplicação /supressão de um gene desempenha um papel crítico no desenvolvimento do câncer. A ocorrência de alterações ou aneuploidia em grande escala requer um ambiente com a instabilidade do genoma, que é susceptível de ser facilitada por duplicação /deleção ou mutação de genes críticos na reparação do ADN, a recombinação e a duplicação.

Deixe uma resposta