PLOS ONE: Impacto de Gene Dosagem na expressão do gene, processos biológicos e sobrevida no câncer do colo do útero: um genoma-Wide Follow-Up Study

Abstract

Nós investigamos o papel do número de cópias do tumor (CN) -Alterados genoma (CN-AG) na carcinogênese do câncer cervical (CC), especialmente seu efeito sobre a expressão gênica, processos biológicos, e sobrevida do paciente. Cinquenta e nove papilomavírus 16 (HPV16) CCs -positivas humanos foram investigados com microarrays-31 para o mapeamento CN-AG e 55 para a expressão gênica global, com 27 CCs em comum. sobrevida de cinco anos foi investigada em 55 pacientes. Eliminações e amplificações 2,5 Mb foram definidas como alterações NC. O% CN-AG variaram de 0 a 32,2% (média = 8,1 ± 8,9). Os tumores foram classificados como de baixo (média = 0,5 ± 0,6, n = 11), médio (média = 5,4 ± 2,4, n = 10) ou alta (média = 19,2 ± 6,6, n = 10) CN. A maior% CN-AG foi encontrado no 3T, o que contribuiu uma média de 55% de todas as alterações NC. Genome-wide, apenas 5,3% dos genes CN-alterados foram desregulados diretamente pela dosagem do gene. Em contraste, a taxa em 3q totalmente duplicada foi duas vezes mais alta. A amplificação do 3T explicou 23,2% dos genes desregulados em tumores inteiros (r

2 = 0,232, p = 0,006; análise de variância), incluindo genes localizados no 3T e outros cromossomos. Um total de 862 genes foram desregulados exclusivamente em alto-CN tumores, mas apenas 22,9% foram CN alterada. Isto sugere que os genes restantes não são desregulados diretamente pela dosagem do gene, mas por mecanismos induzida

em trans

por genes CN-alteradas. Anaphase de promoção complexo /ciclossoma (APC /C) proteólise proteassoma dependente, glicólise, e apoptose foram regulada, enquanto que a adesão celular e angiogênese foram reprimidos exclusivamente em tumores de alto NC. O elevado% CN-AG e regulada perfil de expressão gênica de proteólise proteassoma APC /C-dependentes foram associados à sobrevida do paciente pobres (p 0,05, teste de log-rank). Juntamente com a glicólise, eles foram linearmente relacionado com o estádio Figo (P 0,38, P 0,01, teste de Spearman). Por conseguinte, a inibição da APC /proteólise dependente de proteassoma-C e a glicólise pode ser útil para o tratamento de CC. No entanto, se eles são indispensáveis ​​para o crescimento do tumor continua a ser demonstrada

Citation:. Medina-Martinez I, Barrón V, Roman-Bassaure E, Juárez-Torres E, Guardado-Estrada M, Espinosa AM, et al . (2014) Impacto da Gene Dosagem na expressão do gene, processos biológicos e sobrevida no câncer do colo do útero: um genoma-Wide Follow-Up Study. PLoS ONE 9 (5): e97842. doi: 10.1371 /journal.pone.0097842

editor: Robert D. Burk, Albert Einstein College of Medicine, Estados Unidos da América

Recebido: 06 de dezembro de 2013; Aceito: 25 de abril de 2014; Publicado em: 30 de maio de 2014

Direitos de autor: © 2014 Medina-Martínez et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pelo Conselho Nacional de Ciência e Tecnologia (CONACYT, www.conacyt.mx), conceder números 8135 /A1, 24341 (JB), 80680 (a SK) e 133.273 (a FF) e da Universidade Nacional do México ( www.unam.mx), conceda número SDI.PTID.05.2 (a JB). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer cervical (CC) é o segundo tipo de câncer mais comum em mulheres em todo o mundo, afetando 500.000 pessoas por ano; é a principal causa de morte por câncer entre as mulheres nos países em desenvolvimento [1]. As oncoproteínas virais E6 e E7 do vírus do papiloma humano de alto risco (HPV) desempenham um papel importante na carcinogénese. Eles inibem vários alvos celulares, incluindo proteínas p53 tumor-supressores e pRb, interromper processos celulares importantes, tais como apoptose e ciclo celular controle e levar a instabilidade genômica e desenvolvimento neoplásico [2]. Apesar dos danos causados ​​por estas proteínas oncoviral, CC é uma complicação rara da infecção viral; a maioria das infecções são transitórias e não evoluir para lesões neoplásicas. Em média, 12-15 anos podem passar antes de uma infecção por HPV persistente leva a CC através dos estágios pré-malignas de lesões neoplásicas intra-epitelial cervical [3]. Estas descobertas sugerem que a infecção por HPV sozinho não provoca a doença e que outros factores, tais como genes hospedeiras anormais, estão associados com o desenvolvimento de cancro invasivo.

desequilíbrios genómico podem contribuir para a expressão desregulada de oncogenes e supressor tumoral genes em células de cancro, e a acumulação de tais genes alterados tem sido correlacionada com a progressão do tumor [4]. Vários número de cópia (CN) regiões -Alterados (CNAs) foram identificados em CC através de análise do genoma do tumor usando métodos tais como hibridação genômica comparativa, hibridação in situ fluorescente, e microarrays (MAs). Os ganhos de 3T [5] – [11] e 5p [5], [12] – [15] são as alterações cromossómicas mais frequentes na CAC, e eles também têm sido descritos em outros tumores sólidos [16] – [18]. A região de menor consenso da amplificação 3T em mapas CC para cromossômicas cytobands 3q26-27 [6] – [10], [19], sugerindo que genes tais como

TERC

[20], [21],

PIK3CA

[22], e

ECT2

[23], que são considerados candidatos oncogenes para CC, podem estar envolvidos na carcinogênese cervical. A medida em que estas alterações cromossômicas recorrentes são relevantes para o desenvolvimento do tumor ainda é em grande parte desconhecido. Por outro lado, a amplificação total de 5p está bem documentada em amostras de tumores e linhas celulares [12], [23] – [25]. Alguns genes amplificados nesta região e propôs a ser envolvido em CC, como

Skp2

,

TERT

,

TRIO

,

RNASEN

, e

PRKAA1

, são sobre-expressos em amostras de tumor [15] e linhas celulares [12], [24].

a contribuição das alterações NC à carcinogênese cervical não está resolvida devido à falta de todo o genoma de correlação entre CNAs e expressão gênica [23], mesmo nos braços cromossômicos completamente amplificados como 3T ou 5p [23] – [24], [26] – [27]. Em um estudo anterior, investigamos se CNAs nas linhas de células Calo, CaSki, HeLa e SiHa estão associados a mudanças na expressão genética [23]. Genome-wide, apenas uma pequena percentagem de genes localizados no CNAs (15,6%) ou regiões recorrentes mínimos (18,8%) foram desregulados. No entanto, estas proporções foram, no máximo, 4% maior do que no grupo de genes sem alterações NC (14,8%). Estes dados sugerem que apenas cerca de 4% dos genes alterados NC-global são desregulados por dosagem directa de genes em linhas de células derivadas de CC. Mesmo em segmentos genômicos confirmado para ser totalmente amplificada, como 3T e 5p, a percentagem de genes desregulados nem sempre foi aumentado. No caso de 5p, a percentagem de genes desregulados aumentada até 33% nas linhas celulares 4. Embora 3q foi quase inteiramente amplificado em Calo (93,5%) e HeLa (87,2%), a proporção de genes desregulados aumentou apenas aproximadamente 2 vezes em HeLa (23,4%), mas não em Calo (12,7%) em comparação com o que em CaSki ( 13,9%) e SiHa (9,4%), que apresentou apenas amplificação parcial de 3T [23]. Curiosamente, nem todos os genes desregulados de duplicada 5p e 3T foram overexpressed. Em vez disso, cerca de 20% dos genes desregulada em 5p e mais de 50% dos genes desregulados na 3T foram regulados negativamente. Portanto, para além de dosagem gene fatores, tais como mecanismos epigenéticos, podem influenciar a expressão de genes dentro de segmentos do genoma inteiramente amplificados. Não existem estudos que exploraram a correlação global entre a alterações e expressão gênica CN em CC.

Neste estudo, nós exploramos 59 CCs HPV16 positiva com microarrays-31 para o mapeamento CN-AG e 55 para gênica global expressão, com 27 CCs em comum. Foram investigados em todo o genoma, a nível do gene-por-gene, a proporção de genes alterados que NC-estão desregulados e a extensão do transcriptoma alteração total na CC que é desregulada directa ou indirectamente por meio de dosagem de gene. Nós também investigou os processos biológicos em carcinogênese cervical que estão relacionados com genes desregulados pela dosagem do gene e da influência da dosagem de gene na sobrevida global paciente

Resultados

análise do genoma

Tumor geral:. Identificação de cromossomos , regiões e genes alterados em CN

Um total de 673 CNAs maior do que 2,5 Mb foram identificados com base na análise com o GeneChip Humano Mapeamento 500 K (500 K) microarray: 446 amplificações e 227 exclusões. Estas regiões foram validados com um segundo microarranjo de alta densidade (CytoScan HD2.7) em 15 dos 31 tumores examinados com o microarray 500 K. A coincidência média entre os 2 matrizes foi de 79,3%, mas aumentou linearmente a partir de 70% no CNA de 2,5-3 Mb a 93,4% em CNA maior do que 10 MB (r = 0,93, p 0,001, correlação de Spearman; Figura S1) . Na verdade, quando os braços cromossómicos completas foram comparados, a correlação entre os 2 microarrays foi próximo de 100% (Figura 1). Em média, os tumores tinham 22 ± 19 CNAs (intervalo 0-65). A partir do tamanho do genoma haplóide (3.000 Mb), calculou-se a percentagem de genoma NC-alterada (NC-AG) para cada tumor. As percentagens variaram amplamente entre os tumores de 0% a 32,2% (média = 8,1 ± 8,9%) e seguido de uma distribuição não-paramétrico (Figura 2A, Tabela 1). Os tumores foram divididos em 3 grupos de acordo com a% de CN-AG: baixo (média = 0,5 ± 0,6, n = 11), média (média = 5,4 ± 2,4, n = 10) e alta (média = 19,2 ± 6,6, n = 10; Figura 2B, caixas cinzentas). Apenas cinco braços cromossómicos tinha uma% média CN-AG mais elevada do que a média de genoma e atingiram significância estatística (p 0,05, qui-quadrado; marcados com um asterisco na Figura 3A). Quatro desses braços mostrou principalmente ganhou genoma (3T, 5p, Xp, Xq), e apenas 3p mostrou um genoma principalmente eliminado. A percentagem mais elevada foi encontrada em 3q (44,3%), seguido bem abaixo por Xq (26,8%), XP (22,4%), e 5p (21,2%; ver Figura 3A). Somente CN-alterações nos cromossomos 3T, XP e 5p mostrou uma correlação linear com as alterações globais no genoma (r = 0,88, p 0,0001, análise de variância). Estes 3 cromossomos pode explicar 76% da variação na CN (R2 ajustado = 0,76), com classificação 3T no topo e respondendo por 55% de todas as alterações NC no genoma do tumor [regressão linear múltipla (MLR)].

sinais de intensidade de polimorfismos de nucleotídeo único (SNPs) ou sondas não-polimórficas são expressos como log

2 rácios de cromossomos 3, 4 e 5 do tumor R496 explorado usando 500 K microarray (painel superior) a e HD 2.7 microarray (painel inferior). Em ambos os painéis, o eixo y representa um log

2 escala de proporção de -1,5 a 1,5, e o eixo dos x mostra o ideograma dos cromossomas exploradas com posições do genoma. A linha horizontal cruzando o ponto y = 0 corresponde a 2 cópias. A densidade média de posições explorados é mais do que 5 vezes maior no microarray HD 2.7 do que no microarray 500 K (ver materiais e métodos).

O painel A mostra gráficos de caixas com a distribuição de tumores (n = 31) de acordo com a porcentagem do total, excluídos ou amplificada genoma CN-alteradas (CN-AG). O painel B mostra a distribuição de tumores, agrupados como baixa (n = 11), média (n = 10) e alta (n = 10) de acordo com a percentagem global e de 3T-CN AG. As linhas horizontais dentro das caixas representam a mediana (sólido) e médio (pontilhado), e os bigodes representam os valores mínimos e máximos dentro do intervalo de 1,56 interquartil a partir da extremidade da caixa. Os valores fora desta faixa são representados por círculos pretos. O declínio na frequência acumulada de genes CN-alteradas recorrentes, como aumentar o número de tumores que partilhavam o mesmo gene alterado, é mostrado para todo o genoma (Painel C) ou para cromossomas com significativa alta% CN-AG (Painel D) . genes combinados são aqueles que foram excluídos em alguns e amplificado em outros tumores.

O lado esquerdo mostra o genoma explorado (Mb) em cada braço cromossomo que foi explorado com o microarray 500 K em 31 tumores. O lado direito mostra o número de genes em cada braço exploradas com o gene humano 1.0 ST microarray em 27 dos tumores nos quais CN foi examinada. Cada barra representa a percentagem de NC-AG (esquerda) ou genes desregulados (direita) do braço cromossómico indicado no meio. As barras vermelhas indicam ganhos ou sobre-expressão e barras azuis representam perdas ou subexpressão. A linha a tracejado representa a percentagem média do global NC-AG (8,1%; esquerda) ou a percentagem de genes desregulados (9,5%; direita) no genoma do tumor. Os braços marcados com asteriscos tinha uma proporção média de CN-AG ou a percentagem de genes desregulados superior e estatisticamente significativa em comparação com os números encontrados no genoma completa do tumor (p 0,05, qui-quadrado)

para identificar genes com alterações NC, que alinhada ANC com genes humanos de acordo com a posição no genoma. O número de genes alterados variou de 0 a 10,666 (média = 2.754 genes; ver Tabela 1) entre os tumores e correlacionados positivamente com% CN-AG (r = 0,99, p 0,0001, a correlação de Pearson). A maioria dos genes CN-alterados não foram partilhados entre os tumores. A frequência acumulada de genes alterados NC-recorrentes drasticamente reduzida quando o número de tumores que partilham o mesmo gene alterado aumentada (Figura 2C). Na verdade, nenhum gene foi alterada em todos os 31 tumores exploradas, e apenas 3 genes (

RPL21P39

,

NLGN1

,

GM2AP1

) foram alteradas em 20 tumores. Os genes foram 3q o -up mais recorrente de 10 tumores indicadas alteração de quase 100% do genes- explorada, e a curva 3T foi deslocado para a direita 6 tumores a partir da curva mais próxima dos outros cromossomas (ver Figura 2D). Um total de 264 genes tiveram alterações recorrentes, tudo a partir de 3T, em 16 (51,6%) ou mais tumores.

Foram selecionados 7 dos genes mais recorrentes localizadas no 3T (

CLDN1

,

ECT2

,

NAALADL2

,

NLGN1

,

PLOD2

,

PLSCR1

, e

PLSCR4

) para ser validado com uma técnica em tempo real da reacção em cadeia da polimerase quantitativa (qPCR) em todos os 31 tumores e 17 controlos. Todos os genes apresentaram uma correlação positiva significativa (P 0,6, p 0,0001, correlação de Pearson) entre a intensidade média (razão log2) de SNPs identificados com o micro-arranjo no CNA, em que os genes estavam localizados em cada tumor, e o número de cópias calculado com qPCR (dados não mostrados). Quando o número de cópias calculado com qPCR foi comparado entre os grupos, o NC média dos 7 genes analisados ​​foi significativamente maior nos tumores que apresentavam alterações do que naqueles sem alterações nestes genes 3q (p 0,05, teste t; Figura 4A) .

o painel superior mostra o número de cópias média de 7 genes (

CLDN1

,

ECT2

,

NAALADL2

,

NLGN1

,

PLOD2

,

PLSCR1

, e

PLSCR4

) localizado no 3T exploradas com qPCR nos controles (linfócitos) e tumores com 2 ou 3-4 cópias identificadas com o 500 K microarray. Bigodes de cada barra representam o erro padrão da média. A linha vermelha pontilhada mostra o valor para 2,5 cópias calculado com qPCR (ver materiais e métodos). O painel inferior mostra a correlação da expressão do gene de 8 genes (

MCM2

,

PLOD2

,

PLSCR1

,

SMC4

,

ECT2

,

NLGN1

,

RFC4

, e

CLDN1

) localizado no 3T explorado em 27 tumores e 6 controles tanto com o HG 1,0 ST microarray e técnicas de qRT-PCR . Log

2 valores dos sinais de intensidade normalizados obtidos com o micro-arranjo (valores médios robusta de múltiplos chips) e qRT-PCR foram representados graficamente. linha de tendência (linha preta), o coeficiente de correlação (r) e valor de p foram calculados com teste de correlação de Pearson.

Análise do Gene Expression global

A quantidade de RNA mensageiro (mRNA ) transcrito de 21,034 genes foi explorada usando o microarray HG 1.0ST em 27 dos 31 tumores examinados com o microarray 500 K e em 17 controles normais do colo do útero do epitélio (Figura 5, Tabela 1 e Tabela 2). Foram identificados 2.006 genes alterados (9,5%), 57,6% reprimidos e 42,4% regulada (Tabela S1). Quando os 2 adenocarcinomas (ACC; R075 e R189 na Tabela 1) e do carcinoma adeno (ASCC; R298 na Tabela 1) foram excluídos da análise, encontramos um número similar de genes e a concordância de 95% com a lista de alterações genes. Portanto, para manter o tamanho da amostra que incluem todos os 27 CCs.

Figura mostra o fluxo de trabalho de análise dos 59 casos CC explorados neste estudo. Todas as amostras CC foram HPV16 positivo e foram investigados com microarrays-31 para o mapeamento CN-AG e 55 para a expressão gênica global, com 27 CCs em comum. Estes 27 CCs foram utilizados para as análises de expressão gênica global e a correlação entre a CN-AG e expressão gênica. Para a análise de agrupamento hierárquico, foram incluídos os perfis das amostras 55 CC expressão. sobrevida de cinco anos foi investigada em 55 pacientes, 51 exploradas para a expressão do gene e 28 para alterações NC, com 24 CCs em comum. Consulte a secção de materiais e métodos para obter detalhes sobre os procedimentos.

A frequência de genes desregulados foi calculada pela cromossomo. Dos 42 braços exploradas, apenas 5 (3T, 4T, 6p, 15q, e Xq) mostrou uma percentagem mais elevada e estatisticamente significativa de genes desregulados em comparação com a percentagem global (9,5%; marcados com um asterisco na Figura 3B). Os cromossomas que apresentaram maior percentagem foram 6p (16,0%, p 0,001) e 3q (15,9%, p 0,001), seguido de 4q (15,6%, p 0,001), Xq (13,0%, p 0,02), e 15q (12,9%, p 0,04); teste do qui-quadrado para todas as comparações. genes regulados positivamente predominou no 3T e 6p, enquanto genes reprimidos foram mais prevalentes no 4T, 15q, e Xq (veja a Figura 3B).

Nós avaliamos a expressão de 28 genes selecionados para a validação com uma técnica de qRT-PCR em 27 amostras CC e 6 controles (Tabela S2). Encontramos uma correlação positiva significativa (média r = 0,74, p 0,05; correlação de Pearson) entre os valores logarítmicas (log2) dos dados obtidos com qRT-PCR e microarray em 27 dos 28 genes exploradas (96,4%). A Figura 4B mostra a correlação dos valores de intensidade (log2) obtidos com os métodos de 2 para 8 genes localizados no 3T. Estes dados indicaram que os valores de expressão calculados com o microarray foram bastante confiável, pois até 96,4% de genes validados tinha uma correlação significativa.

Para identificar os processos biológicos associados aos 2.006 genes diferencialmente expressos, foi utilizado o banco de dados para anotação, visualização e ferramenta integrada Discovery (DAVID; http://david.abcc.ncifcrf.gov/). Comparado com o banco de dados do genoma humano, os 5 clusters mais enriquecida com os menores valores de p em rigor médio eram ciclo celular incluindo a mitose, os processos metabólicos de DNA incluindo o reparo do DNA, a segregação cromossômica, organização do citoesqueleto, e processos de desenvolvimento (Tabela 3). Curiosamente, ao mais alto rigor, onde se espera que os genes mais fortemente associados em cada grupo, os clusters, incluindo mitose foram em primeiro, terceiro e quinto (processos biológicos em itálico na Tabela 3).

A grupo total de genes desregulados também foi analisada com engenho Pathway Analysis software (IPA), e todos os resultados foram muito semelhantes aos obtidos com a ferramenta DAVID (dados não mostrados). Dos 89 vias canônicas que o IPA identificados como alterados (p 0,05, teste exato de Fisher), os envolvidos no ciclo celular e reparo de DNA classificado no topo da lista (Figura 6A)

mostra o painel A. os 25 melhores caminhos canônicos identificados no conjunto de 2.006 genes desregulados em todo o conjunto de tumores. O painel B mostra os 25 principais vias canônicas identificados no conjunto de 862 genes desregulados exclusivamente em tumores de alto NC. As vias canônicas foram identificados com o software Ingenuity Pathway Analysis. O -log (valor de p) e a relação foi calculada comparando o número de genes que pertencem à via presentes nos conjuntos de dados com o banco de dados do genoma humano. O valor de p foi calculada utilizando o qui-quadrado ou teste exato de Fisher, conforme apropriado, e os valores de -log (valor p) superior a 1,3 (linha vermelha) correspondem a um valor de p 0,05. A via canônica de sinalização de hipóxia fator inducible (HIF1α) foi estatisticamente significativa nos genes desregulados no conjunto todo (43º lugar) e no conjunto de alto-CN de tumores (26º lugar).

Correlação entre as mudanças no CN e expressão gênica

Uma simples análise da figura 3 sugere que não existe uma clara correlação entre a expressão do gene e CNAs. Por exemplo, os cromossomas 5 com a maior percentagem de NC-AG, apenas 2 (3q, Xq) mostraram um aumento significativo na percentagem de genes desregulados. Além disso, os outros 3 cromossomos que mostram um aumento significativo de genes desregulados (4T, 6p, 15q) não tinha uma elevada percentagem de CN-AG, mesmo 6p e 15q teve um percentual bem abaixo da média global. Embora os genes sobre-expressos predominam na maior parte dos cromossomas com uma elevada percentagem de ganhos, estes cromossomas também têm uma proporção elevada de genes regulados negativamente, e em alguns, tais como Xq, predomina a proporção de genes regulados negativamente (Figura 3). Por outro lado, os cromossomas que exibiu predominantemente deleções (3p, 4p) também teve uma percentagem de genes regulados positivamente, embora a percentagem de genes regulados negativamente predominado.

Para compreender mais completamente a relação entre a alteração CN e a expressão do gene, analisamos essas variáveis ​​gene pelo gene em cada tumor. O status de expressão (regulados negativamente, regulada positivamente, ou sem mudança) para cada gene explorado (n = 21034) foi identificado em cada tumor usando valores de corte (ver materiais e métodos). O estado CN de cada um destes genes também foi identificado em cada tumor. O número de genes com e sem alterações em CN e a expressão do gene é mostrado para cada tumor na Tabela 1. O número médio de genes alterados foi NC-1673, e o número médio de 2 genes de cópia foi 19362 (ver Tabela 1). Em média, 2.010 (9,6%) genes foram desregulados em tumores, dos quais 241 foram CN alteradas e 1.769 tiveram 2 cópias. Estes dados significam que, em média, apenas 14,4% (241 /1.673) dos genes CN-alteradas e 9,1% (1.769 /19.362) de 2 genes de cópia foram desregulados. A diferença entre os 2 subgrupos foi de apenas 5,3% (p 0,00001, qui-quadrado) e corresponde à fracção média de genes com alterações NC que pode ser directamente desregulados por dosagem de gene. Nomeadamente, apenas 69% dos genes amplificados e foram sobre-expressos desregulados; o resto foram reprimidos. Além disso, apenas 82% dos genes eliminados e foram reprimidos desregulados; os restantes foram sobre-expressos (dados não mostrados). Estes resultados estão de acordo com as observações no nível do cromossomo.

Para investigar se existe uma tendência linear entre a expressão do gene e da quantidade de alteração CN (CN-AG), foi analisada a correlação entre as 2 variáveis, incluindo o indivíduo dados para todos os tumores estudados. Como esperado, o número total de genes desregulados aumentou com NC-AG% (calculado a partir da Tabela 1, r = 0,5, p = 0,007, correlação de Pearson; Figura 7). De acordo com a equação de na Figura 7 (Y = 32x + 1,734), em um tumor, com 0% de CN-AG (X = 0), o número de genes desregulados é de aproximadamente 1734 e seria desregulada por outros de dosagem de gene mecanismos. Em contraste, o tumor com a maior% de CN-AG (R365 = 32,2%, ver Tabela 1) terá um período adicional de 1.034 genes desregulados (total = 2768). Este número é muito estreita para o número observado de genes desregulados (ver Tabela 1) e incluiu a fracção de genes desregulados que podem ser directamente desregulados por dosagem de gene. Neste caso extremo, o número corresponde a 37,4% de todos os genes desregulados (1034 /2,768). Em todo o conjunto de tumores, apenas 12% (241/2010) dos genes desregulados em média foram alteradas NC (calculado a partir da Tabela 1). Somente CN-alterações no 3T mostrou uma regressão linear clara com expressão mundial gene (r = 0,51, p = 0,006, análise de variância), e explicou 23,2% (r ajustada

2 = 0,232, MLR) de todas as mudanças na a expressão do gene.

a tendência do número de genes desregulados com aumento% CN-AG em todo o conjunto de 21,034 genes exploradas são mostrados. A linha representa a tendência de correlação linear para o conjunto de dados. Também são mostrados a equação da linha, o coeficiente de correlação, eo valor p calculado pelo teste de correlação de Pearson.

Identificação de genes desregulados e os processos biológicos associados a alterações no gene Dosagem

a) genes liberalizadas em tumores-CN baixa e alta.

Para identificar os genes diferencialmente expressos em tumores com percentagens baixas e altas de alterações NC (ver Figura 2B, caixas cinzentas), comparamos cada grupo de tumores com o grupo de controlo (n = 17), utilizando o método de SAM. Dos 21,034 genes exploradas, 1.757 (8,4%) foram desregulados em tumores com alta CN, mas apenas 1104 genes (5,2%) foram desregulados em tumores com baixa CN. Curiosamente, 895 (81,1%) dos genes desregulados no grupo de baixo-CN também foram desregulados no grupo de alto CN. A diferença no número de genes desregulados entre o grupo de alto-NC e os genes comuns (n ​​= 862) correspondeu à fracção de genes desregulados por dosagem do gene no grupo de alto-CN (49,1%).

notavelmente, apenas 9,2% dos genes desregulados exclusivamente nos tumores de alto-CN (79 de 862) foram amplificadas (n = 76) ou suprimidas (n = 3) em 6 ou mais tumores. Os restantes genes foram alterados CN em 4-5 (n = 118), 1-3 (n = 370), ou nenhum (n = 295) tumores (Tabela S3). Com base nestes cálculos, que conservadoramente assumido que, neste grupo de genes exclusivamente associada a tumores de alta CN (n = 862), a dosagem de gene tem uma influência directa sobre a expressão de genes em, no máximo, 22,9% destes genes (CN alterada em ≥4 tumores). Os genes restantes (CN alterada em ≤ 3 tumores, n = 665) não seria desregulamentado diretamente pela dosagem do gene, mas por outros mecanismos, talvez influenciado

em trans

por alguns genes CN-alteradas.

b) Identificação de processos biológicos associados com tumores com alto e baixo CN.

a ferramenta DAVID foi usada para identificar os processos biológicos enriquecidas no subconjunto de genes comuns (n ​​= 895) e aqueles desregulada exclusivamente em alta CN (n = 862) e baixa-CN (n = 209) tumores. Os aglomerados de processos biológicos encontrados no conjunto de genes comuns foram muito semelhantes aos enriquecido em todo o conjunto de tumores (Tabela 3 vs. Tabela S4). No entanto, alguns processos biológicos importantes enriquecidas em todo o conjunto de tumores, tais como angiogénese, a regulação da adesão celular, e do complexo de promoção da anafase /ciclossoma (APC /C) processo catabólico proteína dependente de ubiquitina proteossoma dependente (ver Tabela 3) não foram enriquecidas no subconjunto de genes partilhada por ambos os grupos. Curiosamente, estes 3 processos foram enriquecidos em alto-CN tumores; Além disso, eles ficou em primeiro lugar entre os processos biológicos (Tabela 4). Outros grupos enriquecido exclusivamente no grupo de alto-CN, mas não identificado no subconjunto de genes comuns incluíram a glicólise, que ficou em segundo lugar, apoptose e transporte mRNA (ver Tabela 4). Estes dados sugerem que estes processos estão intimamente ligados à dosagem do gene. Os processos de organização do citoesqueleto, do ciclo celular, e a embalagem do ADN, embora não exclusiva, também foram enriquecidas no grupo de genes associados a tumores de alto NC, sugerindo que alguns genes envolvidos nestes processos pode ser desregulada por dosagem de gene. Todos estes processos biológicos, excepto a adesão celular e na angiogénese, foram associados com genes sobre-expressos. Interessantemente, ao mais alto rigor, os processos de APC processo de proteína /C-dependente proteossoma dependente de ubiquitina catabólico em primeiro lugar, seguido pela glicólise e embalagem de ADN (processos biológicos em itálico no Quadro 4). Notoriamente, a maioria dos genes envolvidos nos processos biológicos associados com tumores de alto NC NC não foram alteradas (Figura 8). Por outro lado, apenas dois aglomerados foram enriquecidas no subconjunto de genes exclusivamente desreguladas em tumores de baixo-CN: a diferenciação de células e o processamento e apresentação de antigénio peptídico através de classe principal complexo de histocompatibilidade I (dados não mostrados). Isto sugere que a maioria dos genes envolvidos nestes processos estão desregulados 2 através de outros mecanismos de dosagem de gene.

são mostrados os números de 2-cópia ou genes alterados em CN-≤3 tumores (barras verdes) e NC genes -Alterados em ≥4 tumores (barras azuis) entre os processos biológicos enriquecido no subgrupo de genes desregulados exclusivamente em tumores de alto NC.

Para investigar se os perfis da expressão do gene processos biológicos associados com tumores de alto NC permitir que a segregação de tumores quer por CN ou por processos biológicos si, realizamos um agrupamento hierárquico sem supervisão para classificar 55 tumores exploradas com o HG 1,0 ST microarray (Tabela 2), incluindo os 27 tumores exploradas para análise CN, e 17 controlos saudáveis ​​cervicais. Apenas os perfis de glicólise e processo catabólico proteína proteossoma dependente de APC-expressão segregados claramente os tumores em grupos com perfis de expressão específicas (Figura 9). Na análise da glicólise, o dendrograma mostrou 3 ramos principais: 1 com um perfil regulada positivamente mais forte, com uma combinação de fraca para cima e sinais regulados negativamente, e uma terceira com um perfil de regulação negativa forte. Estes resultados mostram a heterogeneidade no gene assinatura deste processo biológico em todo o conjunto de amostras. A maioria dos tumores (81,8%) em cluster uniformemente nos 2 primeiros ramos, e uma minoria agrupados no terceiro ramo (18,2%). Por outro lado, todos mas 3 controles foram agrupados no terceiro ramo. Notavelmente, os tumores de alta NC foram agrupados na fortemente (60%) e combinadas (40%) perfis regulados positivamente, enquanto que os tumores de baixo NC agrupados principalmente na regulados negativamente (50%) e combinadas (30%) perfis (P = 0,028 , teste exato de Fisher; Figura 9A)

análise de agrupamento hierárquico não supervisionado de 55 CCs e 17 amostras de epitélio cervical saudáveis, utilizando os valores dos genes desregulados da glicólise (painel a expressão) e do complexo /ciclossoma de promoção anaphase. (APC /C) processo catabólico dependente de proteína proteossómica (painel B) obtida com a HG 1,0 ST microarray. Cada linha representa um gene e cada coluna representa uma amostra. Amostras nome que começa com um “R” são CCs e com um “C” são controles; CCs que terminam em 1, 2 ou 3 pertencem ao baixo teor, grupos-NC altos de média ou, respectivamente, ao passo que aqueles que terminam sem número não foram exploradas por CN. O comprimento e a subdivisão dos ramos representam as relações entre as amostras com base na intensidade da expressão do gene. uma. b. uma. b. uma.

Deixe uma resposta