PLOS ONE: Análise Integrada do número de cópias de variação e Genome-Wide perfil de expressão no cancro colorectal Tissues

Abstract

Integrative análises de vários conjuntos de dados genômicos para amostras selecionadas podem proporcionar uma melhor visão sobre os dados globais e pode melhorar a nossa conhecimento de cancro. O objetivo deste estudo foi elucidar a associação entre a variação do número de cópia (CNV) e expressão gênica em câncer colorretal amostras (CRC) e os seus tecidos não cancerosos correspondentes. Sessenta e quatro amostras de CRC emparelhados dos mesmos pacientes foram submetidos a CNV perfis utilizando o ensaio Illumina HumanOmni1-Quad, e validação foi realizada utilizando método de amplificação da sonda de ligação multiplex. perfil de expressão de todo o genoma foi realizada em 15 amostras emparelhadas do mesmo grupo de pacientes que utilizam a matriz ST Affymetrix Human Gene 1.0. genes significativos obtidos a partir de ambos os resultados da matriz foram então sobrepostos. Para identificar vias moleculares, os dados foram mapeados para o banco de dados KEGG. genoma análise de toda CNV que, em comparação tumor primário e no epitélio não-cancerosas revelou ganhos em 1638 genes e perdas em 36 genes. Ganhos significativos foram encontrados principalmente no cromossomo 20 na posição 20q12 com uma frequência de 45,31% em amostras de tumor. Exemplos de genes que foram associados a esta cytoband foram

PTPRT

,

EMILIN3

e

CHD6

. O maior número de perdas foi detectado no cromossomo 8, posição 8p23.2 com a ocorrência de 17,19% em todas as amostras tumorais. Entre os genes encontrados neste cytoband foram

CSMD1

e

DLC1

. Genome-wide perfil de expressão mostrou 709 genes de ser up-regulada e 699 genes a ser regulada no CRC comparadas com amostras não-cancerosas. Integração destes dois conjuntos de dados identificados 56 genes que se sobrepõem, que foram localizados nos cromossomos 8, 20 e 22. MLPA confirmaram que as amostras de CRC teve os maiores ganhos no cromossomo 20 em comparação com as amostras de referência. A interpretação dos dados da CNV no contexto do transcriptoma via análises integrativas podem fornecer mais conhecimento profundo da paisagem genômico de CRC

Citation:. Ali Hassan NZ, Mokhtar NM, Kok Sin T, Mohamed Rose I , Sagap I, Harun R, et al. (2014) Análise Integrada do número de cópias Variação e expressão Genome-Wide Profiling em Colorectal Cancer tecidos. PLoS ONE 9 (4): e92553. doi: 10.1371 /journal.pone.0092553

editor: Hassan Ashktorab, Howard University, Estados Unidos da América

Recebido: 04 de julho de 2013; Aceito: 24 de fevereiro de 2014; Publicação: 02 de abril de 2014

Direitos de autor: © 2014 Ali Hassan et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. O projeto foi financiado pelo Ministério da Ciência, Tecnologia Inovação (07-05-MGI-GMB016) e Instituição de Centro de Excelência subvenção do Ministério do Ensino Superior. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

O câncer colorretal é uma preocupação de saúde, com mais de um milhão de indivíduos diagnosticados a cada ano em todo o mundo [1]. Esse tipo de câncer está entre os três melhores de todos os cancros que levam à morte em todo o mundo [2]. Na Malásia, ele classifica como o segundo tipo de câncer mais comum em ambos os sexos [3].

Uma forma de instabilidade genética que é observada em pelo menos 85% dos casos esporádicos de CRC é a instabilidade cromossômica (CIN) [4] . Aneuploidia é uma consequência do CIN que leva ao ganho ou perda de todo ou partes de regiões cromossômicas [5], e isso pode causar complexidade estrutural que conduz à instabilidade genômica. Uma forma comum de variantes estruturais devido a CIN é conhecido como variações do número de cópia (CNVs), que é definido como um ganho ou perda de cópias de segmentos de DNA que são maiores do que 1 kb de comprimento quando comparado com um genoma de referência [6]. CNVs podem afectar a expressão de genes e têm sido associados com a susceptibilidade à doença. Tem sido sugerido que as mudanças de transcrição correspondem à CNVs e alterações na dosagem de gene podem ser correlacionadas com as mudanças no nível de expressão [7].

Usando a tecnologia de microarray

milhares de sites de CNV foram documentados. Estudos anteriores sobre câncer colorretal revelaram ganhos em 8q cromossomo, 13 e 20q e as perdas no cromossomo 8p, 17p e 18q [8], [9], [10], [11], [12]. Estas aberrações levar à supressão ou amplificação de genes supressores de tumores, oncogenes, ou ARN, tais como miARNs, o que resulta na expressão aberrante de genes que afectam os processos biológicos relacionados com o cancro [13] não codificante, [14].

um gene que tem um alelo duplicado (um número de cópias de 3) tem um nível mais elevado de expressão do que o de tipo selvagem [15]. Por outro lado, um gene que tem um alelo suprimido (um número de cópias de 1) terá um nível inferior de expressão de [15]. Integrative analisa em CRC mostrou que os níveis de certos oncogenes e genes supressores de tumor de expressão foram CNV relacionada com [16]. Por exemplo, a amplificação ou o ganho de

MYC

gene na posição 8q24 resulta em sobre-expressão desse gene na CRC. Além disso, a supressão ou a perda do

APC

gene na posição 5q21 conduz a sua expressão desregulada no CRC [17]. Padrões semelhantes de correlação, também têm sido observadas em cancros da mama e do pulmão. Aproximadamente 12% das alterações nos níveis de expressão de genes foram relatados para estar em concordância com o número de cópias no cancro da mama [18], e cerca de 78 genes% mostraram uma correlação positiva entre a CNV e nível de expressão de genes em um estudo de câncer de pulmão [19].

O objetivo deste estudo foi obter uma visão sobre os mecanismos moleculares da CRC através das análises de CNV e perfil de expressão do genoma de um tumor primário e seu correspondente epitélio do cólon não-cancerosas. Também queríamos identificar a relação entre o perfil CNV e do transcriptoma no CRC.

Materiais e Métodos

O recrutamento dos doentes

O estudo foi realizado com a aprovação do comitê de ética da Universiti Kebangsaan Malaysia (UKM 1.5.3.5/244/UMBI-004-2012) e consentimento informado por escrito foi tirado de cada um dos 64 pacientes submetidos à cirurgia. Nenhum dos pacientes tinham recebido quimioterapia ou tratamento com radioterapia antes da cirurgia. tumor primário e tecidos não cancerosos (10 cm de distância do tumor) foram obtidos imediatamente após a cirurgia e congeladas em nitrogênio líquido para armazenamento.

O ADN genómico e RNA isolamento

Frozen seccionamento foi realizada em todas as amostras utilizando uma espessura de corte de 5 a 7 um. As secções foram montadas em lâminas de vidro e coradas com hematoxilina e eosina (H E). As lâminas coradas foram então avaliadas por um histopatologista para confirmar a presença ( 80% células cancerosas) ou ausência de células de tumor e as suas correspondentes células não-cancerosas. O ADN foi isolado utilizando o Qiagen DNeasy Blood and Tissue kit de acordo com o protocolo do fabricante. O ARN total foi extraído a partir de 15 amostras emparelhadas utilizando o kit Qiagen Mini QIAmp Plus. A qualidade do ADN e ARN isolado foi quantificado utilizando um espectrofotómetro NanoDrop ND-1000 (Thermo Fisher Scientific, Waltham, MA), e apenas as amostras com um grau de pureza de 1,8 a 2,1 (A260 /A280) foram seleccionados. A integridade das amostras de ADN isolados foi avaliada em géis de agarose a 1,0%, e a integridade do ARN isolado foi determinada usando um Bioanalyzer (Agilent Technologies, CA, EUA). Foram selecionadas amostras com RNA Integridade Number (RIN) de 6,0 e acima de perfil de expressão gênica.

CNV e perfil de expressão gênica

Todas as 64 amostras pareadas foram testados utilizando o Illumina HumanOmni1-Quad Bead Chip, que contém 1.140.419 loci único polimorfismo de nucleótido (SNP), com base no protocolo de ensaio Ilumina Infinium II (Illumina, San Diego, CA, EUA). perfil de expressão do gene foi realizado nas 15 amostras emparelhadas utilizando a matriz ST Affymetrix GeneChip Human Gene 1.0, que contém 36,079 28,869 transcritos com genes bem anotado (Affymetrix Inc., Santa Clara, CA, EUA). O ARN foi preparado utilizando o protocolo de aplauso WT-Amp ST do sistema antes do processo de hibridação (NuGen Technologies Inc., San Carlos, CA, EUA). As matrizes foram coradas e digitalizadas com base no GeneChip Whole Transcrição protocolo (WT) Sense alvo Labeling ensaio que foi delineado por Affymetrix.

Apresentação de dados de microarrays à base de dados ArrayExpress

A matéria e normalizada dados de microarray foram carregados na base de dados ArrayExpress: http://www.ebi.ac.uk/arrayexpress. A adesão ArrayExpress é E-MEXP-3980.

A análise estatística da CNV perfis

Os arquivos binários (.

IDAT

), que foram produzidos pelo software de digitalização Illumina (Bead leitor matriz Scan) foram analisados ​​usando a versão Illumina Genome Estúdio Genotipagem Module 3.2.33 (Illumina, San Diego, CA, EUA) para obter dados de genótipos normalizados. O limiar de taxa de chamada genótipo foi fixado em ≥90%, e o relatório final dos dados genótipo normalizada foi transferido para um programa de terceiros, Partek Genomic Suite versão 6.6 (Partek Inc., St. Louis, MO, EUA), para determinar os perfis de CNV.

análise

emparelhados CNV foi efectuada por comparação da intensidade de cada um dos sinais de hibridação de uma amostra de tumor ao da sua correspondência epitélio não-cancerosas. O algoritmo de segmentação genómico foi utilizado para detectar os ganhos e as perdas da CNV. Os seguintes parâmetros rigorosos foram ajustados para reduzir qualquer alteração falso-positivo: cada segmento deve conter um mínimo de 10 conjuntos de sondas filtrados consecutivos, um limiar de valor p de 0,001 quando comparados com os vizinhos regiões adjacentes e um limiar de sinal-para-ruído de 0.5. O valor de cut-off para o ganho foi ajustado para acima de 2,3, enquanto que a perda foi de 1.7 abaixo. CNV foi chamado para os ganhos ou perdas que ocorreram em pelo menos 10% (7 amostras) do total das amostras. Uma lista completa de todos os ganhos e perdas CNV estão incluídos na Tabela S1. As localizações cromossômicas dos ganhos no número de cópias e perdas de 22 autossomos são mostradas por cariogramas (Figura 1).

Os ganhos são mostrados em verde e as perdas são mostrados em vermelho. O comprimento da barra horizontal corresponde ao número de amostras envolvidas na respectiva cytoband. A maior parte dos ganhos foram encontrados no braço longo do cromossomo 20 e as perdas foram observadas principalmente no braço curto do cromossomo 8.

A análise estatística de perfil de expressão gênica

A Affymetrix CEL arquivos foram importados para a Partek Genomic Suíte 6,6 (Partek Inc., St. Louis, MO, EUA) para realizar perfil de expressão gênica análise. arquivos CEL bruto foram processados ​​para a correcção de fundo e normalização quantil (escamação mediana) usando o método robusto matriz multi-média (RMA). Uma trama análise de componentes principais (PCA) foi gerado como o passo de controlo de qualidade (Figura 2A), e o efeito do lote foi removido como uma fonte de variação. A três-way ANOVA foi realizada em todas as amostras. Estatisticamente genes expressos de forma significativa foram identificados usando o modelo misto de variância com uma taxa de detecção falsa (teste Benjamini-Hochberg) ajustado valor de p ≤0.05 e dobre-change valores de -2 a 2. agrupamento hierárquico foi gerado para visualizar padrões de expressão nos dados (Figura 2B). análise de enriquecimento de ontologia gênica foi realizada utilizando DAVID (banco de dados para anotação, visualização e descoberta Integration) ferramentas de bioinformática.

(A) enredo PCA dispersão dos dados CRC. Cada ponto representa amostra. Pontos são coloridos por status do grupo de azul representando epitélio não canceroso e do tecido tumoral representando vermelho. (B) de agrupamento hierárquico de perfis de mRNA. As amostras são indicadas ao longo do eixo horizontal e agrupadas por a barra de cores entre o dendograma eo mapa de calor. O azul representa epitélio não canceroso e vermelha representa o tecido do tumor. Em geral, houve uma separação clara entre o grupo de não-cancerosas epitélio e tecido tumoral quando examinado por ambos PCA (Figura 2A) e de agrupamento hierárquico (Figura 2B).

Integração de variação do número de cópias e genome- analisa ampla expressão

dados da CNV e expressão do genoma análises foram analisados ​​individualmente. Para identificar os genes que exibiram alterações significativas da CNV e de expressão de genes, que se sobrepunham os dois conjuntos de dados, tal como apresentado no diagrama de Venn (Figura 3A). As localizações cromossômicas dos genes sobreposição entre os dois conjuntos de dados são mostrados em um mapa circular (Figura 3B).

(A) Venn-diagrama representando os genes comuns em CNV e conjuntos de dados de expressão de genes revelou 56 genes que se sobrepõem. (B) Mapa circular mostrando visão geral dos dados CNVs e de expressão gênica. Os cromossomas são mostrados na cor codificada da mais exterior do anel. O segundo anel apresenta a distribuição do perfil de expressão génica. (Vermelho indica genes up-regulada e verde indica genes regulados negativamente). O anel interno representa mudanças NC (vermelho denota ganho de CN e verde denota perda de CN). O anel mais interior mostra a distribuição dos dois conjuntos de dados sobrepostos.

Sub-análise dos dados da variação do número de cópia e microarray de expressão do genoma para os 15 casos emparelhados

analisados ​​os dados que foram obtidos a partir do número de cópias e perfil de expressão do genoma das 15 amostras emparelhadas utilizando Partek genómico suite 6,6 (Partek Inc., St. Louis, MO, EUA). O algoritmo de segmentação genômico foi aplicado com os parâmetros que foram mencionados na seção de análise do número de cópias. A folha de cálculo resultante continha marcadores individuais que exibiram os níveis aberrantes de ADN em cada tumor em relação ao seu emparelhado normal. Expressão de dados foram normalizados para a linha de base e as razões foram transformadas com log2 antes da análise. Ambos os conjuntos de dados foram correlacionados utilizando o método de correlação linear de Pearson e geramos um gráfico de dispersão para a visualização dos resultados (Figura 4A e 4B).

Gráficos de dispersão de expressão gênica (eixo y) correlacionar para copiar número (eixo-x ) com expressão diferencial mudança CN no CRC para

ARGLU1

(Figura 4A) e

UGGT2

genes (Figura 4B). Cada ponto representa uma amostra.

Multiplex Ligation Probe Amplification (MLPA)

Para validar a CNV profiling resultados, foram selecionadas cromossomo 20 para o ensaio MLPA usando o 20q sonda SALSA MLPA P157 misturar de acordo com o protocolo do fabricante (MRC-Holland, Amsterdam, e Países Baixos). A mistura de sonda contém 34 sondas para 26 genes diferentes que estão localizados em 20q. análise de fragmentos dos produtos de PCR foi realizada utilizando o tamanho padrão GeneScan-500 LIZ no Applied Biosystems 3130 DNA Analyzer (Applied Biosystems, Foster City, CA). Os dados de fluorescência foram recolhidos durante a separação fragmento e importados para o software Coffalyser.Net (MRC-Holland, Amsterdam, e os Países Baixos) para análise.

Resultados

Dados Demográficos

dos 64 pacientes, 39 (60,94%) eram do sexo feminino e 25 (39,06%) eram do sexo masculino (Tabela 1). A maioria eram malaios (48,44%), seguido pelo chinês (46,88%) e índios (4,69%). Com base no Dukes ‘classificação, 33 pacientes (51,56%) eram de Dukes’ B, 27 pacientes (42,19%) eram de Dukes ‘C e 4 pacientes (6,25%) foram de Dukes’ A. A idade média foi de 56 ± 13,35 anos de idade.

número de cópias ganhos foram frequentemente encontrados no braço q do cromossomo 20

dos 8722 segmentos genômicos em todas as amostras, nós reduzimos nossa análise para 2212 regiões CNV que corresponderam aos autossomas que mostraram amplificações (Tabela S1). Os CNVs foram espalhados por cromossomo 1 a 22 com o maior amplificação encontrada no cromossomo 20, que tinha 388 segmentos que representaram 17,5% de todos os ganhos. O segundo maior número de ganhos foi documentada no cromossomo 7, com 369 segmentos genômicos, seguido por cromossoma 8, com 338 segmentos genômicos. O comprimento mais longo para os segmentos de ganho de CNV foi entre 8q22.1 e 8q22.2 correspondente a 4070488 pb. Um total de 1.638 genes foram amplificados em todas as amostras e 765 destes foram única ou genes não redundantes. Cytoband 20q12 teve a maior frequência de ganhos que envolvam pelo menos 45,31% das amostras tumorais. Oito genes foram identificados neste locus e três deles, ou seja,

PTPRT

,

CHD6

e

EMILIN3

, foram previamente descritos no cancro colorectal. A Figura 1 mostra a distribuição destes genes no cromossoma 20, com ganhos apresentados em verde. Os detalhes sobre os 10 melhores genes significativas de acordo com o banco de dados RefSeq são fornecidos na Tabela 2.

Copiar perdas numéricas foram encontradas principalmente no braço p do cromossomo 8

A supressão ou perda do valor do número de cópias foi observada menos de 1,7 ao longo do cromossoma 1 a 22 autossomas, com a maioria detectado no cromossoma 8, que tinha 225 CNV afectada segmentos. A região específica para as perdas foi observada na posição 8p23.3 com ocorrência de 17,9% em todas as amostras de tumor. O segundo maior frequência de prejuízos foi detectado no cromossomo 17, com 213 segmentos genômicos, seguido pelo cromossomo 19, com 184 segmentos genômicos. A perda mais longo de um segmento genómico foi em 8p23.1 para 8p22, que consistia de 3.093.282 pb. Foram identificados apenas 14 genes únicos ou não redundantes (Tabela 3). Análise dos genes individuais no cromossoma 8 revelou que apenas 5 dos genes foram previamente relatado para ser relacionada com o CRC; Estes genes foram

CSMD1

,

DLC1

,

TUSC3

,

SGCZ

e

LONRF1

. A distribuição das perdas, mostrado em vermelho, pode ser observado no diagrama de cariótipo como mostrado na Figura 1.

A análise da expressão do gene de perfil

A análise revelou diferenças significativas na expressão de genes entre o tumor primário e as amostras epiteliais não-cancerosas. Classificação por PCA mostrou uma clara separação de dois grupos distintos de acordo com o tipo de tecido (Figura 2A). Um total de 1408 genes foram expressas diferencialmente por, pelo menos, duas vezes, com significância estatística (p 0,05). No entanto, um único gene é representado por vários conjuntos de sondas chamados “irmãos sondas ‘na Affymetrix GeneChip. Portanto, quaisquer conjuntos de sondas redundantes foram filtrados, que deixou de 1191 genes únicos para análise posterior. Destes, 584 foram genes verificou-se ser regulada para cima enquanto a outra 607 genes foram encontrados para ser sub-regulada. A maioria dos genes regulados positivamente foram encontrados em cromossomas 7 (n = 48, 8,22%), 2 (n = 44, 7,53%) e 12 (n = 42, 7,19%). genes regulados negativamente foram localizadas principalmente nos cromossomos 1 (n = 73, 12%), 2 (n = 44, 7.25%), 3 e 4 (n = 43, 7,08%). Entre os genes regulados positivamente foram

MYC

,

CD44

,

ABC22

,

TIMP1

, e

BIRC5

, enquanto o regulada genes incluídos

FAS

,

KLF4

,

UGTIA1

e

CA2

. A lista completa dos genes diferencialmente expressos e seus correspondentes dobrável mudanças nos valores de expressão e P são apresentados na Tabela S2. agrupamento hierárquico foi gerado e visualizadas através de um mapa de calor, onde dois padrões distintos de expressão pode ser observado (Figura 2B). A caracterização funcional dos genes significativos foram realizados usando análise GO, e eles foram encontrados para ser distribuído ao longo dos cinco classes, que incluíram ciclo celular, divisão celular, a segregação cromossoma, nucleósido de ligação e ligação de ATP (p 0,05).

Efeito da CNV na expressão de genes relacionados com o cancro colorectal

a integração dos dois conjuntos de dados de perfis mostrou 56 sobreposição de genes (Figura 3A e 3B), e uma lista completa destes genes sobrepostos é apresentado em tabela S3. Observou-se um total de 1.135 genes com as mudanças de expressão única de genes e 723 genes com alterações CNV, mas sem mudanças nos níveis de transcrição. Integração de expressão CNV e gene análises mostraram uma associação positiva em 48 genes (85,7%) e uma associação negativa nas restantes 8 genes (14,3%) (Tabela 4).

Para entender melhor ainda mais a função biológica destes genes, os 56 genes foram submetidos a anotação funcional e análise da classificação através DAVID v6.7. Achamos que os genes a ser relacionada com os processos biológicos e componentes celulares.

Estes genes foram ainda mapeado para a base de dados via KEGG para determinar as interacções entre os genes candidatos ou de oncogenes supressores de tumores que foram identificados por CNV e a expressão array. A análise revelou que o ciclo celular era a via mais significativamente enriquecido e

CDC25B

,

PCNA

e

p107 /RBL1

eram a chave, genes envolvidos (Figura 5).

ciclo celular foi encontrado para ser enriquecido a via mais significativa (p 0,05). Genes envolvidos (

CDC25B, PCNA e p107 /RBL1

) mostrada na caixa de cor vermelha indica os genes para ter ganho de CN e aumento do nível de expressão.

Correlação da CNV com gene expressão de genes relacionados com o cancro colorectal em um subconjunto de 15 amostras pareadas

Para determinar a relação entre o número de cópias do DNA e expressão gênica, foi aplicado o modelo da Pearson de correlação linear (Figura 4A 4B). Os valores de correlação foi encontrada entre -0,85 a 0,89. Usando um corte de p 0,05, 2159 genes mostraram correlações significativas entre o número de cópia e expressão do gene. Um total de 914 transcrições de 616 genes mostraram uma boa correlação (r 0,6) entre o número de cópia e expressão do gene. Os genes top cinco correlacionados foram

ARGLU1

,

UGGT2

,

CES2

,

FUT10

e

pAOX

. A lista completa dos genes correlacionados com os seus valores de correlação e de Pearson p, pode ser visto na Tabela S4.

Validação de CNV perfis usando MLPA

Foi realizado o ensaio MLPA e direcionados 26 genes em 150 amostras (50 tecidos normais e 100 tumores) para validar os dados de perfil da CNV. Nós escolhemos sondas que cobriam o braço q do cromossomo 20 e os resultados foram considerados aceitáveis ​​se o pico de controle caiu dentro do intervalo de 0,8 a 1,2. Uma deleção foi marcado se a dose média do teste para os picos de controlo interno foi inferior a 0,7, e a duplicação foi marcado se a dose média foi de 1,3 ou maior. Uma amostra de referência normal, não revelou alterações no número de cópias em qualquer um dos genes, e análise de MLPA mostraram que o ganho do número de cópias foi detectada em todas as vinte e seis genes testados. A Tabela 5 resume a análise MLPA com os valores médios de cada gene.

Discussão

Foi realizada uma análise integrada utilizando vários conjuntos de dados em tecidos colorretais para identificar os genes diferencialmente expressos com alteração segmentos genômicos. Analisamos o CNVs e perfil de expressão gênica em 64 emparelhado e 15 pares de tecidos CRC, respectivamente. A utilização de tecidos não-cancerosas adjacentes do mesmo indivíduo reduziu as variações que foram causados ​​por heterogeneidade inter-individual.

O presente estudo identificou uma série de ganhos e perdas genómicas focais em CRC, que mostrou alguma concordância com os resultados de estudos anteriores [20], [21], [22]. Análise individual do conjunto de dados CNV revelado ganhos significativos no cromossoma 20q, que também eram altamente consistentes com os estudos anteriores [23], [24]. ganhos semelhantes também foram observados no cancro da mama e cancro gástrico primário [25]. Cytoband 20q12 apresentou a maior frequência de ganhos que se estendeu 39.239.931-41.684.451 bp com a participação de oito genes, incluindo

PTPRT

,

CHD6

,

EMILIN3

,

LPIN3

,

PLCG1

,

TOP1

,

ZHX3

e

MAFB

. Dos oito genes,

TOP1

,

PLCG1

e

PTPRT

estavam relacionados com a CRC.

A topoisomerase 1 (

TOP1

) é um oncogene que catalisa o desenrolamento do DNA e cria moléculas de cadeia simples, que são necessários em numerosos processos biológicos, tais como a replicação do ADN, a transcrição e a reparação do ADN [26]. Um estudo de

TOP1

usando um array CGH encontraram ganhos em seu número de cópias em amostras de CRC [9]. Um aumento do número de cópias de

TOP1

também foi detectado em pacientes Fase III CRC com uma média de quatro cópias do gene para cada célula usando uma fluorescência

in situ

fluorescente (FISH) Método [27], [28].

O segundo gene que foi relacionada com a CRC identificado no presente estudo foi a fosfolipase C gama 1 (

PLCG1

), que é uma molécula de sinalização e é um gene vizinho de

TOP1

.

PLCG1

é activada em resposta à estimulação do factor de crescimento e está envolvida na regulação de uma variedade de funções celulares, tais como a migração celular, invasão e metástase [29], [30], [31].

a proteína tirosina fosfatase receptor-T (

PTPRT

) está situado na região amplificada de 20q12 entre 39.344.635-41.684.451 pb. É um gene supressor de tumor, e tem sido demonstrado que desempenham papéis integrantes na adesão celular e sinalização intracelular [32]. Ganho de número de cópias envolvendo o

gene PTPRT

foi identificado em um estudo anterior sobre carcinoma de células claras ovário usando matriz CGH [33]. O ganho no número de cópias deste gene pode ser como um resultado do efeito ‘gene de passageiros’, porque não poderiam detectar qualquer alteração na sua expressão gênica.

Outros cytobands significativamente amplificados no braço q do cromossomo 20 codificada oncogenes que foram associados com CRC bem estabelecida, e estes incluídos 20q11.21 (

BCL2L1

), 20q13.2-20q13.31 (

AURKA

), 20q11.23 (

SRC Art

CTNNBL1

), 20q11.21-20q11.22 (

DNMT3B

) e 20q11.22 (

DYNLRB1

). Estes resultados sugerem o envolvimento importante de vários genes candidatos dentro do braço longo do cromossoma 20 em desenvolvimento e progressão do câncer. O MLPA parece ser um método confiável e eficiente para avaliar número de cópias do DNA muda porque a maioria desses genes testados concordância reveladas com os resultados de microarray.

Copiar perdas numéricas foram encontradas principalmente no braço p do cromossomo 8. A maior perda foi encontrado em cytoband 8p23.2 4.008.230-4.027.339 pb. Entre os genes que residem nesta região é a CUB sushi e um gene de vários domínios (

CSMD1

), que é um gene supressor de tumor que codifica para vários domínios complementar a proteína reguladora e a adesão. Focal perda de número de cópias do

gene CSMD1

tem sido observada em CRC [34], o cancro da mama [35] e câncer gástrico [36], e diminuição do nível de

CSMD1

expressão foi relatado para ser significativamente associada com o grau de alta tumor e reduziu a sobrevida global em um estudo do cancro da mama [37]. Outra região que foi observado para expor cópia perda número que foi identificado neste estudo foi cytoband 8p23.1-p22, que incluiu uma região que cobria 12601480 a 15694761 pb. Um gene que está localizado dentro desta região é o eliminado no cancro do fígado 1 (

DLC1

), que foi relatada como sendo um gene supressor de tumor, e tem sido mostrado que passar por perda de cópia número em vários cancros, tais como hepatocelular carcinoma de mama e câncer [38], [39].

fizemos uma sub-análise de 15 amostras pareadas de CRC para avaliar a relação entre o número de alterações de cópia e expressão do gene. Genes envolvidos no CRC, tais como

MYC

(mielocitomatose aviária viral homólogo oncogene v-myc) [40]

CCNB1

(ciclina B1) [41] e

PLK1

( polo-like kinase 1) [42], foram up-regulada e concordante amplificados em número de cópias em nosso estudo. Sete genes foram encontrados para ser regulada com a perda do número de cópias, mas apenas dois genes,

MUC17

(mucina 7) [43] e

CES

(carboxilesterase 2) [44] têm sido mostrado estar relacionado com CRC.

análise

Integrado usando um diagrama de Venn mostrou que 85,7% dos genes tinham uma associação positiva. Quando mapeado para a via KEGG, o ciclo celular foi identificada como a via mais significativamente enriquecida (p 0,05). O ciclo celular é um regulador crítico da proliferação celular, e o crescimento e divisão celular, após danos no ADN. O percurso do ciclo celular é impulsionado principalmente pela família dependente da ciclina quinase (CDK) e suas subunidades reguladoras, as ciclinas. O ciclo celular tem quatro fases e os dois pontos de verificação principais em G1-S e G2-M transições para manter a ordem correcta de eventos [45]. A perda de controlo do checkpoint do ciclo celular promove a instabilidade genética, que leva à proliferação celular descontrolada e pode promover o desenvolvimento do cancro [46].

ciclo de divisão celular 25B (

CDC25B

) é um membro da ciclo de divisão celular (CDC) fosfatase família que funciona como activadores de CDKs e ciclinas complexos para regular a progressão do ciclo celular [47].

CDC25B

é responsável pela desfosforilação inicial e activação da CDK, iniciando, assim, a sequência de eventos que conduz à entrada em mitose [48], [49]. A sobre-expressão de

CDC25B

foi observada em 43% dos pacientes de CRC e está correlacionada com prognóstico pobre [50]. O aumento da

CDC25B

nível é suficiente para prejudicar os postos de controle de danos no DNA, o que, por sua vez, aumenta a mutagênese espontânea e interfere com a entrada em mitose [51], [52], [53].

antígeno nuclear de proliferação celular (

PCNA

) foi relatada a ser essencial para a replicação do DNA, reparo de DNA e regulação do ciclo celular [54]. Retinoblastoma-like 1 (

P107 /RBL1

) é um membro da família do gene do retinoblastoma (RB), e os genes nesta família foram identificados como supressores de tumores. RBL1 e outras proteínas RB cooperar para regular a progressão do ciclo celular durante a fase G1 do ciclo celular [55]. No entanto, o mecanismo de PCNA e envolvimento RBL1 na via do ciclo celular da CRC ainda é incerto e exige uma maior exploração.

Nós igualmente genes encontrados com associações negativas entre o número de cópia e expressão gênica níveis. Os genes incluem

BCAS1

,

EDN3

,

FABP4

,

MATN2

,

SDCBP2

,

SPTLC3

,

TRPA1

e

WFDC2

. Este paradoxo de uma relação negativa entre o estado do número de cópias e a expressão do gene também foi observada em um estudo anterior sobre CRC [56] e pode ser atribuída aos vários mecanismos que são responsáveis ​​pelo controlo normal e anormal da expressão do gene, incluindo as relacionadas com mutação, expressão e metilação do promotor de miARN [57]. Para entender este fenômeno, uma abordagem que utiliza tecnologia de sequenciamento profundo provavelmente irá provavelmente dar uma resposta a estas descobertas inesperadas.

Em conclusão, ao integrar os conjuntos de dados de dois estudos de perfis diferentes, foram identificados com sucesso 56 genes que se sobrepõem com as mudanças no número de cópias e a expressão do gene. O ciclo celular foi identificada como a via de sinalização de chave a partir desta análise integrada. No entanto, futuros estudos são necessários para determinar o impacto desses genes na evolução da doença.

Informações de Apoio

Tabela S1. .

A informação completa sobre cópia do perfil de variação número de 64 pacientes com câncer colorretal

doi: 10.1371 /journal.pone.0092553.s001

(XLSX)

Tabela S2. .

A informação completa sobre gene perfil de 15 pacientes com câncer colorretal expressão

doi: 10.1371 /journal.pone.0092553.s002

(XLSX)

Tabela S3.

Deixe uma resposta