PLOS ONE: GWAS Atende Microarray: são os resultados de estudos de associação genômica-Wide e Gene-Expression Profiling consistente? O câncer de próstata como uma Example

Abstract

Background

estudos

Genome-largos da associação (GWASs) e profiling mundial da expressão do gene (microarrays) são dois grandes avanços tecnológicos que permitam a identificação sem hipótese de genes candidatos associados com tumorigênese. Não é óbvio se há uma coerência entre os genes candidatos identificados por GWAS (genes GWAS) e aqueles identificados por perfis de expressão genética (genes de microarranjos).

Metodologia /Principais Achados

Nós usamos o banco de dados de susceptibilidade marcadores de câncer genéticos para recuperar polimorfismos de nucleotídeo único de genes candidatos para o câncer de próstata. Além disso, foi realizado um grande meta-análise de dados de expressão de genes em próstata normal e tecido de tumor da próstata. Foram identificados 13,905 genes que foram interrogados por ambos GWASs e microarrays. Com base nos valores de P de GWASs, foram selecionados 1.649 genes mais significativamente associados para anotação funcional pelo banco de dados para anotação, visualização e descoberta integrada. Também realizamos a análise anotação funcional usando mesmo número dos principais genes identificados na meta-análise dos dados de expressão de genes. Descobrimos que os genes envolvidos na adesão celular foram representadas entre ambos os genes GWAS e microarray.

Conclusões /Significado

Nós concluímos que os resultados destas análises sugerem que a combinação de dados GWAS e microarray seria uma abordagem mais eficaz do que analisar conjuntos de dados individuais e pode ajudar a refinar a identificação de genes candidatos e funções associadas com o desenvolvimento do tumor

Citation:. Gorlov IP, Gallick GE, Gorlova OY, Amos C, Logothetis CJ (2009) GWAS Atende Microarray: os resultados dos estudos de associação do genoma-largas e Gene-expressão são Profiling consistente? O cancro da próstata como um exemplo. PLoS ONE 4 (8): e6511. doi: 10.1371 /journal.pone.0006511

editor: Eshel Ben-Jacob, Universidade de Tel Aviv, Israel

Recebido: 11 de maio de 2009; Aceito: 29 de junho de 2009; Publicação: 04 de agosto de 2009

Direitos de autor: © 2009 Gorlov et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi apoiado pela Koch Centro David de Pesquisa Aplicada em Câncer geniturinário. apoio parcial para este estudo foi fornecido pelo Instituto Nacional de Saúde dos Estados Unidos concede R01CA121197-01A2 a CA e AR055258 subcontrato com OG. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

tecnologia de microarray permite a avaliação simultânea da expressão de virtualmente todos os genes no genoma. Esta abordagem tem sido extensamente usada para identificar genes candidatos associados com o desenvolvimento e progressão de cancro [1] – [3]. estudo de associação genômica ampla (GWASs) surgiram recentemente como uma ferramenta poderosa para identificar polimorfismos genéticos associados com o risco de câncer [4], [5]. Em um GWAS, centenas de milhares de polimorfismos de nucleotídeo único (SNPs) são genotipados em um grande número de casos e controles. A diferença na alélicas ou genotípicas entre casos e controles sugere uma associação entre o risco de câncer e do SNP e um gene ligado ou região reguladora.

Se estas duas abordagens produzem resultados comparáveis ​​não foi examinado. Recentemente Chen et al. [6] identificaram os genes que tendem a ser diferencialmente expressos em várias condições experimentais e estados usando dados de expressão genética do Gene Expression Omnibus (GEO). Eles descobriram que os genes diferencialmente expressos são mais propensos a ser detectados como variantes da doença em estudos de associação.

Neste estudo, realizamos uma abordagem mais direta para vincular dados GWAS e microarray. Foram realizadas anotações funcionais dos melhores genes identificados no cancro da próstata GWASs e o mesmo número de genes candidatos identificados no topo de uma meta-análise dos dados de expressão genética de próstata normal e do tumor da próstata. Os resultados de nossas análises indicam que estas duas abordagens produzem resultados semelhantes a nível funcional.

Materiais e Métodos

Vários câncer de próstata GWASs foram realizados recentemente, e um número de genes candidatos foram identificados ( A tabela 1) [7] – [10]. Embora apenas algumas SNPs com o nível do genoma de significância, 10

-7, foram identificados nestes estudos, um número de SNPs foram significativos ao nível de testes individuais, mas não significativa após correcção para múltiplos testes. Tais SNPs provável indicam enriquecimento com SNPs causais que não atingem o nível de significância do genoma causa de seu tamanho pequeno efeito ou baixa freqüência do alelo [11].

Os dados GWAS para esta análise foram recuperados a partir a base de dados do cancro genética marcadores genéticos de susceptibilidade (MEGC), https://cgems.cancer.gov/about/executive_summary.asp. Utilizou-se o banco de dados Oncomine https://www.oncomine.org/main/index.jsp para conduzir uma meta-análise do número de estudos comparando a expressão do gene no tecido da próstata normal com a de tecido de tumor da próstata localizado [12]. A lista completa dos estudos utilizados na meta-análise pode ser encontrada nos materiais suplementares (Tabela S1). Utilizou-se uma extensão do método de Stouffer [13] para a meta-análise. Esta abordagem baseia-se na estimativa do desvio padrão normal,

Z

, e é semelhante à abordagem recentemente proposto por Ochsner et ai. [14]. A meta-análise identificou uma série de genes diferencialmente expressos entre próstata normal e tumor da próstata.

Resultados

Como uma validação inicial de nossa hipótese de que GWASs e microarrays tendem a identificar os mesmos genes, nós utilizada uma meta-análise dos dados de expressão genética Oncomine para avaliar a expressão dos genes identificados GWAS-(Tabela 1). Descobrimos que todos, mas três (

HNF1B, EHBP1

, e

LMTK2

) dos genes foram diferencialmente expressos entre a próstata normal e tumoral. Por conseguinte, 10 de 13 (77%) dos genes GWAS foram diferencialmente expressos na transição da próstata normais para o cancro da próstata que seja mais elevado do que se pode esperar para detectar entre escolhidos aleatoriamente 13 genes -1.1 (χ

2 = 20,9, df = 1, P . 0,0001)

o cancro da próstata a partir de dados GWAS MEGC Fase 1A e 1B fase, foram usadas na análise. Nós limitamos nossa análise aos SNPs associado com genes para fazer GWAS e microarray resultados comparáveis. Seguimos a designação MEGC dos SNPs associados a genes. Foram identificadas 63,831 SNPs associado com genes pertencentes a 16.550 genes únicos. Para cada gene, um SNP com o menor valor de P foi utilizado para caracterizar uma associação. Se um determinado SNP foi associada a múltiplos genes, todas essas associações foram incluídos na nossa análise. Porque em muitos casos aliases em vez de nomes oficiais de genes foram usados ​​em GWAS, nós ligados vários identificadores de genes para os nomes de genes oficiais e EntrezIDs usando a versão mais recente do banco de dados de genes NCBI (acessado em 17 de janeiro de 2009). Sobreposição dos genes únicos GWAS e microarray demonstrou que 13,905 genes foram avaliados em ambos os GWAS e análises microarray. A lista dos genes com os valores GWAS e microarray P correspondente é mostrada na Tabela S1.

Para avaliar se o GWAS e microarray análises tendem a se identificar conjuntos semelhantes de genes que avaliar uma correlação entre -log valores (P) baseado em dados GWAS e valores -log (P) com base na análise da expressão do gene. Encontramos uma pequena, mas significativa (por causa do grande tamanho da amostra) correlação positiva entre GWAS e -log microarray (P) s (Figura 1)

A linha preta mostra a curva de regressão linear, linha vermelha -. Média móvel calculado utilizando uma janela deslizante de 100 pontos. coeficiente de correlação de postos de ordem de Spearman:. r = 0,043, N = 13905, P = 0,0000001

O banco de dados para anotação, visualização e descoberta integrada (DAVID) [15] foi utilizado para a anotação funcional de GWAS microarray e genes. Foram selecionados genes com GWAS P valoriza ≤0.01. Foram identificados um total de 1.649 genes. Utilizou-se exactamente o mesmo número dos principais genes identificados na meta-análise dos dados de expressão genética. Para controlar possíveis vieses na seleção gene, foi utilizada a lista de 13,905 genes como o fundo. gráficos anotação funcional foram usadas para recuperar uma cobertura de anotação estendida que incluiu mais de 40 categorias de anotação [15]. Um gráfico funcional para os principais genes GWAS podem ser encontrados na Tabela S2. Categorias relacionadas com a adesão Muitos celulares estão entre as principais categorias de anotação. Clustering dos termos de anotações funcionais resumidos todos os tipos de a descrição funcional utilizado por DAVID, identificando a adesão celular como o topo cluster, seguido de membrana plasmática e fibronectina.

Genes

anotação funcional de topo diferencialmente expressos identificados citoesqueleto, adesão focal, matriz extracelular, adesão celular e como os principais termos de anotação (Tabela S3). Clustering dos termos de anotação funcional demonstrou citoesqueleto, citoesqueleto de actina, matriz extracelular, e adesão celular entre os grupos principais identificados. A Figura 2 mostra os resultados do agrupamento de termos funcionais por David com base na análise da parte superior GWAS e genes diferencialmente expressos (ver também a Tabela S4). Em ambas as listas, a maioria dos principais grupos funcionais derivados de GWAS e dados de microarranjos estão directa ou indirectamente relacionadas com a adesão celular.

grupos funcionais relacionadas com a adesão celular são mostrados em azul. Informações detalhadas sobre a composição de clusters podem ser encontrados na Tabela S4.

A seguir, olhou para uma sobreposição entre o topo 1.649 GWAS e os primeiros 1.649 genes diferencialmente expressos. Foram identificados 248 aparecendo em ambos os genes listas (ver materiais complementares para a lista dos genes). Este número é maior do que seria esperado por acaso. Se amostragem aleatória de 1.649 genes dentre os 13,905 genes, o número esperado dos genes encontrados em duas amostras independentes seria (1.649 /13.905) 2 * 1.649 = 23,2. A anotação funcional desses 248 genes identificados citoesqueleto, a adesão focal, e actina vinculativo como as principais categorias funcionais. agrupamento funcional dos genes identificados migração celular, motilidade celular, citoesqueleto e adesão celular, como os clusters de topo.

Discussão

GWAS e microarray analisa tanto a permitir a identificação imparcial de genes candidatos e vias associadas a desenvolvimento de câncer. Estas duas abordagens, cada um tem vantagens e desvantagens. Ao combinar dados de vários estudos de expressão, análises de expressão dos genes têm o poder estatístico para detectar até mesmo pequenas diferenças na expressão genética entre os tecidos normais e tumorais. Por outro lado, porque os genes no genoma humano, estão envolvidas em interacções múltiplas, a modulação da expressão de um único gene pode causar um “efeito de ondulação” em múltiplos alvos a jusante, o que torna difícil causal separado e as alterações induzidas na expressão genética. Esta é pouco provável que seja um problema em GWASs. GWASs, no entanto, são muitas vezes estatisticamente fraca potência para detectar SNPs com tamanho pequeno efeito.

Quando comparamos genes candidatos para o câncer de próstata identificado por GWAS com aqueles identificados por microarray, observamos uma correlação positiva entre o GWAS e microarray -log (P) s. A correlação era pequeno, com o coeficiente de correlação de Pearson sendo apenas 0,04, mas correlação positiva entre duas fileiras está previsto para ser accionado por um número relativamente pequeno de genes causais. Nem todos os genes causais será detectado por GWAS. Mesmo se o gene está mecanicamente ligada a tumorigénese da próstata, que pode ser detectado por GWAS apenas se transporta variantes genéticas que modulam a sua função. Por outro lado, os genes identificados por análise de micro-arranjo se espera ser uma mistura de genes causais e os genes que são expressos diferencialmente por causa do efeito de ondulação dos genes causais. Isto sugere que apenas uma fracção dos genes significativos em ambas as análises são genes causais.

Verificou-se que o topo GWAS e expresso diferencialmente candidatos foram enriquecidos em genes de adesão celular. Se considerarmos todos os genes de adesão celular conhecidas no genoma, apenas 74 genes ou 10% deles estavam entre os principais genes diferencialmente expressos. Se a via de adesão celular está associada com tumorigênese prostática, pode-se esperar que outros genes-essas adesão celular que não torná-lo ao topo 1.649 genes também tendem a ser significativamente associados positivamente. Descobrimos que o valor de P-GWAS derivada da média para os genes de adesão celular que não conseguiu atingir o topo 1649 foi menor do que o valor médio para os genes GWAS (teste t = 2,9, df = 13902, P = 0,001). Um resultado similar foi obtido para os valores de P obtidos a partir da análise da expressão gênica: a pontuação absoluta Z foi maior entre os genes de adesão celular (excluindo aqueles entre os melhores de 1649 genes) do que era a pontuação média Z (teste t = 1,81, df = 17811, P = 0,07 no teste de duas caudas e P = 0,03 no teste unilateral). Isto sugere que a função de adesão celular como um todo, está associada com a tumorigénese da próstata.

Ambos GWAS genes de microarranjos e formam aglomerados funcionais relacionadas com os diferentes aspectos da adesão celular, incluindo a própria adesão celular, junção de células, as glicoproteínas da matriz extracelular, a fibronectina , citoesqueleto de actina, e a motilidade celular. Vários outros grupos mostram também uma associação mecanicista com a adesão celular. Por exemplo, a absorção de caderina da superfície da célula por endocitose regula o nível das caderinas livres na superfície da célula e, por conseguinte, a adesão de células [16]. Além disso, as proteínas de dedo de zinco com o domínio LIM são importantes para a adesão focal e a adesão de células à fibronectina [17], [18]. A modulação da função de adesão celular parece não estar limitado a qualquer tipo de aderência específica, mas inclui, caderinas e integrinas, selectinas bem como moléculas de adesão associados com junções apertadas.

Os resultados de um número de estudos sugeriu o o envolvimento do sistema de adesão celular no desenvolvimento do cancro da próstata. As caderinas desempenham um papel na regulação da proliferação de células tumorais através de ciclinas e quinases dependentes de ciclina [19]. As integrinas estão envolvidas em diferentes aspectos da tumorigénese da próstata, incluindo a proliferação celular, motilidade celular e apoptose [20] – [22]. A modulação da adesão de células podem desempenhar um papel importante na transição epitelial-mesenquimal para-que se acredita ser um passo-chave na transformação maligna [23] – [25]. Além disso, os resultados de um número de estudos suggestd um envolvimento de adesão celular na angiogénese [26] – [28]

GWAS genes identificados são considerados genes de susceptibilidade de cancro que estão associadas principalmente com a iniciação do tumor.. Acreditamos, contudo, que os genes identificados por GWAS são também susceptíveis de incluir genes importantes para a progressão do tumor. Na verdade, a detecção de tumor é geralmente sintomática: o tumor tem de atingir um determinado tamanho para ser detectada. Isto sugere que os genes envolvidos na progressão tumoral será entre genes candidatos GWAS-detectadas. Portanto, GWAS e análise de expressão gênica podem visar essencialmente o mesmo conjunto de genes, fornecendo a base teórica para a análise conjunta dos GWAS e dados de microarranjos

.

Em resumo, a nossa análise encontrou uma considerável sobreposição entre os genes do câncer de próstata identificados por GWAS e as identificadas pelo perfil global da expressão do gene. Foram identificados adesão celular como uma função biológica associada com a tumorigénese da próstata. Os resultados deste estudo também indicam que a combinação de dados GWAS e microarray pode ser uma abordagem mais eficaz do que usar apenas a análise dos conjuntos de dados individuais, e podem ajudar a refinar a identificação de genes candidatos e /ou funções envolvidas no desenvolvimento do tumor.

Informações de Apoio

Tabela S1.

doi: 10.1371 /journal.pone.0006511.s001

(0,83 MB PDF)

Tabela S2.

doi: 10.1371 /journal.pone.0006511.s002

(0.07 MB XLS)

Tabela S3.

doi: 10.1371 /journal.pone.0006511.s003

(0,33 MB XLS)

Tabela S4.

doi: 10.1371 /journal.pone.0006511.s004

(0,33 MB XLS)

Deixe uma resposta