PLOS ONE: Rede Interação SNP-SNP nos genes angiog�ese associada com o cancro da próstata Aggressiveness

Abstract

A angiogênese foi mostrado para ser associado com o desenvolvimento de câncer de próstata. A maioria dos estudos de câncer de próstata com foco em polimorfismos de nucleotídeo único individuais (SNPs), enquanto interações SNP-SNP são sugeridas ter um grande impacto sobre a desvendar o mecanismo subjacente da doença complexa. Usando 1.151 doentes com cancro da próstata nos marcadores de cancro de susceptibilidade genética (MEGC) conjunto de dados, foram avaliados 2.651 SNPs nos genes associadas com angiogénese agressividade do cancro da próstata. interações SNP-SNP foram avaliadas, principalmente, usando a abordagem de dois estágios aleatórios Florestas além multivariada Adaptive Regressão Splines (TRM) no grupo MEGC, e em seguida foram reavaliados no grupo Moffitt com 1.040 pacientes. Para os pares de genes identificados, avaliação cruzada foi aplicado para avaliar as interacções de SNP em ambos os grupos de estudo. Cinco interações SNP-SNP em três pares de genes (

MMP16 + ROBO1

,

MMP16 + CSF1

, e

MMP16 + EGFR

) foram identificados para ser associado com câncer de próstata agressivo em ambos os grupos . Três pares de SNPs (rs1477908 + rs1387665, rs1467251 + rs7625555 e rs1824717 + rs7625555) estavam em

MMP16 Comprar e

ROBO1

, um par (rs2176771 + rs333970) em

MMP16 Comprar e

CSF1

, e um par (rs1401862 + rs6964705) em

MMP16

e

EGFR

. Os resultados sugerem que

MMP16

pode desempenhar um papel importante na agressividade do câncer de próstata. Ao integrar nossas novas descobertas e literatura biomédica disponível, uma rede de interação gene hipotético foi proposto. Esta rede demonstra que nossas interações SNP-SNP identificados são biologicamente relevante e mostra que o EGFR pode ser o hub para as interações. Os resultados fornecem informações valiosas para identificar combinações genotípicas em risco de desenvolver câncer de próstata agressivo e melhorar a compreensão da etiologia genética da angiogênese associada com a agressividade do câncer de próstata

Citation:. Lin HY, Amankwah EK, Tseng TS, Qu X , Chen DT, Parque JY (2013) SNP-SNP Rede Interação em Genes angiog�ese associada com o cancro da próstata agressividade. PLoS ONE 8 (4): e59688. doi: 10.1371 /journal.pone.0059688

editor: Xiaoning Qian, University of South Florida, Estados Unidos da América

Recebido: 27 de agosto de 2012; Aceito: 17 de fevereiro de 2013; Publicação: 03 de abril de 2013

Direitos de autor: © 2013 Lin et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi apoiada pela American Cancer Society (IRG-93-092-14, PI: WJP /H.); e do Instituto Nacional do Câncer (R01CA128813, PI: JYP). EKA é apoiado por uma bolsa de prevenção do câncer do Instituto Nacional do Câncer (R25T CA147832). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

contas de câncer de próstata para 29% da incidência de câncer e 9% das mortes por câncer e é o câncer mais comum ea segunda causa de morte por câncer em homens americanos em 2012 [1]. O câncer de próstata tem uma heterogeneidade clínica substancial. Médicos, portanto, muitas vezes, têm dificuldade em distinguir entre pacientes que irão desenvolver tumores indolentes e agressivos no momento do diagnóstico de cancro da próstata [2]. Para pacientes com cancro da próstata, com um baixo risco, gestão e tratamento conservador são recomendadas porque pode ser observado um curso indolente durante um longo período de tempo. Várias características (tais como antígeno específico da próstata, estágio clínico e grau do tumor) foram usados ​​para classificar os pacientes de alto risco que necessitam de terapêutica imediata e os pacientes de baixo risco que necessitam de tratamento conservador. Ao usar os recursos existentes, cerca de 20% desses pacientes com câncer de próstata de baixo risco morreu devido a tratamento conservador [3]. Assim, existe uma necessidade urgente para a identificação de biomarcadores, a fim de melhorar a precisão da previsão da agressividade do cancro da próstata.

A angiogénese é um processo biológico que envolve a divisão e migração de células endoteliais, resultando na formação de microvasculatura [4], [5]. A formação de vasos sanguíneos é importante para o desenvolvimento de órgãos durante a embriogénese e continua a contribuir para o crescimento de órgãos após o nascimento. Na idade adulta, a maioria dos vasos de sangue permanecerem quiescentes e a angiogénese está limitado ao ovário de bicicleta e na placenta durante a gravidez [4], [5], [6]. No entanto, as células endoteliais manter a sua capacidade de se dividir rapidamente em vasos sanguíneos em resposta a estímulos fisiológicos, tais como a hipoxia, angiogénese e é reactivado durante a cicatrização de feridas e reparação de [4], [5], [7]. O processo de angiogénese pós-natal é regulada por uma interacção contínua (que estabelece um equilíbrio) de estimuladores tais como o factor de crescimento endotelial vascular (VEGF), factor de crescimento de fibroblastos básico (bFGF), factor de crescimento epidérmico (EGF), interleucinas (IL), transformando o factor de crescimento beta (TGF-β), fator de necrose tumoral alfa (TNF-α), derivado de plaquetas do factor de crescimento (PDGF), e as metaloproteinases de matriz (MMP) e inibidores tais como a endostatina, plaquetas fator-4, tumastin, trombospondina-1, inibidor-1 do activador de plasminogénio e angiostatina [4], [5], [6], [7], [8]. No entanto, em muitas doenças, incluindo o cancro da próstata, o equilíbrio entre estimuladores e inibidores é inclinada para favorecer estimuladores, resultando em um “interruptor angiogénico” [9], [10]. O chamado “switch angiogênico” pode resultar de mudanças nos níveis de expressão dos genes na via de angiogênese.

Polimorfismos de nucleotídeo único (SNP) em genes de angiogênese pode alterar a expressão genética e influenciar o processo de angiogênese na próstata o crescimento do câncer e tumor inibida em modelos animais [11], [12]. De facto, vários SNPs em genes de angiogénese que afectam a expressão de genes foram identificados. Estas variantes podem potencialmente contribuir para a variação inter-individual no risco e na progressão de tumores da próstata [13]. Além disso, a angiogénese é mostrado para ser associado com a classificação de Gleason, estádio do tumor, progressão, metástase e sobrevivência entre os doentes com cancro da próstata [14], [15].

Embora o número de estudos para avaliar o papel de SNPs em genes de angiogénese é limitado, vários dos estudos apoiam a associação entre a angiogénese e a agressividade do cancro da próstata. Até agora, os resultados de vários genes candidatos e estudos de associação em todo o genoma (GWA) sugerem que os SNPs na via de angiogénese pode ser importante na progressão do cancro da próstata e da agressividade. Nos estudos de genes candidatos,

VEGF

-1154A e -634C alelos foram associadas com um risco aumentado de o grau do tumor superior [16]. Jacobs

et al

. (2008) avaliaram 58 SNPs em nove genes angiogênese e descobriu que três SNPs correlacionados (rs1477017, rs17301608 e rs11639960) no

MMP2

foram associados com câncer de próstata em geral e avançada [17]. Além disso, os homens com a

IL-10

819 genótipo TT tendem a ter um maior risco de desenvolver um câncer de próstata de alto grau [18]. Em um estudo GWA, Thomas

et al.

Observou que um SNP nonsynonymous (rs4072111) que muda uma serina para prolina no

IL-16

foi significativamente associada com um risco aumentado de câncer agressivo [ ,,,0],19]. Outro estudo GWA observadas associações significativas entre o câncer de próstata agressivo e três SNPs intergênicas (rs11199874, rs10749408 e rs10788165) que abrangem uma região de 590 kb no cromossoma 10q26 que engloba

FGFR2

, um gene de angiogênese [20]. Penney observado associações com mortalidade de SNPs em

IL-18

(rs360729 e rs243908) e

IL-11

(rs12709950), em sua primeira fase de verificação, mas nenhum foi replicado na segunda fase digitalizar [21].

a fim de avaliar exaustivamente variações genéticas nos genes associadas com angiogénese agressividade do cancro da próstata, foram examinados os efeitos de ambos os SNPs individuais e interacções SNP-SNP. A maioria dos estudos atuais estão focados em avaliar os efeitos individuais SNP; No entanto, as associações de um-para-um, pode não ser suficiente para explicar a complexidade da causalidade doença. Recentemente, foi estabelecido que as interações gene-gene /SNP-SNP pode ter um impacto maior sobre a causalidade inauguração de doenças complexas [22], [23], [24], [25]. Pure interações SNP-SNP, ou seja, aqueles com menor ou nenhum efeito SNP individuais significativas, foram relatados em várias doenças, tais como câncer de mama [26], [27], o câncer de próstata [28], e artrite reumatóide [29].

Para superar os desafios em dados de alta-dimensional, que procurou interações SNP-SNP utilizando a abordagem TRM, um de dois estágios Florestas aleatórios mais multivariada Adaptive Regressão Splines (MARS). estudos convencionais usam um modelo aditivo para SNPs, e busca de interações SNP de pares meio de regressão logística. Esta abordagem não é suficiente porque uma suposição modelo aditivo pode não ser válida. Tem sido demonstrado que a selecção do modelo genético tem um grande impacto sobre o poder de detecção de associações [28]. Em alguns estudos, interações SNP puros são negligenciados porque apenas SNPs com um efeito significativo principal ou marginal são levados em consideração. Para melhorar a capacidade de previsão da doença complexa, identificando modelos genéticos apropriados (tais como dominantes e recessivos) e considerando as interações gene-gene nos estudos de associação são sugeridos [30]. Esta abordagem TRM, que tem diferentes modelos de transmissão e as interacções em conta tanto na interacção padrão de rastreio e procura passos, foi demonstrado ser potente em detectar interacções SNP em estudo variação genética em grande escala [31].

materiais e Métodos

Dois grupos foram utilizados neste estudo. O grupo MEGC foi usado como o conjunto de dados primários para identificar interacções SNP-SNP associados com a agressividade do cancro da próstata. Os resultados significativos identificados nos dados MEGC foram então re-avaliada utilizando os dados Moffitt. Todos os indivíduos em nossa análise foram homens com ascendência europeia, porque estavam disponíveis dados sobre os homens com ascendência europeia no conjunto de dados MEGC. Apenas uma variável demográfica comum, a idade no momento da inscrição, estava disponível em dois grupos de estudo. No entanto, devido à diferença desenho do estudo, as variáveis ​​de idade na inclusão nos dois grupos de estudo não são comparáveis. Para os pacientes com câncer de próstata, a data de inscrição foi antes do diagnóstico de câncer de próstata no estudo MEGC (um estudo de caso-controle aninhado dentro de um estudo prospectivo de coorte), mas foi após o diagnóstico de câncer na coorte Moffitt (um caso só estudam) . Assim, nossas análises foram baseadas em resultados não ajustados.

MEGC População

Foram 1.151 pacientes com câncer de próstata (659 agressiva e 492 pacientes não-agressivos) no cancro da próstata MEGC conjunto de dados do genoma . Os participantes foram selecionados a partir da próstata, pulmão, cólon e ovário (PLCO) Rastreio do Cancro Julgamento matrículas entre 1993 e 2003 [32]. Houve 12%, 55% e 33% dos pacientes na faixa etária de 60, 60-69 e = 70 anos de idade, respectivamente, no momento da inscrição do estudo de coorte PLCO. Os dados toda contida aproximadamente 550.000 SNPs genotipados com Illumina HumanHap300 e Illumina HumanHap250. Os pacientes com escores de Gleason ≥ 7 ou ≥stage III foram considerados como tendo câncer de próstata agressivo. Foram identificados genes que codificam proteínas envolvidas ou relacionadas com a angiogénese através de pesquisa literatura publicada (PubMed) e banco de dados via pública (Cancer Genome Anatomy Project, Enciclopédia Kyoto de Gene e Genomas e Gene Ontology). Examinou-se um total de 2,653 SNPs nos genes angiogénese 161. O equilíbrio de Hardy-Weinberg foi examinada no grupo controle (n = 1.101), que não foram incluídos neste estudo. Após a exclusão de dois SNPs sem seguir o equilíbrio de Hardy-Weinberg (p 10

-4), foram aplicados um total de 2.651 SNPs para análises posteriores. desequilíbrio de ligação entre todos os SNPs teste foi examinado com base na r

2, utilizando o Haploview Tagger [33]. Depois de selecionar um SNP em cada par com um forte desequilíbrio de ligação de r

2 . 0,8, um total de 2.177 SNPs foram incluídas para análise de interação

Moffitt População

Foi utilizado o grupo Moffitt na avaliação cruzada de SNPs em genes associados com a angiogénese agressividade do cancro da próstata. A população Moffitt consistiu de uma coorte histórica de 1.040 casos de prostatectomia atendidos no Moffitt Cancer Center, de 1986 a 2003. Foram identificados 437 casos agressivos e 603 casos não-agressivos, com base nos mesmos critérios de agressividade do câncer de próstata, utilizadas no grupo MEGC. Houve 49%, 42% e 8% dos pacientes na faixa etária de 60, 60-69 e = 70 anos de idade, respectivamente, no momento da inscrição do estudo Moffitt. Havia 681 SNPs angiogénese genotipagem utilizando o ensaio Ilumina GoldenGate ™ (Illumina, San Diego, CA). O protocolo do estudo foi aprovado pelo Institutional Review Board da Universidade do Sul da Flórida (Tampa, FL).

Análise dos Efeitos individuais SNP

No grupo MEGC, três modelos de herança (dominante, recessivo e modelo aditivo) foram avaliados através de modelos de regressão logística e, o melhor modelo foi selecionado com base no p-valor mínimo para cada SNP. taxa de descoberta de falsas (FDR) q-valor [34] foi calculado para o ajuste para comparações múltiplas. Os SNPs significativas com um valor de p inferior a 0,05 no MEGC foram então reavaliados no grupo Moffitt. Por razões de consistência, aplicou-se o mesmo modelo genético com o p-valor mínimo no grupo MEGC no grupo Moffitt para cada SNP. Os principais efeitos da SNPs envolvidos nas interações significativas também foram avaliadas.

Cross-avaliação do SNP-SNP Interações

Para explorar interações SNP-SNP, o TRM, de dois estágios aleatórios Florestas mais MARS, foi aplicado [31]. Na primeira etapa da abordagem TRM, os SNPs candidatos superiores foram selecionados com base em minimizar a taxa de erro fora-de-saco (OOB) da classificação através do índice unscaled importância precisão permutação de forma aleatória Florestas. Os SNPs candidatos selecionados na primeira etapa foram exploradas até interações bidirecionais associados com a agressividade do câncer de próstata utilizando MARS. Na primeira etapa, foi utilizado o padrão de 5.000 árvores para construir a primeira floresta e 2.000 árvores para todas as florestas adicionais usando o pacote varSelRF R. O número de preditores seleccionados aleatoriamente foi fixado em 47, a raiz quadrada do número de preditores. Entre todas as florestas montado, o conjunto final de variáveis ​​foi seleccionada com base no menor número de variáveis, cuja taxa de erro é menor do que um erro padrão da taxa de erro mínima OOB. Em MARS, as funções máximas base de 30 foi aplicado para explorar padrões de interação SNP-SNP entre os principais SNPs candidatos. Dez vezes validação cruzada foi utilizado para seleccionar o grau de liberdade cobrado por função de base.

Porque aleatórios Florestas não permite valores em falta, os dados genotipados esporadicamente desaparecidas foram imputados usando imputar versão 2.0 com o HapMap3 CEU + TSI dados como população de referência. Entre 2.177 SNPs para interação de pesquisa, a taxa de dados em falta foi baixa: a taxa de falta mediana foi de 2,6% e máximo foi de 5,6%. A fim de preservar todos os SNPs nas análises, a interacção análises foram com base no conjunto de dados combinada composta dos dados originais genotipados e os dados imputados. Os efeitos SNP individuais foram avaliadas utilizando os dados originais.

A abordagem TRM não fornece significado variável usando p-valores, de modo que o método bootstrap foi aplicado para a seleção de fatores no modelo final e reduzindo resultados falsos positivos. As frequências de bootstrap de um modelo nulo, não houve associação entre o resultado simulado e os SNPs de teste, foram aplicados para definir o ponto de corte de seleção de variáveis ​​no TRM. Neste modelo nulo, que independentemente gerado um binário variável de resultado com 659 indivíduos em um grupo e 492 indivíduos no outro grupo, o que foi consistente com o estado agressividade no conjunto de dados MEGC. Obtivemos 500 amostras de bootstrap, por amostragem, com a substituição do modelo nulo. Para cada fator identificado (efeitos individuais ou interações), as frequências de falsos positivos com base em 500 amostras de bootstrap foram calculados. O percentil 95% das frequências de bootstrap nos factores de falsos positivos foi de 4,2%. Para fins conservadores, mantivemos apenas aqueles com uma frequência de inicialização superior a 5%. Para facilitar a interpretação, os fatores identificados foram incluídas na regressão logística multivariada para a obtenção de odds ratio e seus intervalos de confiança de 95%.

O fluxograma da cruz-avaliação para detectar interacções SNP-SNP é mostrado na Figura 1 . na Etapa 1, as interações SNP-SNP identificados no grupo MEGC, tratado como um conjunto de treinamento, foram reavaliados no grupo Moffitt. Entre os pares de genes MEGC identificados (interações gene-gene), que também tiveram interesse em explorar se outras interações SNP-SNP pode ser detectado no grupo Moffitt independente. Na Etapa 2, que procurou ainda mais todas as possíveis interações de duas vias SNP-SNP dos pares de genes identificados (tais como

MMP16

+

ROBO1

) no grupo Moffitt. Na Etapa 3, as interações SNP identificados a partir do Passo 2 foram reavaliados no grupo MEGC. O melhor “padrões de interação” (como modelo dominante dominante) foram detectados separadamente em ambos os grupos, utilizando MARS. Além disso, verificamos se os modelos de interação identificados foram melhor do que os modelos com os seus principais efeitos somente usando as regressões logística. Os dados foram analisados ​​usando SAS 9.3. TRM foi realizada utilizando MARS 2.0 (Sistemas Salford, San Diego, EUA), e um pacote de R da Floresta aleatória e varSelRF.

Na Etapa 1, interações SNP-SNP identificados no grupo MEGC foram reavaliados na Moffitt grupo. No Passo 2, todas as possíveis interacções bidireccional SNP-SNP de os pares de genes identificados, foram avaliados no grupo Moffitt. Na Etapa 3, as interações SNP identificados a partir do Passo 2 foram reavaliados no grupo MEGC.

Resultados

Nos marcadores de câncer genéticas de susceptibilidade grupo (MEGC), nós avaliaram o efeito principal de 2.651 SNPs angiogênese associados com status de agressividade do câncer de próstata (sim /não), utilizando modelos de regressão logística. Havia 279 SNPs em 75 genes com um valor de p inferior a 0,05 em bruto. Entre estes SNPs, o maior q-valor FDR era 0,053. Isto indica que menos de 15 resultados falsos positivos eram esperados entre os melhores SNPs seleccionados. Estes SNPs significativas foram então avaliados no grupo Moffitt. Entre estes SNPs 279, 160 SNPs estavam disponíveis nos dados Moffitt. Quatro SNPs em três genes (

COL4A3

,

PDGFD

e

ELK3

) foram associados com a agressividade do câncer de próstata em ambos os grupos MEGC e Moffitt com um p-valor inferior a 0,05. Dois SNPs (rs10498214 e rs6436661) no

COL4A3 foram significativamente associados com a agressividade do câncer de próstata. Aqueles com o genótipo CC em comparação com CT e genótipo TT em rs10498214 tendem a ter um maior risco de câncer agressivo de próstata (odds ratio (OR) = 1,63 e valor de p = 0,028 para MEGC; OR = 1,53 e valor de p = 0,047 para Moffitt). O CC e CT genótipo rs6436661 no

COL4A3

foi negativamente associado com a agressividade do câncer de próstata (OR = 0,74, p = 0,040 para MEGC; OR = 0,71, p = 0,034 para Moffitt). Homens com o genótipo CC em rs488753 (

PDGFD

) eram mais propensos a desenvolver câncer de próstata agressivo do que aqueles com o genótipo CT e TT (OR = 1,47, p = 0,035 para MEGC; OR = 1,45, p -valor = 0,031 para Moffitt). O CC e CT genótipo rs2268509 no

ELK3

foi positivamente associado com a agressividade do câncer de próstata (OR = 1,29, p = 0,047 para MEGC; OR = 1,57, p = 0,002 para Moffitt)

as interações SNP nos genes da angiogénese foi avaliada usando a abordagem de TRM no grupo MEGC. Um total de 14 elementos foram seleccionados utilizando a abordagem TRM (Figura 2). Dois efeitos principais de rs3093040 (em

CSF1

) e rs1477908 (em

MMP16

) foram selecionadas, e foram identificadas 12 interações bidirecionais SNP-SNP. Para selecionar fatores no modelo final e validação interna, foi aplicado o método bootstrap. Usando uma frequência de bootstrap de 5% como ponto de corte, foram selecionados os sete principais factores: dois efeitos principais e cinco interagindo pares SNP. Os dois efeitos principais foram os fatores centrais dessas pares SNP. Entre os cinco pares que interagem SNP, rs1477908 foi envolvido em dois pares de SNP e rs3093040 foi incluído nos outros três pares de SNP. Os cinco pares de genes das interações SNP-SNP identificados foram

MMP16 + ROBO1, MMP16 + CSF1, CSF1 + FBLN5, CSF1 + HSPG2

, e

MMP16 + EGFR,

que em uma ordem de classificação com base nas frequências de bootstrap . Como mostrado na Tabela 1, foram incluídos estes factores importantes num modelo logístico multivariável, e todos os factores foram altamente significativas (p-valor gama: 0,015-0,0001). Estes resultados permaneceram semelhantes depois de ajustar a idade (resultados não mostrados).

Para reduzir resultados falso-positivos, o método bootstrap foi aplicado para a seleção de fatores no modelo final. Obtivemos 500 amostras de bootstrap, por amostragem, com a substituição do modelo nulo. Para cada elemento identificado, as frequências de falsos positivos com base nas amostras de bootstrap 500 foram calculados. Os fatores com uma frequência de inicialização superior a 5% foram incluídos no modelo multivariável (Tabela 1).

Embora estes cinco interações SNP-SNP foram significativas no modelo multivariável, nós ainda avaliada se esses pares de SNP foram preditores independentes para a agressividade do câncer de próstata. Os cinco interagindo pares SNP foram montados individualmente em um modelo de regressão logística. Em cada interacção duas vias na Tabela 2, o grupo de referência foi etiquetado como OU = 1. Foi definido OU aqueles com 1 como o grupo de risco e aqueles com OR 1 como o grupo protector. Para facilitar a comparação de padrões de interação SNP entre os dois grupos de estudo, os padrões foram apresentados usando 3 × 3 mesas no suplemento (Tabelas S1, S2, S3). Estes cinco pares de SNP foram significativamente associados com a agressividade do câncer de próstata no grupo MEGC. Em particular, os dois principais interações SNP-SNP foram rs1477908 (

MMP16

) + rs1387665 (

ROBO1

) e rs6994019 (

MMP16

) + rs3093040 (

CSF1

). pacientes com câncer de próstata com a AA + combinação genótipo AG /GG do par SNP de rs1477908 e rs1387665 estavam mais propensos a desenvolver câncer de próstata agressivo (OR = 1,83, p = 0,0002) do que aqueles com a combinação genótipo AA + AA. Os pacientes com o genótipo GG /GA em rs3093040 estavam mais propensos a ter um câncer de próstata agressivo do que aqueles com o genótipo AA, mas este efeito foi significativamente modificado por rs6994019. Entre aqueles com o genótipo GG /GA em rs3093040, os homens com o genótipo GG do rs6994019 estavam mais propensos a desenvolver câncer de próstata agressivo (OR = 2,22, p = 1.7 * 10

-5) do que aqueles com o genótipo AA de rs3093040; No entanto, esta associação positiva não foi significativa para aqueles com o genótipo GT /TT de rs6994019 (OR = 1,36, p = 0,096).

Estes 5 interações importantes SNP-SNP foram ainda avaliados utilizando o grupo Moffitt (Passo 1 da Figura 1). Apenas um SNP-SNP interação de rs1477908 (

MMP16

) e rs1387665 (

ROBO1

) estava disponível no grupo Moffitt. Como mostrado na Tabela 2, observou-se que o grupo de risco elevado de desenvolver cancro da próstata agressivo foi aqueles com o genótipo AA e GG no par de rs1477908 e rs1387665 (OR = 1,39 e p-valor = 0,065) no grupo Moffitt. Os grupos de alto risco selecionados em ambos os grupos são semelhantes: AA + GG e AA + AG /GG de rs1477908 e rs1387665 nos grupos Moffitt e MEGC, respectivamente

Além do MEGC identificadas interações SNP-SNP, exploramos se outras. interações SNP nos pares de genes identificados no grupo Moffitt foram significativamente associados com a agressividade do câncer de próstata. Two-way interações SNP-SNP dos cinco pares de genes identificados (

MMP16 + ROBO1, MMP16 + EGFR, MMP16 + CSF1, CSF1 + FBLN5 e QCA 1 + HSPG2

) foram pesquisados ​​(passo 2, Figura 1). Como mostrado na Tabela 2, um período adicional de oito interacções SNP-SNP foram detectados no grupo Moffitt. Dois interações estavam no par de genes de MMP16 + ROBO1, três estavam no MMP16 + EGFR, um foi em

MMP16

+

CSF1

e dois estavam no QCA 1 + HSPG2. Entre estes oito interações SNP-SNP identificados, seis estavam disponíveis na MEGC; consequentemente, eles foram em seguida re-avaliado (Figura 1, Passo 3).

Observaram-se três pares de genes que tem, pelo menos, uma interacção SNP-SNP com um padrão de interacção semelhante nos dois grupos de estudo. O padrão de interacção semelhante foi definida como as combinações dos genótipos identificados nos dois grupos de estudo, os quais são sobrepostos e com a mesma direcção em termos de risco de cancro da próstata agressividade. Três (rs1477908 + rs1387665, rs1467251 + rs7625555 e rs1824717 + rs7625555) estavam no par de genes de

MMP16

e

ROBO1

. A interação de rs1401862 e rs6964705 estava no

MMP16

e

EGFR

, e outro par de SNP rs2176771 e rs333970 estava no

MMP16

e

CSF1

. Com exceção do par SNP de rs1477908 e rs1387665, dois pares adicionais de SNP (rs1467251 + rs7625555 e rs1824717 + rs7625555) no par de genes de

MMP16

e

ROBO1

foram associados com a agressividade do câncer de próstata. No grupo Moffitt, pacientes com câncer de próstata com a AA + GG /GA genótipo do par SNP de rs1467251 e rs7625555 teve uma chance menor de desenvolver câncer de próstata agressivo do que outras combinações de genótipos no mesmo par de SNP (OR = 0,29, p-valor = 0,024). No grupo MEGC, o grupo de baixo risco foram aqueles com a GA /AA + GG /GA genótipo no mesmo par de SNP (OR = 0,59, p = 0,002). Tal como para a interacção de rs1824717 e rs7625555, o grupo de alto risco de cancro da próstata agressivo no grupo MEGC foi a combinação de AA e AA genótipo desse par de SNP (OR = 1,91, p-valor = 0,009), e o grupo de alto risco no conjunto Moffitt foi a combinação de AA /AG e GA genótipo /AA (OR = 1,59, p = 0,008). Com o

MMP16

e

EGFR

, os homens com a combinação de genótipo GA /AA e AA em um par SNP de rs1401862 e rs6964705 tendiam a ser menos provável (OR = 0,58, p-valor = 0,011) tem câncer de próstata agressivo do que outras combinações genotípicas dos pares SNP no grupo MEGC. Observou-se também o padrão de interacção significativa deste par SNP no grupo Moffitt.

Os principais efeitos de SNPs envolvidas nas interacções significativas são mostrados na Tabela 3. Estes efeitos principais não pode ser replicado dentro dos dois grupos de estudo . Entre os 16 SNPs envolvidos nas interações SNP-SNP associados com a agressividade do câncer de próstata no grupo MEGC, 13 SNPs tinha um valor-p inferior a 0,05 nas análises univariadas. Entre os 16 SNPs no grupo Moffitt, única rs17172446 tinha um valor de p inferior a 0,05. Nós também confirmou que os modelos de interação listadas na Tabela 2 foram melhores do que o principal efeito apenas modelos (resultados não mostrados).

Discussão

Nossas descobertas identificaram cinco interações SNP-SNP nos genes associadas com angiogénese agressividade do cancro da próstata no grupo MEGC utilizando a nova abordagem TRM. Cinco interações altamente significativas SNP-SNP (valor-p = 2 × 10

-5 a 6 × 10

-4) com um médio a grande tamanho do efeito foram detectados com sucesso, mesmo com um relativamente pequeno tamanho da amostra de aproximadamente 1.000 . As odds ratio destas interações SNP foram categorizadas a partir de um meio (OR≥1.5) para grande tamanho do efeito (OR≥2) [35]. O impacto clínico das interacções SNP-SNP pode ser maior do que para os SNPs identificados em estudos GWA. O poder de predição de risco de câncer para os SNPs identificados em estudos GWA é limitado com a mediana per-alelo OR de 1,22 com base em uma revisão recente [30].

Nossas interações gene-de genes identificados podem ser biologicamente relevantes com base na análise de rede. As interações entre os pares de genes cinco (MMP16 + Robo1, MMP16 + QCA 1, MMP16 + EGFR, CSF1 + FBLN5 e QCA 1 + HSPG2) foram demonstrados usando cross-avaliação nos grupos MEGC e Moffitt. Particularmente, o ex três pares de genes tiveram pelo menos uma interação SNP-SNP com um padrão de interação semelhante nos dois grupos de estudo. Entre os pares de genes identificados,

MMP16

e

CSF1

estavam envolvidos em vários pares de genes que interagem, assim, uma associação de rede estava implícito. A fim de verificar a existência de relevância biológica das associações e explorar o mecanismo funcional subjacente de nossas interações gene-de genes identificados, foi proposta uma rede de regulação genética hipotética (Figura 3). Esta rede de interação genética foi gerado com base em interações proteína-proteína publicados em

Homo Sapiência

usando o banco de dados MetaCore de GeneGo Inc. A interligação de redes de processos bioquímicos dos genes identificados mostrou que as seis proteínas foram envolvidos direta ou indiretamente no

EGFR

via de sinalização. É sugerido que estes genes podem ser co-regulado por vários factores de transcrição em conjunto, tal como E2F1, STAT1, ESR1, SP1, e AP-1, e um receptor (integrina). A proteína mais proeminente na rede foi EGFR, que interagiram com os restantes cinco proteínas que estavam envolvidos na angiogênese

aFive interagindo pares de genes:.

MMP16 + ROBO1, MMP16 + CSF1, CSF1 + FBLN5, CSF1 + HSPG2

, e

MMP16 + EGFR.

b Nodes representa as proteínas, e as linhas entre os nós indicam interações entre proteínas. linhas verdes e vermelhos representam os efeitos positivos e negativos, respectivamente. As proteínas dos genes identificados são indicados por um circulo em torno dos nodos.

O receptor do factor de crescimento epidérmico (EGFR) é uma proteína crítico na proliferação de células epiteliais e está envolvido na oncogénese. O EGFR se liga ao factor de crescimento epidérmico (EGF) e tem sido demonstrado que desempenham um papel importante na regulação do crescimento celular e a função da próstata [36], [37], [38]. Nossos resultados também foram apoiados por um estudo microarray integrativa recente. Wang

et al.

Realizaram uma meta-análise de 10 conjuntos de dados de próstata expressão microarray câncer para identificar as assinaturas comuns a ambos os níveis de genes e vias associadas ao risco de câncer de próstata, e a via EGFR foi encontrado em nove conjuntos de dados ,”Wang

et al.

performed a meta-analysis of 10 prostate cancer microarray expression datasets to identify the common signatures at both the gene and pathway levels associated with prostate cancer risk, and the EGFR pathway was found in nine datasets ,,,0

Deixe uma resposta