PLOS ONE: Caminho-Based Análise Usando Genome-wide Dados Associação de um coreano não-pequenas células do pulmão Cancer Study

Sumário

análise baseada em Caminho, usado em conjunto com técnicas de estudo de associação do genoma (GWAS), é uma ferramenta poderosa para detectar padrões sutis, mas sistemáticas no genoma que podem ajudar a elucidar doenças complexas, como cancros . Aqui, afastou-se polimorfismos genéticos em um único lócus e examinaram como vários sinais de associação pode ser orquestrada para encontrar caminhos relacionados a suscetibilidade ao câncer de pulmão. Foram utilizados dados de matriz polimorfismo de nucleotídeo único (SNP) a partir de 869 cancro do pulmão de células não pequenas (NSCLC) casos de um GWAS anterior no Centro Nacional do Câncer e 1.533 controles do projeto Resource Associação Coreana para a análise baseada em caminho. Após o mapeamento polimorfismos de nucleotídeo único de genes, considerando sua região de codificação e elementos reguladores (± 20 KBP), regressão logística multivariada de aditivo e modelos genéticos dominantes foram montados contra o estado da doença, com ajustes para idade, sexo e tabagismo. estatísticas da via foram avaliados utilizando Gene Set Análise de Enriquecimento (GSEA) e Adaptive Posto truncado produto (ARTP) métodos. Entre 880 vias, 11 apresentaram estatísticas relativamente significativos em comparação com os nossos controlos positivos (P

GSEA≤0.025, falsa rate≤0.25 descoberta). vias candidatos foram validados utilizando o método ARTP e semelhanças entre as vias foram computados uns contra os outros. As vias mais bem classificados foram

ABC Transporters

(P

GSEA 0,001, P

ARTP = 0,001),

VEGF via de sinalização

(P

GSEA 0,001, P

ARTP = 0,008),

G1 /S check Point

(P

GSEA = 0,004, P

ARTP = 0,013), e

Sinais NRAGE morte através de JNK

(P

GSEA = 0,006, P

ARTP = 0,001). Nossos resultados demonstram que a análise via pode lançar luz sobre pesquisa de pós-GWAS e ajudar a identificar potenciais alvos para a suscetibilidade ao câncer

Citation:. Lee D, Lee GK, Yoon KA, Lee JS (2013) Caminho-Based Análise Usando dados Associação de um coreano não-pequenas células do pulmão Cancer Study Genome-wide. PLoS ONE 8 (6): e65396. doi: 10.1371 /journal.pone.0065396

editor: William C. S. Cho, a rainha Elizabeth Hospital, Hong Kong

Recebido: 05 de fevereiro de 2013; Aceito: 24 de abril de 2013; Publicação: 06 de junho de 2013

Direitos de autor: © 2013 Lee et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. A pesquisa foi apoiado pela bolsa de pesquisa National Cancer Center 1210360. os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:. os autores declararam que nenhum concorrente existem interesses

Introdução

o cancro do pulmão é uma das principais causas de mortalidade por cancro na Coréia e em todo o mundo [1] – [3].. Entre os diversos tipos histológicos de câncer de pulmão, mais de 70% dos cancros do pulmão coreanos são cânceres de pulmão não pequenas células (NSCLCs), o principal subtipo sendo adenocarcinoma [4].

Embora as causas da doença pode advir de fatores ambientais, tais como agentes cancerígenos encontrados no fumo do cigarro e a inalação de produtos químicos tóxicos, nos esforços para determinar a etiologia da doença, os pesquisadores avaliaram a diversidade genética dos indivíduos. Vários estudos genômicos de associação (GWASs), que incidem sobre a verificação de SNPs associados à doença em todo o genoma, têm demonstrado com sucesso possível susceptibilidade loci câncer de pulmão ao longo da última década. A maioria destes GWASs foram baseados em populações europeias e americanas e suspeitos notáveis ​​identificados foram 5p15 (hTERT-CLPTM1L) [5], [6], 6p21 (BAT3-MSH5) [7], e 15q25 (CHRNA 3-5) [8 ] – [10]. Em GWAS anterior envolvendo 1.425 pacientes com NSCLC e 3.011 controles de Coreia, que relatou que um locus de novela, 3q29, e um local previamente relatado em indivíduos de ascendência europeia, 5q15, foram associados com o risco de câncer de pulmão em população coreana [11].

Apesar da identificação bem sucedida destes loci de susceptibilidade a doença utilizando GWASs, acredita-se que eles explicam apenas uma pequena proporção da hereditariedade estimada [12]. GWASs comparar meio milhão de milhões de marcadores de uma só vez e variantes com associações modestas são susceptíveis de ser negligenciada após a correcção de testes múltiplos [13]. Pela sua natureza, é altamente improvável que uma única variante está associada a uma doença complexa, como o cancro. Acredita-se que as variantes de baixa penetrância ao longo do genoma vai explicar melhor a biologia em questão [14]. Para compensar as deficiências do GWAS, em vez de confiar em um nível de significância do genoma rigorosa, métodos alternativos para melhorar o poder, como o uso de combinações de marcadores SNP [15] – [20], a incorporação de genótipos imputados e informações linkage [21] – [23], e, mais recentemente, abordagens baseadas na via de [24] foram desenvolvidos

abordagens baseadas na via são baseados no princípio de que os genes envolvidos na mesma via funcional interagir com cada um. outro e constituem uma rede, de modo que as suas associações de doenças estão interligados [25]. análises atuais baseadas em via de ter sido inspirado principalmente a partir de análise de dados de microarrays expressão gênica. Com base no conhecimento biológico prévio, análise de conjunto de enriquecimento de gene (GSEA) [26] medidas como os sinais associação muito mais são enriquecidas em um conjunto definido de genes. Porque GSEA requer dados de microarranjos como entrada, vários grupos sugeriram modificações no algoritmo original de incorporar dados GWAS [27] – [30].

No presente estudo, foi utilizada a análise de caminho baseado no GSEA sugerido por Wang et al. [24] com nosso cancro do pulmão coreana dados GWAS anterior, passando de 869 casos e 1.533 controles, com a esperança de encontrar loci susceptibilidade adicional e de obter insights sobre a patogênese subjacente (Figura 1). Pathways mostrando alta significância estatística foram validados usando outro método baseado em via chamada classificação adaptativa produto truncado (ARTP) [31]. Em contraste com GSEA, ARTP é um teste de auto-contido [32] que associa directamente genes numa via de doenças e funciona independentemente dos genes fora da via. Relatamos sete vias categorizados em quatro processos celulares que apresentaram associações consistentes com a Korean NSCLC susceptibilidade.

Materiais e Métodos

Ética Declaração

O estudo foi aprovado pelo Institutional Review Board e do Comité das Korea National Cancer Center de Ética. Amostras de sangue foram coletadas de pacientes com NSCLC que visitaram Cancer Center Korea National e tomou um questionário de saúde voluntário entre maio de 2002 e dezembro de 2005. Para cada amostra de sangue, o consentimento informado por escrito, aprovado pelos membros Institutional Review Board, foi obtido. Todos os exames clínicos foram realizados de acordo com os princípios da Declaração de Helsinki.

Estudo da População

Inicialmente, recrutou 2.441 casos coreano NSCLC e controles (871 casos e 1.570 controles) para este estudo. A maioria das amostras de NSCLC (621 casos) foram compartilhados a partir de um estudo anterior GWA no National Cancer Center Coreia [11], e adicionais 250 pacientes com NSCLC foram recentemente recrutados para genotipagem. Para efeito de comparação, os dados de genotipagem de 1.570 indivíduos de controle sem câncer foram fornecidos pelo projeto Resource Associação Coreana (KARE), um estudo de coorte de base populacional contínuo que vem sendo realizado pela Coreia do Instituto de Nacional de Saúde (Knih) e Centro de Controle e Prevenção de Doenças (KCDC) desde 2007 [33]. Foram aplicados critérios rigorosos de controle de qualidade da amostra (QC), considerando a intensidade do sinal bruto, taxa de genotipagem (≥95%), informação clínica, e estratificação da população para filtrar amostras não qualificados. Especificamente, removemos 19 amostras com qualidade a baixo genotipagem, 18 com informação demográfica insuficiente, e dois com erros de identificação de gênero. Como resultado, 869 casos e 1.533 controles passou o QC e permaneceu para a análise subsequente. Entre 869 histologicamente casos confirmados NSCLC, 623 casos foram adenocarcinomas, mais de 70% dos nossos pacientes com NSCLC, 175 casos foram carcinomas de células escamosas, eo resto eram outros tipos histológicos NSCLC (Tabela 1). Mais de 97% dos indivíduos (n = 2.334) foram genotipados usando Affymetrix Genome-Wide SNP humano matriz 5.0 (Affymetrix, Santa Clara, CA, EUA), eo restante (n = 68) foram genotipados usando Affymetrix GeneChip Humano Mapeamento 500 K matriz Set. Após a genotipagem e fundindo os conjuntos de dados, foram aplicados os seguintes filtros SNP CQ: SNPs com uma frequência menor alelo (MAF) inferior a 5% e call genotipagem taxas inferiores a 95%; Hardy-Weinberg (HWE) teste P-values≤0.0001 foram excluídos da análise posterior.

Caminho Definição de

Foi construída uma lista de definições da via baseado em três principal via publicamente disponível bases de dados: especificamente, 217 conjuntos de genes de BioCarta [34], 186 de Kyoto Encyclopedia of genes e Genomas (KEGG) [35], e 430 de Reactome [36]. Também incluímos vários conjuntos de genes via curadoria de SABiosciences [37], Sigma-Aldrich [38], a transdução do Conhecimento do Meio Ambiente da revista Science [39], e via de sinalização de banco de dados (SPAD) da Universidade de Kyushu [40] para cobrir um total de 880 vias biológicas (Apêndice S1).

para medir o desempenho da nossa análise e para definir uma linha de base, nós também compilou seis percursos personalizados a partir de genes de susceptibilidade ao câncer de pulmão previamente relatados. Em primeiro lugar, nós retirados nove oncogenes (IL1B, MTHFR, AKAP9, CAMKK1, SEZ6L, FAS, FASLG, TP53 e TP53BP1) a partir de um estudo realizado pelo Consórcio Internacional Lung Cancer (ILCCO) [41]. De acordo com o estudo ILCCO, variantes genéticas com forte evidência de uma associação com o risco de câncer de pulmão pertencia a genes de várias vias relacionadas com o cancro, como a inflamação (IL1B), o metabolismo do folato (MTHFR), função reguladora (AKAP9 e CAMKK1), celular adesão (SEZL6) e apoptose (FAS, FASL, TP53, TP53BP1 e BAT3). Além disso, adotamos 11 NSCLC genes mutação condutor (EGFR, KRAS, ErbB2 ALK, BRAF, PIK3CA, AKT1, MAP2K1, reuniu-se, ROS1 e ARN) a partir de uma revisão por Pao e colegas [42], [43]. À luz da sua avaliação sobre a forma como esses genes afetam a proliferação de células de câncer e sobrevivência, incluímos esses genes clinicamente importantes como base para os nossos controlos positivos. Finalmente, nós adicionamos genes cobertas de loci de suscetibilidade ao câncer de pulmão relatada em vários estudos GWA anteriores: C3ORF21 e TP63 de 3q28-29 [11], [44], TERT e CLPTM1L de 5p15 [5], [7], BAT e MSH5 de 6p21 [7], CHRNA5, Chrna4, e CHRNA3 de 15q25 [8] – [10], e genes de reparação de ADN (XRCC1, RRM1, ERCC1) [45]. Nós categorizados genes por localização ou por função e projetados seis combinações diferentes de como controlos positivos de câncer de pulmão relacionados com conjuntos de genes (Tabela 2)

SNP Associação e Mapeamento

regressão logística.

multivariada de aditivo e modelos genéticos dominantes foram montados contra o estado da doença, com ajustes para idade, sexo e tabagismo, para captar com precisão os sinais de associação SNP. Porque estávamos interessados ​​principalmente nos efeitos genéticos de ter um alelo variante e MAF foi geralmente baixa para nossa piscina estudo, foram excluídos do modelo genética recessiva da nossa análise.

Além disso, 20 kbp a montante do 5′- final e 20 kpb a jusante da extremidade 3 ‘foram considerados como sendo parte de um gene, de modo a incluir a região de codificação e elementos de regulação. O SNP mais significativamente associada a uma região do gene foi escolhido para representar toda a área gene. Somente conjuntos de genes com um mínimo de 20 genes e um máximo de 200 genes foram considerados na análise subsequente.

Análise Caminho

Dividimos a análise de caminho para processos de seleção e validação de duas etapas. Em primeiro lugar, utilizou-se uma adaptação do método de SNP GSEA desenvolvido por Wang et ai. [24] para rastrear vias candidatos associados com risco NSCLC. Em seguida, utilizando o algoritmo ARTP desenvolvido por Yu et al. [31], que confirmou as significâncias estatísticas das vias candidatos.

Gene Set Enriquecimento Análise (GSEA).

Para cada gene, o SNP com a mais alta estatística de teste (coeficiente de estatística t de regressão logística em nosso caso) foi designado para representar o gene. Para todos os genes N, estatísticas de associação foram ordenados do maior para o menor (r

1, r

2, …, r

N), e uma ponderada Kolmogorov-Smirnov-like (KS) em execução pontuação enriquecimento soma (ES) da via S com n

genes P foi calculado a partir da lista de classificação dos genes [24].

uma vez que o cálculo do ES (S) foi com base em uma estatística máxima, vias com grande número de genes tinha vantagens definitivas sobre as vias menores. Para comparar estatísticas entre percursos de diferentes tamanhos, uma pontuação normalizada enriquecimento (NES) foi calculado da seguinte forma:

Finalmente, porque estávamos a testar várias hipóteses de uma só vez, avaliamos a relação de falsos positivos esperados pelo cálculo da falsa descoberta taxa (FDR).

para o nosso GSEA, 1.000 permutações fenótipo foram utilizados para estimar a significância estatística de cada gene.

Adaptive Posto truncado produto (ARTP).

para todos L em genes de uma via, o melhor valor P SNP de cada gene foi classificada do menor para o maior (P

1, P

2, …, P

G), e o produto de menor K P- valores em uma via foi calculada como se segue:

Normalmente, o ponto de truncagem K deve ser determinada antes de usar a estatística RTP. No entanto, o método ARTP sugerido por Yu et al. [31], que combina as estatísticas derivadas do conjunto de dados observados, faz com que seja possível estimar o valor P ajustado independentemente do tamanho da via. Para a nossa análise ARTP, os mesmos 1.000 permutações foram usadas para avaliar a importância de cada percurso candidato.

Pathway Sobreposição Análise

Para comparar semelhanças entre as vias, as frações de sobreposição entre as vias foram calculados, usando a seguinte equação:

Suponhamos que a e B são as vias, a seguir:

usada esta equação para lidar com uma situação em que um caminho é um subconjunto do outro. Assim, 100% de similaridade indica que um caminho é um subconjunto do outro, a menos que as duas vias são as mesmas.

Resultados

características demográficas

As características demográficas da população do estudo são apresentados na Tabela 1. na análise univariada, sexo e idade apresentaram significância estatística (P 0,05), enquanto tabagismo não (P = 0,16). No entanto, todas as três características demográficas (sexo, idade e tabagismo) mostrou associação estatisticamente significativa (P 0,001) nas análises multivariadas. Assim, foram incluídos todos os três como ajustar co-variáveis ​​durante a análise de associação de regressão logística. Adenocarcinoma foi o tipo histológico predominante, representando mais de 70% de nossas amostras de NSCLC, uma composição consistente com o perfil geral coreana população NSCLC [4].

A genotipagem e Mapeamento

Depois de aplicar o SNP critérios de CQ, incluindo MAF e HWE, 440,530 SNPs genotipados foram filtrados até 300,410 SNPs. A partir deles, nós removemos SNPs residente em desertos de genes e os restantes 147,970 SNPs foram mapeados com êxito para a nossa definição de genes (14,089 genes). Porque mapeado SNPs localizados dentro de 20 kpb a jusante e a montante de uma região codificante como um gene, alguns SNPs localizados entre os genes foram contadas duas vezes.

Testes de Controlo Positivo

Como se mostra na Tabela 2, a nossa os resultados dos testes de controlo positivo apresentou uma gama de valores nominais de P, 0,014-0,42, e uma gama de FDRs, 0,055-0,408, para o aditivo e modelos dominantes no método GSEA. Para o método ARTP, Os valores de p eram mais fortes e variou ,001-,035 para o aditivo e modelos dominantes. Assim, a partir dos testes de controlo positivo, foram utilizados os seguintes critérios de filtragem para o passo inicial descoberta caminho usando o método GSEA: P-values≤0.025 e FDRs≤25% no aditivo ou modelo genético dominante foram selecionados para análise posterior. Para o método ARTP, P-values≤0.01 foram considerados dignos de nota.

Pathway Analysis

Entre 880 vias que examinamos utilizando o método de GSEA, 11 passaram os critérios de filtragem controlo positivo (Tabela 3) . Os 11 caminhos candidatos foram examinados ainda mais usando o método ARTP e seus valores P were≤0.01 no aditivo ou modelo dominante, mais uma vez confirmando que estas vias teve associação estatisticamente significativa com NSCLC, contra nossos controles positivos. No entanto, para o

Activação do pré-replicativo

Complexo, verificou-se que o valor P altamente significativa do modelo aditivo no método GSEA diferia de um P-valor insignificante no modelo aditivo no método ARTP , por isso, que o exclui do posterior análise. Examinando vias candidatos em profundidade a seguir os resultados dos ensaios de similaridade, como mostrado na Figura S1, encontramos várias vias que se assemelhava a um ao outro. Por exemplo, o

G1 /S de transição

via era um subconjunto do

Ciclo Celular

via, e quando uma relação inclusiva foi encontrado, eliminou a super, o qual, neste caso, era

Ciclo celular

via. Da mesma forma, o

Sinais NRAGE morte através de JNK

via era um subconjunto do

morte celular da sinalização via NRAGE, FNIR e NADE

via, que foram sub-grupos da

P75 NTR Receptor Mediated sinalização

via. Assim, nós removemos dois superconjuntos do

Sinais NRAGE morte através de JNK

via. Os restantes sete caminhos candidatos foram classificados em quatro tipos de processos celulares: transporte de membrana (

transportadores ABC

), sinalização intracelular (

VEGF via de sinalização

,

inositol fosfato Metabolismo

,

fosfatidilinositol Sistema de Sinalização

), ciclo celular (

G1 /S check Point

,

G1 /S Transition

), e da morte celular programada (

Sinais NRAGE morte através JNK

). Notavelmente, o

G1 /S Check Point

percurso teve o menor número de genes (25 genes), mantendo a significância estatística, tanto no GSEA e métodos ARTP (modelo dominante). Usando estatísticas GSEA como estatísticas primárias e ARTP como medidas secundárias, o

ABC Transporters

conjunto de genes apresentou a melhor associação de risco NSCLC entre os sete candidatos finais com um GSEA nominal P-value 0,001, FDR = 0,122, e ARTP P-value = 0,001 (ambos modelo dominante). O segundo melhor foi o

VEGF via de sinalização

com um GSEA nominal P-valor. 0,001, FDR = 0,107 e P-valor ARTP = 0,008 (ambos modelo dominante)

para vias notáveis ​​em cada categoria de processo celular, associações SNP dentro de conjuntos de genes foram ainda examinados (Tabela 4, S1, S2 e S3). Para além da

ABC Transporters

, que era apenas um conjunto de bombas de proteína transmembranar, diagramas de rede de vias notáveis ​​foram desenhados como se mostra nas Figuras S2, S3, e S4. Os resultados adicionais para a análise de caminho em cada subconjunto de acordo com os tipos histológicos de câncer de pulmão são descritos no Apêndice S2.

A comparação com Cancer Study outro pulmão

Em um gene expresso diferencialmente estudar com tecido pulmonar normal, realizado por Falvella et ai. [46], uma assinatura gene-expressão que consiste de 85 genes foi sugerida para distinguir pacientes de adenocarcinoma de pulmão de outros pacientes com câncer. Adotamos 67 genes que estavam disponíveis no NCBI construção genoma humano 36 e aplicado o mesmo procedimento análise de caminho. Usando nossos dados de genotipagem, associações SNP foram mapeados com êxito para 54 genes. Com o conjunto de genes incluindo esses 54 genes, o método GSEA mostrou P-valores nominais de 0,001 para ambos os valores FDR de 2,6% de aditivo e modelos dominantes e e 11,7% para o aditivo e modelos dominantes, respectivamente. Da mesma forma, o método ARTP rendeu valores P de 9,99 × 10

-4 e 3,00 × 10

-3 para o aditivo e modelos dominantes para este conjunto de genes, respectivamente. Este resultado confirmou novamente que a nossa análise baseada em via era legítimo e coerente com outros estudos do cancro do pulmão, envolvendo a análise de expressão genética baseada em mRNA. Os resultados da análise de associação de SNPs em 54 genes foram apresentados na Tabela S4.

Discussão

Os recentes avanços na tecnologia de alto rendimento SNP genotipagem geraram enormes quantidades de dados de genotipagem e levaram a valiosa resultados referentes variantes genéticas comuns associados com várias doenças através GWASs. No entanto, os relatórios têm-se centrado principalmente em uma pequena porção de associações que se qualificam para o nível de significância do genoma ea maioria das associações, com poderes estatísticos moderados, são difíceis de interpretar. Usando o conhecimento biológico prévio, abordagens de associação à base da via recentemente abriu um novo caminho para examinar associações entre os resultados GWAS e redes moleculares complexas. análise baseada em Caminho incorpora dados de associação para genes funcionalmente relacionados e os traduz em informações susceptibilidade à doença.

Neste estudo, foi utilizada uma mistura de contraste via análises usando o cancro do pulmão coreana dados GWAS, composta de 869 casos NSCLC e 1,533 controlos. Nós relatado anteriormente associações significativas entre polimorfismos nos cromossomos 3q28, 3q29 e 5p15 e suscetibilidade ao câncer de pulmão coreano [11], [44]. Em primeiro lugar, usou um método baseado em GSEA com dados da matriz SNP do genoma para preliminarmente tela por percursos candidatos associados à suscetibilidade ao câncer de pulmão. Entre 11 vias candidatos, foram selecionados 7 que também foram confirmados pelo método ARTP. Quatro vias de sinalização celular,

VEGF via de sinalização

,

G1 /S Check Point

,

Sinais NRAGE morte através de JNK

, e

ABC Transporters,

foram altamente enriquecido com sinais associados com o risco de câncer de pulmão. Ao contrário GWASs, P-valores para SNPs associados com genes eram geralmente moderadamente significativa e apenas alguns deles seriam elegíveis no chamado nível de significância do genoma. Isto indicou que as estatísticas da via enfatizou os efeitos de padrões sutis, mas sistemáticas, dentro de um gene definido em vez de algumas associações de pico dentro de um conjunto de genes.

membros Gene da cassete de ligação a ATP (ABC) da família transportador tem funções essenciais no transporte de vários substratos, tais como iões, açúcares, lípidos e proteínas, sob condições fisiológicas. Por muitos anos, os pesquisadores descobriram que o

ABC Transporters

desempenham papéis significativos na quimioterapia do cancro e são responsáveis ​​pela resistência a múltiplas drogas (MDR), sob a forma de uma bomba de droga ATP-driven [47]. Acredita-se que a sobre-expressão do

transportadores ABC

reduz os níveis intracelulares de drogas através reforçada efluxo de agentes quimioterapêuticos, resultando em insensibilidade droga, o que pode levar a uma falha de quimioterapia do cancro [48]. Por outro lado,

ABC Transporters

pode também funcionar exportadores agente cancerígeno eficazes, mantendo as células livres de produtos químicos nocivos e substâncias cancerígenas. deficiências prolongadas ou mudanças na expressão gênica destas bombas de proteína transmembrana pode aumentar o risco de câncer potencial. nitrosaminas específicas do tabaco 4- (metilnitrosamino) -1- (3-piridil) -1-butanona (NNK) é um dos mais potentes carcinogéneos do fumo do cigarro que tem sido demonstrado causar o cancro do pulmão em roedores [49], [50 ]. Quando estas toxinas são inalados, o

ABC Transporters

codificado por ABCB1 e ABCC1 efetivamente eliminar essas substâncias cancerígenas dos pulmões. Os investigadores descobriram que os polimorfismos comuns de ABCB1 e ABCC1 pode influenciar o metabolismo e disposição do agente cancerígeno bem estabelecida, NNK, e potencialmente aumentar o risco de câncer de pulmão [51]. Como mostrado na Tabela 4, ABCA4, ABCC1, e ABCC mostraram associação significativa com susceptibilidade ao cancro do pulmão (valores de p 0,0005). Em nossa análise de subgrupo subsequente, sempre-fumantes apresentaram uma associação mais significativa do que nunca fumaram, como mostra a Tabela S5. Assim, é possível modular o risco de câncer de pulmão individual de acordo com polimorfismos genéticos nesses genes através de diferentes funções celulares.

O

VEGF via de sinalização

também classificou alto em nossa análise de caminho. Os membros desta via pode influenciar uma via biológica dependentes de angiogénese, que é um componente crítico da oncogénese. As associações entre polimorfismos genéticos em VEGF /VEGFR e o risco de câncer em desenvolvimento têm sido relatados em vários tipos de cancro, incluindo o cancro do pulmão [52]. Entre 63 membros de genes, fosfatidilinositol 3-quinase (PIK3R5), fosfolipase C (PLCG2), e proteína adaptador SHC mostrou forte associação com suscetibilidade ao câncer de pulmão no nosso GWAS (Tabela S1, S2 Figura).

Apesar de um caminho abordagem baseada é um estudo atraente em uma era pós-GWAS, notamos algumas limitações em nosso design. Em nosso estudo, seguindo o SNP QC, associações de mais de 300.000 SNPs permaneceram e foram analisados, mas apenas cerca de metade deles foram mapeados com sucesso, para 14,089 genes. Muitos SNPs dentro de regiões não codificantes foram simplesmente negligenciada. Infelizmente, com a plataforma de corrente genotipagem GWAS, o número de marcadores que abrangem genes é limitada. Além disso, mesmo os 880 percursos analisados ​​eram claramente um conjunto incompleto de vias porque muitos genes humanos ainda não foram atribuídos aos caminhos porque sua função (s) são desconhecidos. Finalmente, o nosso GWAS definido que contém dados de SNP do genoma de mais de 2.400 coreanos originado a partir de uma única população. O objectivo do estudo era encontrar caminhos associados com a suscetibilidade ao câncer de pulmão na população coreana, e nós não poderíamos encontrar um câncer de pulmão GWAS conjunto de dados comparáveis ​​coreana para validar nossos achados. Como se tornar disponíveis mais dados, nossos resultados devem ser comparados com outras populações da Ásia Oriental, considerando as diferenças étnicas.

Em conclusão, demonstramos que a suscetibilidade ao câncer de pulmão pode ser ligado a vias biológicas, usando dados GWAS, e vários sinais de associação sutis pode ser interpretado de uma forma sistemática. Os nossos resultados sugerem que a variação genética nos genes envolvidos em quatro vias de sinalização podem contribuir para a susceptibilidade individual do cancro do pulmão. Além disso, nossos resultados indicam que as abordagens baseadas em via são métodos analíticos importantes em uma era pós-GWAS que possivelmente poderiam ser usados ​​para atender a relevância funcional da susceptibilidade genética.

Informações de Apoio

Figura S1.

Semelhanças entre Pathways candidatos. (Unidade:%).

Doi: 10.1371 /journal.pone.0065396.s001

(TIF)

Figura S2.

Pathway Diagrama de “VEGF sinalização”

doi:. 10.1371 /journal.pone.0065396.s002

(TIF)

Figura S3.

Pathway Diagrama de “G1 /S Check Point”

doi:. 10.1371 /journal.pone.0065396.s003

(TIF)

Figura S4.

Pathway Diagrama de “Sinais NRAGE morte através de JNK”

doi:. 10.1371 /journal.pone.0065396.s004

(TIF)

Tabela S1.

Associações SNP de genes em “VEGF via de sinalização”

doi:. 10.1371 /journal.pone.0065396.s005

(DOC)

Tabela S2.

SNP Associações dos genes no “G1 /S Check Point”

doi:. 10.1371 /journal.pone.0065396.s006

(DOC)

Tabela S3.

Associações SNP de genes em “Sinais NRAGE morte através de JNK”

doi: 10.1371. /journal.pone.0065396.s007

(DOC)

Tabela S4.

Associações SNP de 54 genes em “fumantes com câncer de pulmão” Estudo da Expressão Gênica por Falvella et al

doi:. 10.1371 /journal.pone.0065396.s008

(DOC)

Tabela S5.

Comparação de “ABC Transporters” Genes caminho entre Never-fumante e Ever-fumante

doi:. 10.1371 /journal.pone.0065396.s009

(DOC)

Apêndice S1. : Lista de 880 Pathways

doi:. 10.1371 /journal.pone.0065396.s010

(XLSX)

Apêndice S2.

Caminho Análise de 2156 Adenocarcinoma único grupo e 1806 escamosas-Cell Carcinoma único grupo

doi:. 10.1371 /journal.pone.0065396.s011

(XLSX)

Reconhecimentos

gostaríamos de reconhecer o Center for Disease Control no Instituto Nacional da Coreia Saúde, que gentilmente forneceu os dados de SNP do genoma para controles. Nós também gostaríamos de agradecer Dongwan Hong e Seungyoon Nam no Centro Nacional do Câncer para discussões úteis e críticas.

Deixe uma resposta