PLOS ONE: Insights sobre o cancro do pâncreas Etiologia de Análise de Caminho de Genome-Wide Association dados do estudo

Abstract

Fundo

O câncer de pâncreas é a quarta principal causa de morte por câncer em os EUA e a etiologia desta doença altamente letal não foi bem definida. Para identificar os fatores de susceptibilidade genética para câncer de pâncreas, foi realizada análise de caminho de estudo de associação do genoma dados (GWAS) em 3.141 pacientes com câncer de pâncreas e 3.367 controles com ascendência europeia.

Métodos

Usando o definir regressão de cumeeira gene no método de associação estudos (grama), foram analisados ​​197 vias identificadas a partir da Enciclopédia Kyoto de genes e banco de dados de genomas. Foi utilizado o teste logística máquina kernel (LKM) para identificar os principais genes que contribuem para cada via. Realizamos a análise de enriquecimento funcional dos genes mais significativas (

P Art 0,01). Utilizando o banco de dados para anotação, visualização e descoberta integrada (DAVID)

Resultados

dois caminhos foram significativamente associados com o risco de câncer de pâncreas após o ajuste para comparações múltiplas (

P Art 0,00025) e em testes de replicação: interacção ligando-receptor neuroactive, (

Ps Art 0,00002) , e a via de transdução de olfactiva (

P

= 0,0001). teste LKM identificou quatro genes que foram significativamente associados com o risco de câncer de pâncreas após a correção de Bonferroni (

P Art 1 × 10

-5):

ABO, HNF1A, OR13C4,

e

SHH. análise de enriquecimento

funcional usando DAVID consistentemente encontrado o receptor acoplado à proteína G via (incluindo tanto a interação ligando-receptor neuroactive e vias de transdução de olfativas) sinaliza para ser a via mais importante para o risco de câncer de pâncreas na população estudada .

Conclusão

Estes novos resultados fornecem novas perspectivas sobre a susceptibilidade genética para a e mecanismos moleculares de câncer de pâncreas

Citation:. Wei P, Tang H, Li D (2012) insights sobre cancro do pâncreas Etiologia de Análise de Caminho de Genome-Wide Association dados do estudo. PLoS ONE 7 (10): e46887. doi: 10.1371 /journal.pone.0046887

editor: Zhongming Zhao, Vanderbilt University Medical Center, Estados Unidos da América

Recebido: 22 de junho de 2012; Aceito: 06 de setembro de 2012; Publicação: 04 de outubro de 2012

Direitos de autor: © Wei et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pelos Institutos Nacionais de Saúde através de um subsídio complementar para SR1 CA98380-05 (a DL) e através Support Center Grant Câncer MD Anderson (CA016672). P. W. foi parcialmente financiado pelo NIH R01HL106034-01. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer de pâncreas é a quarta principal causa de morte relacionada ao câncer nos Estados Unidos, sendo responsável por mais de 37,660 mortes por ano [1]. Porque existe nenhum teste de rastreio eficaz para o cancro pancreático, é importante identificar os fatores genéticos que contribuem para o desenvolvimento desse tipo de câncer. Recentes estudos de associação do genoma (GWAS) e análises pós-GWAS identificaram regiões cromossômicas contendo o

ABO

,

NR5A2,

e

CLPTM1L-terc

genes [2] [3], bem como o

HNF1A

gene [4], como loci susceptibilidade para câncer de pâncreas. No entanto, testes de associação-marcador único têm poder limitado para identificar genes que são realmente associados com o estado da doença, mas podem não atingir um limiar de significância do genoma rigorosas no GWAS. Assim, muitos genes de doenças importantes ainda podem permanecer não identificado com esta abordagem. Além disso, o desenvolvimento de câncer geralmente envolve disfunção de múltiplos genes funcionalmente relacionados agindo concordante em uma rede ou caminhos [5]. Assim, a análise via de dados GWAS, que considera conjuntamente múltiplas variantes em interagir genes e múltiplos genes numa via biológica, tal como uma abordagem complementar para testes de associação-marcador único [6], pode ter o potencial para revelar a base poligénica de susceptibilidade à doença . -Pathway base GWAS análises forneceram novos insights sobre a etiologia do câncer, como câncer de cólon [7], o cancro do pulmão [8], e melanoma [9], e outras doenças complexas, incluindo a esquizofrenia [10], o transtorno bipolar [11 ], e artrite reumatóide [12]. Um estudo recente analisou os dados GWAS com foco em 23 vias ou grupos de genes selecionados e identificou os genes da via de desenvolvimento pâncreas como factores de susceptibilidade para câncer pancreático [13]. Embora estes dados suporta a análise via candidato como uma abordagem útil no estudo de associação genética, é limitada pelo número de percursos /genes analisados, sugerindo que uma análise agnóstico mais abrangente de todas as vias conhecidas podem ter o potencial para descobrir novos genes que eram anteriormente não consideradas no cancro pancreático.

Gene definir regressão de cumeeira em estudos de associação (grama) é uma das abordagens baseadas em vias recém-desenvolvidos [7]. Na grama, análise de componentes principais (PCA) é usado para capturar a variação genética dentro de um gene para reduzir a dimensionalidade do polimorfismo de nucleotídeo único de dados (SNP) e regressão logística regularizado é realizada para avaliar a associação de vias com doença. Neste estudo, foram utilizados primeira GRAMA em dados GWAS para avaliar a associação de vias com câncer pancreático. Em seguida, foi aplicado o método da máquina do kernel logística (LKM) para examinar os principais genes que contribuem para cada via [14]. Finalmente, foi realizada análise de enriquecimento funcional dos genes mais importantes que utilizam o banco de dados para anotação, visualização e método de descoberta Integrado (DAVID) [15], [16]. Neste estudo, a primeira análise abrangente de dados GWAS em câncer pancreático utilizando uma abordagem agnóstica, identificamos novos caminhos e genes que estão significativamente associados com o risco de doença. Esses achados podem abrir novos caminhos de pesquisa sobre o mecanismo molecular e etiologia do câncer de pâncreas.

Métodos

Estudo População e Fonte de Dados

A população do estudo incluiu uma total de 7.019 indivíduos: 1.871 casos e 2.026 de PanScan1 incluindo 12 estudos aninhados de caso-controle e um estudo de caso-controle de base hospitalar e 1.528 casos e 1.594 controles de PanScan2 incluindo 6 estudos de caso-controle sobre o câncer de pâncreas [2], [3] . Os casos foram definidos como adenocarcinoma primário do pâncreas exócrino. Controles, que estavam livres de câncer pancreático no momento do recrutamento, foram pareados com os casos de acordo com o ano de nascimento, sexo e auto-referida raça /etnia. GWAS tinha sido realizada no Núcleo de Genotipagem instalações do Instituto Nacional do Câncer usando o HumanHap550, HumanHap550-Duo, e matrizes Human 610-Quad (todos da Illumina, San Diego, CA) [2], [3]. Os dados GWAS originais foram baixados da base de dados de genótipos e fenótipos (dbGaP) [17]. Com base nos dados de genótipos Projeto Internacional HapMap (fase 3 release # 3, NCBI construir 36, dbSNP B126, 2010-05-28) por três populações (CEU, JPT /CHB, e YRI) [18] e frequência menor alelo ( MAF) 5%, foram selecionados 10.155 SNPs com

r

2 0,004 para usar em análise de estrutura da população [19]. Um total de 6.508 indivíduos (3.141 casos e 3.367 controles) com ascendência europeia (ou seja, 0,75-1 semelhança com CEU) foram selecionados entre a população do estudo inicial de 7.019 indivíduos na análise caminho atual.

Controle de qualidade

Os dados GWAS originais passaram procedimentos de controle de qualidade antes de publicado em dbGaP. Nós podadas os dados de genótipos através da exclusão de mais 13,822 SNPs com taxa de chamada de 98%, 45,653 SNPs com MAF 5% e 38,857 SNPs não se trate de Hardy-Weinberg (

P Art 0,001), bem como SNPs nas regiões gene deserto, resultando em 82,881 SNPs em última análise a partir de um número inicial de 468,111 SNPs.

a fim de avaliar o impacto da estrutura da população, fizemos o quantil-quantil (QQ) enredo e calculado o fator de inflação () em indivíduos apenas com ascendência europeia. O factor de inflação foi calculada de acordo com o método de De Bakker et al. [20], ajustado para um tamanho de amostra de 1.000 casos e 1.000 controles usando a fórmula: onde e são o número real usado para calcular; 1.000 é o tamanho da amostra a ser corrigido. plot QQ mostra pouca inflação de estatísticas de teste em comparação com a distribuição esperada (λ = 1,03), excluindo a possibilidade de potencial estrutura da população entre os casos e controles.

Genes com -log10 (

P

) 1 não foram incluídos nas parcelas. Para maior clareza, nem todos os genes estão etiquetada. Para mais informações, ver os quadros S1 e S3.

Acesso e Genes

Um total de 214 caminhos biológicos humanos estão listados em Kyoto Encyclopedia of Genes e Genomas (KEGG) [ ,,,0],21]. Após a exclusão de vias com 10 ou 500 genes, foram analisadas vias 197, usando a abordagem GRAMA [22]. Foram identificados 19.058 Sequência de Referência (RefSeq) genes nos dados GWAS do banco de dados do genoma humano 18 (hg18) usando a Universidade da Califórnia em Santa Cruz (UCSC) Tabela navegador ferramenta de recuperação de dados [23]. Testamos 5.127 genes nas 197 vias para a associação com o câncer de pâncreas. Para cada região do gene, incluímos SNPs dentro de 20 kb a montante ou a jusante do gene neste estudo.

A linha sólida e uma linha tracejada, respectivamente, mostra as interações diretas e indiretas entre genes.

Métodos estatísticos

Nós usamos grama para testar a associação de cada via com câncer pancreático. dados de genótipos foram codificados em um modelo aditivo usando Plink versão 1.07 [24] com 0 para homozigoto alelo comum, 1 para heterozigoto, e 2 para homozigoto alelo mutante. A grama testa a hipótese nula de que nenhum dos SNPs numa dada via foi associada com a doença [6]. Para evitar influência indevida de tamanhos de genes e vias diferentes, a grama usa estatísticas em nível de gene normalizados e amostras permutações (sujeito). Os detalhes de relva foram previamente descritos [7]. Resumidamente, o método consiste em três etapas. Em primeiro lugar, a PCA é usada para resumir os SNPs em cada gene como combinações lineares (ortogonais) não correlacionadas dos SNPs originais, chamados eigenSNPs, representando ≥95% da variação genética. O número de eigenSNPs resultantes é geralmente muito menor do que a dos SNPs genotipados originais e serve como preditores no modelo de regressão logística regularizada. Uma função de probabilidade penalizado é utilizada para estimar os coeficientes de regressão das eigenSNPs. Em segundo lugar, uma estatística de nível gene normalizado é calculado de acordo com os coeficientes de regressão das eigenSNPs. A estatística, análogo ao z-estatística, é definido aswhere

é a raiz quadrada da soma dos coeficientes de regressão quadrado para cada eigenSNP estimado sob o parâmetro ideal de afinação; e, estimada a partir de permutações, são média e desvio padrão de debaixo da hipótese nula de que o gene não está associada com a doença. Assim, cada gene, independentemente do seu tamanho, contribui igualmente para o conjunto de genes de associação estatística, como descrito abaixo. A terceira etapa envolve o cálculo gene set (pathway) Estatística de associação () eo valor p. é a raiz quadrada da soma das estatísticas de nível gene padronizados quadrados;

P

valor é calculado utilizando, sempre que é calculado a partir dos dados permutados e B é o número de permutações. Devido ao grande número de genes e vias analisadas, foi aplicado o teste de Bonferroni para ajustar para comparações múltiplas. O limite de significância

P Art 0,00025 (0,05 /197). Devido à computação intensiva acarretado por GRASS, adotamos um procedimento de teste de permutação de duas fases, semelhante ao implementado em Plink [24]: que primeiro realizou 5.000 permutações para cada gene definido neste estudo, e para os conjuntos de genes com p- valor inferior a 0,00025, aumentamos o número de permutações a 50.000.

Foi aplicado o teste de LKM para avaliar a associação de cada gene com câncer pancreático como descrito anteriormente [14]. Resumidamente, este método compreende dois passos: formação de conjuntos de SNP para cada gene e testar a associação de conjuntos de SNP com o estado da doença. O banco de dados do gene, definição de região do gene, e o genótipo de codificação usado aqui foram os mesmos que na grama. O modelo LKM integra um modelo logístico regular com uma função de kernel semi-definida (um kernel linear foi usada aqui) que é projetado especificamente para os dados genéticos. A variância componentes pontuação no teste de Zhang e Lin [25] foi usado para testar a associação do gene da doença. Nesta análise, foram testadas as associações de 5.127 genes (nos 197 vias) com câncer de pâncreas após o ajuste para a idade (em grupos de 10 anos), sexo, estudo (categórica) e cinco componentes principais (quantitativo) capturando estrutura populacional obtida a partir de uma análise de APC utilizando EIGENSTRAT [26]. Os valores de P a partir da análise KLM foram ajustadas para comparações múltiplas utilizando a correção de Bonferroni. O limite de significância

P

. 9,75 × 10

-6 (0,05 /5.127)

Finalmente, como uma abordagem complementar à análise de caminho GRAMA, investigamos o enriquecimento funcional dos genes mais significativas nos testes de associação baseadas em genes (

P

≤0.01 em LKM) usando a bioinformática ferramenta de web acessível DAVID [15], [16]. O DAVID consiste de um sistema integrado de ferramentas da base de conhecimento e analíticas biológicas destinadas a extrair sistematicamente funções biológicas significado biológico e sobre-representados a partir de listas grandes de genes ou proteínas com base no hypergeometric (exato de Fisher) teste. Utilizou-se o KEGG, GO e InterPro [27] bases de dados para definir os conjuntos de genes. Além disso, grupos DAVID funcionalmente conjuntos de genes semelhantes em clusters para reduzir a natureza redundante de sistemas de anotação funcional de genes, por exemplo, o GO hierarquicamente organizado.

Como um esforço de replicação, foram analisados ​​os dados de PanScan1 (1.796 casos e 1.880 controles) e PanScan2 (1.345 casos e 1.487 controles) separadamente. Também dividir aleatoriamente todo o conjunto de dados em dois grupos e realizou uma análise separada em cada grupo. Foi realizada meta-análise do

P

valores de coorte /grupo individual utilizando o método de z-score da Stouffer, que tem sido demonstrado ser eficiente na meta-análise de GWAS [28]. A estatística de teste para combinar os valores de p a partir de duas coortes individuais para um dado caminho é calculado como, em que é inversa da função cumulativa normal padrão. A meta-análise global

valor P

é calculado como. Finalmente, foi aplicado o método de grama para testar as duas maiores vias significativas (como detalhado nos Resultados) usando os dados Wellcome Trust Caso Controle Consortium (WTCCC) GWAS [29] para avaliar empiricamente o impacto do tamanho caminho e demonstrar a especificidade dos nossos resultados .

Resultados

Pathways Associated com cancro do pâncreas

foram analisados ​​197 vias com 5.127 genes utilizando a abordagem grama e descobriu que seis vias foram significativamente associados com câncer de pâncreas após a Bonferroni correcção (

P Art 2,5 × 10

-4) (Tabela 1). Três vias foram significativas em

P

valores 0,0001: a interação ligando-receptor neuroactive, depressão a longo prazo e maturidade diabetes do início dos jovens vias (MODY). Três caminhos tinha uma menos significativa

valor P

de ≥0.0001 mas 0,00025: a transdução olfatória, Fc epsilon sinalização de RI e as vasculares vias de contração do músculo liso. Além das seis vias acima, o metabolismo glycerophospholipid, a secreção pancreática e do fator de crescimento endotelial vascular (VEGF) vias de sinalização foram associados com câncer de pâncreas em

P =

0,0004 (Tabela S1, disponível on-line).

replicação pathway resultados

dois dos seis vias significativas, ou seja, a via de transdução de olfactiva e a via de interacção ligando-receptor neuroactivo mostrou consistente pequena

valores de P através das coortes

PanScan1 e PanScan2, embora não tanto

P valores

foram significativas após múltiplas correcções de teste provavelmente devido ao tamanho da amostra muito menor em cada grupo individual e o poder estatístico inferior resultante (Tabela 2). A meta-análise

valores P

para estas duas vias (1 × 10

-5 e 1 × 10

-5, respectivamente) foram significativas após a correção de Bonferroni. A via MODY permaneceu significativa na PanScan1 (

P

= 0,00006), mas não em PanScan2 (

P

= 0,91), ea meta-análise

P

valor foi 0,0589. Todos os restantes três vias significativas na análise combinada apresentou GRAMA

P

valores 0,1 na coorte PanScan1 e PanScan2 (Tabela 2). Quando nós dividimos aleatoriamente o conjunto de dados em dois grupos, todas as seis vias teve um

P

valor 0,05 em um dos dois grupos, mas não em ambos; e nenhum dos meta-análise

P valores

foi significativa após ajuste para comparações múltiplas (Tabela S2). Para investigar se o significado da via de transdução de olfactiva (353 genes e 1.122 eigenSNPs) e a via neuroactivo interacção do receptor de ligando (263 genes e 1.374 eigenSNPs) foi simplesmente devido ao seu grande tamanho, testou-se estas vias, aplicando a relva ao WTCCC dados GWAS e obteve um

P valor

de 0,5652 e 0,2332 para o transtorno bipolar e 0,246 e 0,0062 para a doença de Crohn, respectivamente, (cada doença teve 2.000 casos e 3.000 controles). Estes resultados, juntamente com os consistentes pequena

valores P

em todo PanScan1 e PanScan2, indicam que a significativa

valor P

destas duas vias na análise GRAMA é improvável devido ao tamanho percurso. Além disso, para investigar se os resultados da via foram impulsionadas principalmente pela top hits GWAS relatados em PanScan1 e PanScan 2, nós removemos o gene

NR5A2

da via MODY e análise GRAMA realizada re-com 50.000 permutações. O valor P para o conjunto de dados combinado, PanScan1 e PanScan2 subconjunto foi de 0,4 × 10

-4, 0,6 × 10

-4, e 0,88, respectivamente. Os respectivos valores

P

foram 0,6 × 10

-4, 0,6 × 10

-4 e 0,91 a partir da análise, incluindo o

NR5A2

gene, sugerindo que a nossa análise de caminho desvendado sinais independentes daqueles por análise de SNP-única. Note-se que outros top GWAS sucessos como

ABO

e

TERT1

não foram incluídos em qualquer uma das 197 vias.

Maior Contribuindo Genes para Pathways

aplicando o método LKM, foram identificados 365 genes com significância nominal (

P Restaurant 0,05) e 118 genes com

P Art 0,01 para os 197 vias (Tabela S3, disponível on-line). Os genes principais que contribuem para cada um dos seis vias significativos identificados por GRAMA estão listados na Tabela 1. Os genes principais que contribuem para os percursos 197 e para os seis vias significativas são apresentadas na Figura 1 e 2, respectivamente. Depois que nós ajustado para comparações múltiplas, quatro genes permaneceu significativa (

P Art 9,75 × 10

-6): o

ABO

,

HNF1A

,

OR13C4

, e

SHH

genes (Tabela 3). Além destes quatro genes,

ABL1

,

MYC, HNF4G

,

NR5A2

(um top hit GWAS) e

ADPGK

estiveste

P

valores 0,0001

análise funcional enriquecimento de genes significativas

Finalmente, foi realizada análise de enriquecimento funcional, utilizando DAVID, sobre o conjunto de 118 genes com

P

0,01 de análise LKM. Quarenta e quatro agrupamentos foram identificados na base do KEGG, GO e categorias InterPro. Os aglomerados de genes com

P

0,01 de David estão listados na Tabela 4 (ver Tabela S4 para uma lista detalhada de genes em cada grupo). A superfamília de receptores acoplados à proteína G-rodopsina como (GPCRs), percepção e transdução de cheiro olfactiva foi o grupo mais significativo de genes com base do InterPro (

P

= 1,61 × 10

– 13), GO (

P

= 1,30 × 10

-7) e KEGG (2,38 × 10

-3) bancos de dados, respectivamente, ecoando as constatações da grama. Genes mantendo o processo de homeostase também foram super-representados no câncer de pâncreas (Tabela 4). O mapa relação biológica para os melhores 81 genes (

P

0,05 em LKM). Dos seis vias significativas é mostrado na Figura 3, o qual foi criado com engenho Caminho e software de análise de dados [30]

Discussão

Nesta análise via GWAS, foram identificadas duas novas vias, ou seja, a interacção receptor do ligando neuroactive e vias de transdução de olfativos que são significativamente associada com o risco de câncer de pâncreas após o ajuste para comparações múltiplas e em testes de replicação. Estes resultados também foram apoiados pela análise de enriquecimento funcional. Nós também identificaram quatro genes que estão significativamente associados com risco de câncer pancreático, incluindo três genes previamente implicados

ABO

,

HNF1A

, e

SHH

[2] – [4] bem como um novo gene

OR13C4

. Estes resultados fornecem novos insights provocantes sobre a base poligênico de suscetibilidade ao câncer de pâncreas e etiologia

A proteína homóloga GPCR de receptores transmembrana responsável por ~ 4% de todo o genoma humano e . 50% dos alvos terapêuticos modernos [ ,,,0],31]. Os genes da interacção ligando-receptor neuroactivo e vias de transdução de olfactivos são os principais componentes dos GPCRs (Tabela S4). A via interacção ligando-receptor neuroactive permaneceu significativa após o ajuste para testes múltiplos em PanScan1 (

P

= 0,0006), mas não em PanScan2 (

P

= 0,002). No entanto, o valor P de meta-análise foi altamente significativa (

P Art 1 × 10

-5). Os genes que contribuem para esta via, por exemplo,

CCKBR, CHRM5, EDNRA, LPAR1

,

SSTR2 /3

, e

SCTR

, tem diversas funções na regulação das funções endócrinas e exócrinas do pâncreas, que são altamente relevantes para o câncer de pâncreas [32], [33], [34], [35]

Os seres humanos têm . 700 receptor olfativo (OR) genes (dos quais ≥50% são funcionais) [36]. Variantes genéticas da ou de genes e de disfunções ou de sinalização tenham sido previamente associadas com a esquizofrenia [37], a hemoglobina fetal em anemia falciforme [38], e proliferação de células de cancro da próstata [39]. Embora as ligações entre transdução olfatória e câncer de pâncreas permanecem a ser elucidados, a análise de sequenciação prévia de tumores pancreáticos humanos não encontrar muitas mutações somáticas do ou de genes, incluindo sete genes identificados na análise atual:

OR13C3

,

OR13C5

,

OR10P1

,

OR1J2

,

OR4A16

,

OR51F2

, e

OR5D13

[40] . A expressão de pelo menos duas ou genes tem sido relatada em tecidos pâncreas humano [41]. Os dois primeiros contribuindo genes da via de transdução de olfativa,

OR13C4

e

OR13C3

, classificada como a terceira e quinta genes mais significativas entre os 5.127 genes analisados ​​neste estudo. No estudo de replicação, a via de transdução olfatória manteve-se como uma das principais vias com pequenas

P valores

consistentes em PanScan1 e PanScan2 coorte com uma meta-análise significativa

P

valor após o ajuste para múltiplos teste. Por outro lado, não encontramos qualquer associação desta via com bipolar ou doença de Crohn na análise dos dados WTCCC GWAS. Todos estes dados sugerem que a associação da via de transdução de olfactivo e do cancro do pâncreas é improvável que seja devido ao acaso. Além disso replicação desta associação em outro conjunto de dados e estudos funcionais dos laços biológicos e moleculares entre a sinalização de transdução olfatória e câncer de pâncreas são garantidos. Os GPCRs são a primeira porta através da qual os sinais são transmitidos de fora para dentro da célula. Alta actividade de GPCR podem contribuir para a transdução de sinais externos prejudiciais, tais como insulina, glicose, ou carcinogénios, numa célula e induzir uma cascata de respostas relacionadas com a carcinogénese.

Em adição a estas duas vias, quatro adicional vias também passou a correção de Bonferroni para comparações múltiplas, ou seja, a MODY, Fc epsilon RI, depressão a longo prazo e as vias de contração do músculo liso vascular. No entanto, a via MODY foi altamente significativa em PanScan1 mas não foi significativa em PanScan2. A associação de genes de risco diminuído ou mais fraca em PanScan2 foi anteriormente observado para outros genes de [3], [4]. Esta diferença pode estar relacionada ao fato de que PanScan1 foi reunido a partir de 12 estudos de coorte e estudo de controle de caso, enquanto PanScan2 foi elaborado a partir de oito estudos caso-controle. Devido à rápida letalidade do câncer de pâncreas, estudo caso-controlo pode sujeitar a um viés de sobrevivência se os genes de teste estão associados com a sobrevivência. Apesar de meta-análise não mostrou uma significativa

valor P

, esta via tem sido identificada como a via mais significativa em associação com câncer pancreático em uma análise separada dos dados PANSCAN usando dois métodos estatísticos diferentes [13]. Os genes MODY são uma parte importante da rede de transcrição que regula o desenvolvimento do pâncreas e diferenciação no início da vida e mantém a homeostase do pâncreas na idade adulta [42], [43], [44]. Três genes MODY (

HNF1A

,

HNF4G

, e

NR5A2

) estavam entre os 10 melhores genes com

P

valores 0,0001 na análise LKM . Notavelmente, mais dois dos 10 melhores genes,

SHH

e

MYC

, também são conhecidos por desempenhar um papel essencial no desenvolvimento do pâncreas [45]. Os genes envolvidos no desenvolvimento de órgãos e diferenciação podem contribuir para a capacidade de células tumorais para proliferar e sobreviver, assim como a plasticidade celular Alter, reprogramando assim as células para um estado que pode dar origem a um tumor. genes MODY pode também contribuir para o cancro do pâncreas, modificando o risco de diabetes [46] e a obesidade [47], [48], ou através do controlo do crescimento epitelial e diferenciação celular, metabolismo lipídico [49], fucosilação proteína [50], e inflamação [51].

Fc epsilon RI é um receptor de elevada afinidade para IgE, e a activação de mastócitos mediada por Fc epsilon RI é um evento chave na resposta inflamatória alérgica. Aumentando as evidências indicam que a inflamação ao redor do tumor, incluindo infiltração de mastócitos, o crescimento do tumor instalações e angiogênese em câncer pancreático [52], [53]. No entanto, esta via juntamente com a depressão de longo prazo e vias contracção do músculo liso vasculares não têm resultados consistentes nos estudos de replicação. Assim, estes dados precisam ser tratados com cautela.

Em comparação com resultados da análise de caminho candidato /gene relatado anteriormente [13], as nossas conclusões sobre as vias que foram incluídos em ambos os estudos foram bastante consistentes, ou seja, um positivo encontrar no desenvolvimento pâncreas (aka MODY) via /genes e os resultados negativos no reparo do DNA, apoptose, sinalização de insulina, wnt, entalhe e vias hedgehog /genes.

Esta é de longe o maior estudo no pâncreas o cancro com a análise mais abrangente de todos os caminhos biológicos identificados a partir de KEGG, usando uma abordagem agnóstica. Usando PCA na grama reduziu consideravelmente a dimensionalidade dos dados GWAS e aumentou a probabilidade de destacar informações úteis. Usando o método LKM superou as influências dos efeitos positivos e negativos de SNPs e nos permitiu identificar novos genes, além de replicar as regiões de genes descobertos por estudos marginal de associação anteriores [54]. Ao realizar a análise GRAMA em duas coortes independentes, que têm mostrado resultados consistentes em algumas das vias significativas. Além disso replicação destes resultados, no futuro, o câncer de pâncreas dados adicionais GWAS se justifica. No geral, a abordagem de análise de caminho com o controle intensivo para resultados falsos positivos tem um grande potencial para descobrir traços de genes que estão associados com a doença, sem a priori. uso correto desta ferramenta pode abrir novos caminhos de pesquisa sobre os mecanismos moleculares de câncer de pâncreas e alvos potenciais para a prevenção e tratamento desta doença.

Informações de Apoio

Tabela S1. : Lista de 197 vias biológicas analisadas neste estudo

doi:. 10.1371 /journal.pone.0046887.s001

(XLS)

Tabela S2. .

Os resultados da análise GRAMA em subgrupos e em WTCCC GWAS dataset

doi: 10.1371 /journal.pone.0046887.s002

(XLS)

Tabela S3. : Lista dos 5.127 genes analisados ​​neste estudo

doi:. 10.1371 /journal.pone.0046887.s003

(XLS)

Tabela S4. : Lista de genes em cada cluster identificados na análise DAVID

doi:. 10.1371 /journal.pone.0046887.s004

(XLS)

Reconhecimentos

Agradecemos a todos contribuintes para o PanScan GWAS. Agradecemos ao Dr. Yuxin Fu para o seu conselho sobre a análise da estrutura populacional e o Sr. Jin Yu por sua ajuda com a computação intensiva usando o sistema de cluster da Universidade do Texas, Escola de Saúde Pública em Houston.

Deixe uma resposta