PLOS ONE: Integrative análise genômica revela homozigose da linhagem germinativa prolongado com Lung Cancer Risk no PLCO Cohort

Sumário

A suscetibilidade a cânceres comuns é multigenic resultante da predisposição-fatores baixas para maior penetração e exposição ambiental. estudos genômicos sugerem homozygosity linha germinal como um fator de baixa penetrância romance contribuindo para cânceres comuns. Nossa hipótese é que genes regiões homozigotos longos (intervalos-de-homozygosity [TOH]) predisposição câncer de pulmão porto tabaco-dependente e independente (ou proteção). Realizamos i

n silico

análise baseada em SNP-array do genoma de pacientes com câncer de pulmão de estilo europeu, ascendência do PLCO coorte triagem-teste para identificar regiões Toh entre 788 cancerosas-casos e 830 ascendência-combinado controlos. As análises de associação foi então realizada entre a presença de cancro do pulmão e comum (c) TOHs (operacionalmente definido como 10 ou mais indivíduos que compartilham ≥100 chamadas homozigotos idênticos), aTOHs (grupos allelically-combinados dentro de um cTOH), a demografia e tabaco-exposição. Finalmente, a integração de significativa c /Atoh com transcriptoma foi realizada para funcionalmente-map câncer de pulmão de risco-genes. Depois de controlar a demografia e tabagismo, identificamos 7 cTOHs e 5 aTOHs associados com o cancro do pulmão (p ajustado 0,01). Três cTOHs foram sobre-representados em casos mais controles (OR = 1,75-2,06, p = 0,007-0,001), enquanto 4 foram sub-representadas (OR = 0,28-0,69, p = 0,006-0,001). Observou-se interação entre tabagismo e cTOH3 /aTOH2 (2p16.3-2p16.1) (p ajustado 0,03). Os aTOHs significativas restantes têm RUP 0,23-0,50 (p = 0,004-0,006) e 2,95-3,97 (p = 0,008-0,001). Depois de integrar significativas cTOH /aTOHs com conjuntos de dados de transcriptoma câncer de pulmão publicamente disponíveis, seguido de filtragem baseada em câncer de pulmão e suas vias relevantes revelou 9 genes que predispõem putativos (p 0,0001). Em conclusão, diferencialmente distribuídos cTOH /Atoh variantes genômicas entre casos e controles abrigar conjuntos de plausíveis genes diferencialmente expressos representando a complexidade da predisposição câncer de pulmão

Citation:. Orloff MS, Zhang L, Bebek G, Eng C (2012) Integrative análise genômica Revela Extensão da linhagem germinativa homozigose com Lung Cancer Risk no PLCO Cohort. PLoS ONE 7 (2): e31975. doi: 10.1371 /journal.pone.0031975

editor: Amanda Ewart Toland, Ohio State University Medical Center, Estados Unidos da América

Recebido: 10 de outubro de 2011; Aceito: 16 de janeiro de 2012; Publicação: 27 de fevereiro de 2012

Direitos de autor: © 2012 Orloff et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. CE detém a Sondra J. e Stephen R. Hardis cadeira dotada de Câncer Medicina Genômica na Cleveland Clinic, e da American Cancer Society Clinical Professorship Research. Estes fundos Cadeira apoiaram em parte alguns dos FTE dos autores para realizar este estudo (incluindo MO e hora do CE). Sem financiamento externo adicional recebida para este estudo. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Existem dois principais grupos histológicos no cancro do pulmão, cancro do pulmão de pequenas células (CPPC) e câncer de pulmão de células não pequenas (NSCLC). Este último inclui adenocarcinoma (AC) e carcinoma de células escamosas (SCC), juntamente com os subtipos menos comuns. Tem sido largamente aceite que uma média de 5-10% de todas as malignidades são causadas por genes de predisposição elevada penetrância [1] – [3]. Por exemplo, existem 10 genes penetrância elevados, incluindo

BRCA1 /2

e

PTEN

, representando ~ 10% de todos os cancros da mama [3]. Enquanto cânceres do trato aerodigestivo são acreditados para ser uma parte rara do espectro neoplásica de

BRCA2

, nenhum outro gene câncer de pulmão-predisposição alta penetrância foi identificado, e até recentemente, o cancro do pulmão tem sido atribuída quase exclusivamente à a exposição ambiental, o tabaco, principalmente. Nos últimos anos, contudo, tornou-se óbvio que um maior, mas variável, a proporção de todas as doenças malignas têm um componente genómico, conferindo predisposição mais fraca (penetrância baixa). Por exemplo, um estudo de associação do genoma (GWAS) demonstraram Polimorfismos específicos de nucleotídeo único (SNPs) associadas ao risco de AC em fumantes e nunca fumaram [4]. Até à data, NSCLC, especialmente AC-associado genómico-loci foram identificados em 15q25, 5p15, 6p21 e [5] – [10]. Análise do efeito do tabagismo sobre o risco de câncer de pulmão mostraram que fumar não explicar inteiramente o risco de câncer de pulmão em desenvolvimento e que residuais genômicas-fatores que interagem com o tabagismo são susceptíveis [4]. variantes genómicas, tais como os SNPs associado, não pode explicar a heterogeneidade associado com os subtipos histológicos ou [11], [12]. A evidência até agora sugere a necessidade de encontrar outros tipos de variações genômicas que podem explicar a relativamente grande risco remanescente associado com carcinomas pulmonares.

Na pecuária e animais-modelo de experimentação, in-breeding que resulta no aumento homozigoto loci é bem reconhecido para resultar num aumento da incidência de vários distúrbios, incluindo o aumento da incidência de tumores [13]. Nos seres humanos, homozigotia da linha germinal como um factor genómico associado com a doença de risco é um conceito relativamente recente. Por exemplo, homozigotia da linha germinativa, um tipo de variação genómico, tem sido mostrado para ser associada a um risco aumentado de cancro do colo do útero humano. Identificação de loci homozygous como fatores de risco pode ajudar a triagem cervical-alvo elevado para as mulheres de alto risco [14] – [18]. De um modo semelhante, um estudo relativamente recente descobriu uma freqüência significativamente maior de homozigotos da linha germinativa em uma série de indivíduos brancos não relacionados com carcinomas da mama invasivo, carcinomas da próstata e do pescoço caricinomas células escamosas por todo o genoma de microssatélites genotipagem [19]. Esta associação foi validado em um estudo de casos AC e-correspondida controles que foram genotipados com matrizes densas baseadas em SNP (Illumina matriz HumanHap550v3_B), apoiando assim a alta probabilidade de identificação de genótipos homozigotos que estão associados a uma ampla variedade de tumores sólidos comuns [ ,,,0],19]. Este estudo observou que homozygosity de ambas as análises microsatallite- e baseados em SNP mostrou específica, loci compartilhada de homozigose para todos os três tipos de tumores estudados. Além disso, houve também loci altamente homozigótica que são específicos para cada um dos tipos de tumor. Independentemente, Bacolod e colegas [20] descobriu que as longas extensões de homozigose (TOH), operacionalmente definida como abrangendo, pelo menos, 4 Mb, estavam sobre-representados em pacientes com câncer colorretal mais controles.

Aqui, a hipótese de que germinal regional,-homozygosity envolvendo loci cromossómico específico é um novo fator genômica contribuindo para baixo teor predisposição a moderada penetrância (ou proteção contra) câncer de pulmão. Em vez de identificar genes individuais, nossa hipótese leva em conta os subconjuntos de genes dentro dessas regiões, que são diferencialmente expressos em emprestar predisposição complexo para câncer de pulmão. Procurou-se abordar esta hipótese, sistematicamente integração de dados de diferencialmente representados regiões Toh com dados de expressão do genoma para localizar loci predisposição câncer de pulmão regional.

Métodos

Aquisição de Genótipo dados de dbGAP

os genótipos foram obtidos a partir da próstata, pulmão, colo e julgamento rastreio do cancro do ovário (PLCO) onde a coorte de pulmão foi prospectivamente rastreados com radiografias de tórax [21]. Os sujeitos foram todos auto-identificado como branco, e compreendem casos e controles [21] com base no princípio de componentes pareados por ascendência análises usando ambos os SNPs dissociados de câncer de pulmão e sua SNP, como descrito por Patterson informou-ascendência et al [22]. Consistentemente, o CEPH (Centre d’Etude du polymorphisme Humain) de Utah (CEU) HapMap controla cluster com esta população, re-confirmando Norte e da Europa Ocidental origem [23].

Seguimos o controle de qualidade padrão ( procedimento de CQ) utilizada no estudo original [4]. As amostras foram analisadas e seleccionadas apenas se eles tinham uma taxa mínima de 95% de sucesso genótipo chamada. SNPs com freqüências menores de alelos (MAF) 5%, partidas de Hardy-Weinberg (em p 0,01) e ≥5% falta completa por SNP, foram excluídos análises posteriores. Após a filtragem, QC, tivemos 1618 indivíduos (788 casos e 830 ascendência controles pareados) com categorias com idade média de 1,63 (5 categorias definidas na Tabela S1), compreendendo 967 machos e 651 fêmeas, incluindo 156 não fumantes, 703 fumantes anteriores e 759 fumantes atuais (Tabela S1); e uma média 526.826 (514.355 autossômica) SNPs (93,8%) /assunto. Tabela S1 mostra a análise de associação com base em um modelo logístico com a idade, sexo e tabagismo (nunca fumaram, fumantes anterior e tabagismo atual) como co-variáveis ​​após a exclusão dos potenciais efeitos genéticos. É importante notar que a proporção de fumantes atuais foi cerca de metade a taxa de fumantes ativos na população geral dos Estados Unidos. Notou-se que a adesão foi o menor nos fumantes atuais enquanto os fumadores anteriores foram os mais compatível.

Quantificar extensões de homozigose e comparar frequências nos casos de câncer e Controles

Identificar áreas de homozigose ( TOH) e região comum TOH (cTOH).

Nós estendemos o módulo de pistas de homozigose no software GoldenHelix [24] para identificar TOHs [um software in-house (Zhang et al, não publicado)]. Em seguida, os dados de todos os sujeitos foram examinados para determinar se um número mínimo de indivíduos compartilham uma chamada TOH numa dada posição. Para identificar diferenças estatísticas entre TOHs dentro de um projeto de caso-controle, que só reteve os TOHs em que 10 ou mais disciplinas compartilham 100 chamadas homozigotos idênticos, o que operacionalmente definem como um TOH comum (cTOH). Há 333,861 SNPs com 10 ou mais TOH chama ao longo de toda a série, o que representa 65% do conjunto inicial de SNPs.

Detecção de cTOHs associado com câncer de pulmão.

Em seguida, perseguido de testes para associação entre cTOH e casos de câncer de pulmão. Ao considerar cada cTOH como uma variante genómica, uma análise de controlo de casos de todo o genoma foi realizado para cada cTOH, onde um cTOH foi visualizada como uma variável binária com base na presença ou ausência de um cTOH. Usando cada TOH (contendo vários SNPs que estão em desequilíbrio de ligação) como a variável irá reduzir consideravelmente o número de ensaios a realizar e aumentar o poder da análise de associação. Os estudos único SNP de associação tradicionais exigem, pelo menos, 610 000 (até 3 milhões se mais SNPs são usados) Testes se um GWAS tradicional foi feito. Um modelo logístico foi montado para cada cTOH considerando o estado da doença como o resultado eo cTOH como o preditor. Outras variáveis ​​incluídas no modelo foram: idade, sexo e tabagismo. P-valores foram obtidos por Wald testa e OR (IC95%) foram calculados por meio de estimativas dos coeficientes do modelo logístico equipada. Para detectar interacções entre cTOH e tabagismo, e cTOH e idade, um modelo logístico com dois termos de interação extras foi equipado para cada cTOH. O valor de P de interacção foi obtido por M-teste. Para minimizar as chances de resultados positivos falsos, cTOHs são considerados estatisticamente significativos se o seu p 0,01 [24]. Além disso, a abordagem valor Q [25], que se baseia no conceito da taxa de detecção falsa, foi usado como um guia para exploratório que as variantes chamadas pode ser mais investigada.

Investigar agrupamentos allelically-matched dentro de um cTOH (Atoh).

Como mencionado acima, uma cTOH é operacionalmente definido por um número mínimo de loci que são o número homozigotos e mínima de indivíduos que compartilham o cTOH, mas não correspondência qualitativa de nucleotídeos. Dentro do cTOH, segmentos Toh foram então comparados aos pares e um jogo de alelos é declarado se pelo menos 0,95 de conjunto não faltando, locais conjuntamente homozigotos são idênticos. Estes alélicas grupos de TOHs dentro de um cTOH correspondentes são denominados ‘allelic’TOH (Atoh). A caracterização e digitalização destas aTOHs foi realizada utilizando o nosso software personalizado

(software inédito) cag-TOH

, semelhante ao procedimento alélicas de correspondência em Plink [26].

Detecção de aTOHs associado com casos de câncer de pulmão.

O Atoh como variante genômico foi então utilizado para análise de associação dentro de um quadro de caso-controle. Para manter o poder da análise estatística, temos apenas focada nas aTOHs que estão presentes em pelo menos 5 casos e 5 controles. Para cada Atoh, foi aplicado um modelo logístico com o estado da doença como o resultado e Atoh como um preditor com a idade, sexo e tabagismo como co-variáveis. Semelhante a cTOH acima, os aTOHs com p 0,01 por Wald-teste são declarados significativamente associada com o câncer de pulmão. Também aplicou a abordagem q-valor [25].

Integrar a informação genética de c Significativo /Atoh Regiões com Disponível Publicamente expressão de matriz Dataset

Os dados foram obtidos a partir de um gene [27] à disposição do público dataset -expression de 107 amostras frescas congeladas de tecidos de AC (58 tumor e 49 tecidos não tumorais de 20 nunca fumaram, 26 ex-fumantes e 28 fumantes atuais) baixados da Expressão gênica Omnibus (GSE10072), do Meio Ambiente e da genética na O câncer de pulmão Etiologia (EAGLE) estudo (https://dceg.cancer.gov/eagle). Os critérios utilizados para selecionar deste conjunto de dados de matriz específico proporcionar não só polarização mínima, mas os dados fisiologicamente relevantes. Seguimos o padrão universal que os critérios de selecção específicos e QC do estão no local antes de usar conjuntos de dados publicamente disponíveis (por exemplo, matriz expressão) para fins de integração de plataforma cruzada. Por isso, assegurou que os cancros do pulmão nos conjuntos de dados de matriz expressão pertencem a pacientes que são semelhantes aos pacientes que foram genotipados e submetidas à análise TOH. Por exemplo, pacientes utilizados tanto em variedade de expressão e análise TOH representam dois subconjuntos diferentes de uma muito maior coorte estudo. Isso por si só é uma força importante deste processo de integração de plataforma cruzada, pois os pacientes nos dois conjuntos de dados foram submetidos aos mesmos critérios de inclusão /selecção; esses indivíduos foram expostos a condições ambientais ou de tratamento semelhantes; mais importante, o fundo ancestral dos pacientes “expressão” matriz de conjuntos de dados foram semelhantes aos que foram genotipados para análise TOH; e os pacientes são das mesmas faixas etárias, ou seja 55-60 anos. Após QC, que os perfis normalizados de expressão as amostras utilizando o método robusto Multichip médio (RMA), semelhante à forma como os mesmos dados de matriz de expressão foram originalmente processadas [28]. As sondas matérias são mapeados para os seus genes correspondentes, e várias sondas correspondentes para o mesmo gene foram em média. As regiões significativas cTOH foram pela primeira vez estendida 250 kb em cada sentido, e genes dentro dessas regiões foram identificados (259 genes). O número de genes incluídos na região que aumenta linearmente com as regiões flanqueadoras são estendidos, mas também é dependente da região a ser interrogado (isto é, se um gene ou gene rico pobre região). Se ele retornou 1000 genes (que não observamos em nossas análises aqui), teríamos LD simplesmente usado para capturar o bloco de cTOH ou Atoh. Os perfis de 153 dos 259 cTOH-genes de expressão de microarray foram encontrados na matriz de expressão. Posteriormente, foram avaliados em um

a priori

diferenças base em perfis desses 153 genes utilizando regressão logística univariada indivíduo com correção de Bonferroni aplicado para cálculos de significância estatística de expressão (dados não mostrados). perfis de expressão dos genes significativos de análise univariada (p 0,01) e na região +/- 250 kb de c /região Atoh foram submetidos a agrupamento hierárquico não supervisionado [29] usando Matlab®

Priorização do Candidato. genes

Depois de integrar regiões significativas c /Atoh com o conjunto de dados de matriz expressão, determinou-se o risco associado com a expressão diferencial de genes com c /aTOHs estratificados por tabagismo. Os genes que mostraram expressão diferencial perfis significativa a p 0,0001 no nunca- e nunca fumantes estratos foram então sujeitas a uma abordagem de mineração de texto para ajudar a filtrar a partir da informação relevante gerada a partir genómico, transcriptómica, e investigações proteomic disponíveis no banco de dados da literatura PubMed. Consequentemente, esta informação foi usada para identificar redes de relacionamento entre os genes, as suas transcrições, suas proteínas e outros processos biológicos câncer relevantes pulmonares ou caminhos [30] – [32].

Resultados

identificação de setores específicos comuns de homozigose (cTOH) em indivíduos com câncer de pulmão no PLCO Cohort

Para fazer face a nossa hipótese central que TOH linha germinativa específico é super e sub-representados nos casos de câncer de pulmão mais ancestry- controles pareados, inicialmente selecionados para regiões Toh no PLCO-conjunto de dados (esquema na figura 1). Encontramos um total de 91,460 TOHs em todas as amostras com 44,725 TOHs em casos e 46,735 TOHs nos controles. Tempo médio de TOHs foi de 886 kb (mediana = 677,4 KB, 1

st quartil = 484,8 kb, 3

rd quartil = 956,3 kb) eo número médio de SNPs dentro de cada TOH 141,4 (mediana 121, 1

st quartile108, 3

rd quartil = 145). Um total de 890 tais cTOHs foram identificados em todo o genoma, que variam em tamanho 141,6-3.421 kb (média = 2.144 kb, SD = 3115.6 kb, mediana = 1.064 kb, 1

st quartil 623,9 kb, 3

rd quartil 2144 kb) e SNP-contagem de 100-413 (média = 375, DP = 418, mediana = 215).

o esquema representa a estrutura utilizada para identificar e posteriormente integrar cTOHs e aTOHs significativas (do PLCO teste de rastreio do cancro do pulmão) com conjuntos de dados de transcriptoma globais comparando cancros do pulmão para os pulmões normais (do julgamento o rastreio do cancro do pulmão EAGLE). Vários genes diferencialmente expressos dentro do cTOHs e aTOHs tinha sua candidatura priorizados, inicialmente, com base em significância estatística seguido de plausibilidade biológica (por exemplo, modelos de ratos relevantes, relatados a ser somaticamente alterados em cancros do pulmão esporádicos, vias de sinalização relevantes, etc) para obter finalmente 9 ” a maioria dos “genes candidatos plausíveis e um candidato região genômica. Este último é assim designado porque foi derivado de forma independente (por este estudo atual) e, posteriormente encontrado para coincidir com a região previamente identificados em 3 estudos anteriores como associados com o risco de câncer de pulmão.

Ao considerar cada cTOH como uma variante genômica, foi realizada uma análise de caso-controle o ajuste para os efeitos da idade, sexo e tabagismo. Sete regiões cTOH foram encontrados para ser significativamente diferencialmente representados entre os casos de LC e controlos baseados em p 0,01 (Quadro 1, a Figura 2 A e Tabela S2) [38 regiões cTOH foram encontrados a p 0.05 (dados não mostrados)]. Três regiões cTOH, cTOH2, 4 e 7 (dentro de 1p12, 3p24.2-3p24.1 e 9p22.3, respectivamente), tem odds ratio (OR) = 1,75-2,06 (p = 0,007-0,001), mostrando sobre-representação destas 3 cTOHs em casos câncer de pulmão mais controles (Tabela 1 Tabela S2, e Figuras 3C e 3D). As quatro regiões cTOH restantes, cTOH1, 3, 5 e 6 (1p13.2, 2p16.3-2p16.1, 5p15.31 e 6p22.3-22.2) têm OR = ,28-,69 (p = 0,006-0,001), mostrando que estes cTOH de foram sub-representadas nos casos em relação aos controles (Tabela 1, Tabela S2, e as Figuras 3A e 3B).

análise de associação Single-SNP foi realizada de forma independente da análise TOH e comparados. As associações significativas de SNPs individuais, e cada TOH com casos de câncer de pulmão em comparação com controles e seus respectivos IC 95% (coloridos linhas tracejadas), são mostrados. Abaixo de cada um dos painéis inferiores são nomes de genes candidatos (multi-colorido), que foram priorizados depois de testar para a associação entre o câncer pulmonar e expressão diferencial de cada um dos genes dentro e +/- 250 kb do TOH, estratificada por fumar status (p 0,0001; consulte Métodos de seção). A. cTOH3 /região Atoh1 (2 p16.3-16.1; linha marrom) significativamente sub-representadas nos casos de câncer de pulmão e SNPs GWAS-identificados (pontos roxos) na mesma região (painel superior) com seus respectivos riscos correspondentes como odds ratio (painel inferior). B. aTOH4 (7q21.11; linha marrom) significativamente sub-representadas nos casos de câncer de pulmão e SNPs GWAS-identificados (pontos roxos) na região (painel superior) com seus correspondentes riscos câncer de pulmão como odds ratio (OR; painel inferior ).

O pulmão SNPs significativos associados ao câncer de solteiro, e TOH de saber cTOH1, cTOH2, cTOH5 e cTOH7, e seus respectivos IC 95% são mostrados. A associação significativa de aTOHs e SNPs na região (painel superior), o e risco correspondente como odds ratio (painel inferior) cancro do pulmão são mostrados em painéis A-D. Abaixo os painéis inferiores são genes candidatos que foram priorizados depois de testar para a associação entre o câncer de pulmão e expressão diferencial de cada um dos genes dentro de cada TOH significativa +/- 250 kb TOH, estratificada por fumar status (a p 0,0001; consulte Métodos de seção) .

Curiosamente, a interação entre tabagismo e (rs4672095 rs733726 [2p16.3-2p16.1]; Tabela 1) cTOH3 foi observada (p 0,03, Tabela S3). Enquanto conta a idade, sexo e fumadores-status OR ajustado para cTOH 3 é 0,69 (Tabela 1, Figura 2 A), cTOH3 é 2 vezes (OR = 1,8) sobre-representados em casos não-fumadores sobre controles não-fumadores , enquanto cTOH3 é significativamente sub-representadas nos casos em constante fumadores sobre controles cada vez mais fumadores [OR 0,78 (fumantes anterior) e 0,34 (fumantes), respectivamente, p = 0,009-0,026] (Tabela S3 B).

identificação de grupos Allelically-Equivalentes (Atoh) dentro cTOHs nos casos e controles Lung-cancer

os aTOHs pode fornecer fundo genético ou informações relacionadas com ascendência, portanto, uma associação significativa biológico com o fenótipo câncer de pulmão. O número de aTOHs em cada cTOH varia de 1 a 111. Foi realizado um (de cTOHs identificado) Análise de caso-controle independente seguido de ajuste para os efeitos da idade, sexo e tabagismo sobre o fenótipo câncer de pulmão. Deste modo, foram identificados 5 aTOHs (dentro 2p16.3-2p16.1, 3p25.3, 5q11.2-12.1, e 7q21.11 13q31.1-31.3) que são significativamente diferencialmente representada entre casos e controlos (com base na p 0,01; Quadro 2). Notavelmente, única Atoh1 com OR de 0,5 (Tabela 2), foi derivado do pai cTOH3 (2p16.3-16.1) onde ambos cTOH3 e Atoh1 são significativamente sub-representadas nos casos de câncer de pulmão em comparação com os controles (OR = 0,69 e 0,5, p = 0,001 e 0,005, respectivamente; A Figura 2, As Tabelas 1 e 2). As regiões Atoh restantes, aTOH2, 3, 4 e 5 (dentro de 3p25.3, 5q11.2-12.1, 7q21.11 e 13q31.1-31.3, respectivamente) têm OR = 3,97, 0,23, 2,95 e 0,39, respectivamente (p = ,001-,008;. Tabela 2)

funcional Genomic Validação pela Integração dos significativo cTOH e Atoh Regiões com transcriptoma conjuntos de dados global

a seguir, voltou a atenção para procurar genes biologicamente plausíveis , ou seja, uma ou um subconjunto de todos os genes, localizadas dentro e na proximidade (+/- 250 kb) para significativas c /Atoh de e que pode ser pertinente para o risco do cancro do pulmão. Multar mapear os TOHs contendo genes relacionados ao câncer de pulmão e validar funcionalmente nossos dados genômicos, integramos nossas regiões significativas Toh com os dados de expressão de genes derivados de pacientes com câncer de pulmão no estudo EAGLE [27] (Figura 1). Este conjunto de dados foi derivada de uma população de ascendência europeia (critérios de seleção descritos na seção Métodos) e também atuou como nossa série de validação funcional. Fomos capazes de filtrar os genes dentro das regiões significativas c /Atoh a 46 genes com base na expressão diferencial na análise univariada sozinho (Figuras 1 e 4). Com análises e integração com função específica do órgão conhecido e sinalização papéis da via ainda mais o risco, acabamos com uma lista final de 9 genes do câncer de risco pulmonares mais plausíveis e um candidato região genômica (p 0,0001; Tabela 3 e Figura 1; ver discussão).

Bi-agrupamento da expressão gênica relativa (horizontal) classificadas por “LC (tumor) + tabagismo” e “normais + tabagismo” (vertical). A aquisição, re-normalização e fusão de dados de matriz expressão com regiões Toh são detalhados na seção Métodos. coloração vermelha no mapa de calor é relativo a sobre-expressão dos genes, azul denota relativa sob-expressão e branco nenhuma diferença expressional relação distinta observada. O mapa de calor representa os perfis de 47 genes que foram selecionados após a análise univariada de expressão diferencial (ver secção Métodos para detalhes). Os perfis dos genes que residem dentro e na proximidade das regiões c /Atoh que estão associados com o uso do tabaco diferenciar carcinomas pulmonares a partir de tecido de pulmão normal. Expressão

Nós associação particularmente examinado do abrigar TOHs estes 9 genes e tabagismo. De um modo semelhante, os 9 genes diferencialmente expressos dentro do 6 cTOH /Atoh são pertinentes em todos os tempos-fumantes em comparação a 3 que são pertinentes, tanto em constante e nunca fumaram [(p 0,0001), a Tabela 3]. Uma exceção importante é

SBTBN1

e

RTN4

dentro cTOH3 /Atoh1 (2p16.3-16.1), onde a sobre-expressão ocorre quase exclusivamente em controles relativos a casos câncer de pulmão, independentemente de tabagismo estatuto (OR = 0,000 e 0,08, p 0,0001; Tabela 3, as Figuras 2A e 4).

ACYP2

(OR = 0,08, p 0,0001), também dentro deste TOH, é sub-expressos em todos os tempos-fumantes associadas à diminuição câncer de pulmão de risco, mas a sua expressão diferencial não é pertinente em que nunca fumaram (Tabela 3, as Figuras 2A e 4). Em geral, foram observadas únicas assinaturas expressão diferencial de genes para dentro de um grupos /cTOHs como mostrado na Tabela 3 e na Figura 4. A análise dos perfis de genes em outros aTOHs de expressão, por exemplo,

CD36

em aTOH4 (7q21.11) , mostraram sob-expressão em casos com um número sempre fumador (p 0,0001; Tabela 3 e na Figura 2B).

perfis de expressão dos genes localizados em outros cTOHs significativas, cTOH1, 2, 5 e 7 (1 p13 0,2, 1p12, 5p15.31 e 9p22.3, respectivamente; Tabela 1) foram analisados.

OLFML3

(1p12; Figura 3A), foi sub-expressos em casos nunca fumantes em comparação com casos consistentes com uma redução do risco não-fumadores como retratado por OR 1 (Tabela 3 e Figura 4). Em contraste

WDR3

(em 1p12; Figura 3B) mostrou relação significativa sobre-expressão, independentemente do grau de tabagismo, de acordo com o TOH-relevante ou 1 (Tabela 3 e Figura 4).

FASTKD3

(em 5p15.31; Figura 3C) mostrou relação significativa sobre-expressão em casos ever-fumadores câncer de pulmão em comparação aos casos não-fumadores, consistente com a TOH-relevante ou 1 (Tabela 3 e A Figura 4).

PSIP1

(em 9p22.3; Figura 3D) foi significativamente sub-expressas em ambos os casos, as eternas e nunca fumadores, OR 1 (Tabela 3 e Figura 4). Em geral, observou-se assinaturas Expressional únicas e similares para o gene-conjuntos específicos (Tabela 3, Figura 4). Por exemplo, observamos líquida sub-expressão de um gene situado no cTOH3 em casos de câncer de pulmão que são fumantes (OR 1) [Tabela 3, Figura 4]

Discussão

Identificar. fatores de risco, seja genética ou ambiental, por neoplasias malignas, incluindo o cancro do pulmão, é um começo para o diagnóstico precoce, e adaptando intensificada vigilância e prevenção. A hipótese de câncer variante comum comum prevalente na última década levou a GWAS rendendo SNPs comuns dentro de 15q25, 5p15 e 6p21 associado com câncer de pulmão [5] – [10], representando ~ 3% de todos os cânceres de pulmão. Com base na hipótese de trabalho que outros fatores genômicos predisponentes ou redução do risco de câncer de pulmão deve existir, foi realizada uma análise de caso-controle de todo o genoma por longos TOHs, cada um dos quais abriga um a vários câncer de pulmão-predisponente ou loci de proteção (mais susceptíveis de baixa penetrância a moderada). Foram identificados 7 cTOHs e 5 aTOHs que são significativamente super ou sub-representados nos casos de câncer de pulmão em comparação com os controles, após o ajuste para idade, sexo e tabagismo. Curiosamente, encontramos cTOH /aTOHs específicos associados a casos mais controles independentes desses co-variáveis, com os outros dependentes de tabagismo.

É importante ressaltar que as nossas regiões cTOH e Atoh significativos identificados foram funcionalmente validado através da integração de expressão diferencial de específico genes que residem nestes intervalos críticos, mostrado anteriormente para reproduzir, pelo menos, um papel somática em carcinomas de pulmão humano esporádicos, em modelos murinos e /ou participar em vias de sinalização associados a neoplasia (Tabela S4). Acreditamos que agnostically procurando cTOH e Atoh e depois da integração com dados de expressão são métodos poderosos para encontrar e, ao mesmo tempo funcionalmente genomically validação, novas regiões cancro do pulmão risco e genes. Três cancro do pulmão anterior GWAS estudos identificaram a região 5p15 para ser associada com casos de cancro do pulmão [4] – [10]. cTOH5 está dentro 5p15.31 (nosso “região do genoma candidato” após a análise integrativa) e é 11 vezes sobre-representados nos casos de câncer de pulmão nunca fumadores e 3 dobra-em casos não-fumadores com cancro do pulmão. Isto serve como um controlo positivo forte. Também identificaram um novo gene candidato

FASTKD3

, para além dos anteriormente postulado, pela integração de expressão com TOH significativa nesta região (Tabela S4).

Nós encontramos apenas uma região onde um TOH Atoh significativa encontra-se dentro de seu pai cTOH: Atoh 1 (2p16.3-16.1) e seu pai cTOH3, cuja presença parece conferir um efeito protetor contra o câncer de pulmão em casos nunca fumantes (OR 0,7, ou seja, sobre-representados nos controles contra casos; Tabelas 1 e 2). A expressão diferencial de um grupo de genes nesta região parece ser igualmente de protecção contra o cancro do pulmão, independentemente da condição de fumar ou da história (Tabela 3, Figura 4). Por exemplo,

SPTBN1

codifica uma beta-spectrim que desempenha um papel na redução do recrutamento de superfície celular de CD45 e CD3 e que revoga a função da célula T [33]. Por conseguinte, o aumento da

expressão SPTBN1

(e sobre-representação das Atoh1 /cTOH3 em controles sobre casos) poderia plausivelmente proteger contra o câncer de pulmão, aumentando a vigilância imune, uma vez que sabemos que fumar diminui a proporção de células CD4 /CD8 T [34]. Embora não haja evidência plausível existente que sub-expressão de genes dentro cTOH3 /Atoh1 (Tabela 3, Tabela S4, Figura 4) seria de protecção através de vários mecanismos [35], não sabemos quais os mecanismos desconhecido resultar em mais de mitigação de fumar- risco de câncer de pulmão associado. Ao contrário dos outros genes em Atoh1 /cTOH3,

MTIF2

sobre-expressão está associada à sua TOH diferencialmente associado a casos e controles.

Deixe uma resposta