PLOS ONE: O 12p13.33 /RAD52 Locus e suscetibilidade genética para câncer de células escamosas de aerodigestivo superior Tract

Abstract

variantes genéticas localizados dentro do 12p13.33 /

RAD52

locus de ter sido associado com carcinoma de células escamosas do pulmão (LUSC). Aqui, dentro de 5,947 cancros VADS e 7,789 controles de 9 estudos diferentes, encontramos rs10849605, uma variante intrônica comum em

RAD52

, a ser também associado com aerodigestivo superior do trato (VADS) casos de carcinoma de células escamosas (OR = 1,09 , 95% CI: 1.04-1.15, p = 6×10

-4). Nós, adicionalmente identificados rs10849605 como um

RAD52 cis

-eQTL inUADT (p = 1×10

-3) e LUSC (p = 9×10

-4) tumores, com o /alelo de risco LUSC VADS correlacionada com aumento

RAD52

níveis de expressão. O locus de 12p13.33, englobando rs10849605 /

RAD52

, foi identificado como um somática amplificação do número de cópias focal significativa em VADS (n = 374, q-valor = 0,075) e LUSC (n = 464, q-valor = 0,007) tumores e correlacionado com maior

RAD52

níveis de expressão de tumor (p = 6×10

-48 e p = 3×10

-29 em VADS e LUSC, respectivamente). Em conjunto, estes resultados implicam aumento da

expressão RAD52

tanto susceptibilidade genética e tumorigênese de VADS e LUSC tumores

Citação:. Delahaye-Sourdeix M, Oliver J, Timofeeva MN, Gaborieau V, Johansson H, Chabrier A, et al. (2015) O 12p13.33 /

RAD52

Locus e susceptibilidades genéticas para câncer de células escamosas de VADS. PLoS ONE 10 (3): e0117639. doi: 10.1371 /journal.pone.0117639

Editor do Academic: Amanda Ewart Toland, Ohio State University Medical Center, United States |

Recebido: 16 de julho de 2014; Aceito: 29 de dezembro de 2014; Publicação: 20 de março de 2015

Direitos de autor: © 2015 Delahaye-Sourdeix et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. o financiamento para a coordenação do estudo, genotipagem de estudos de replicação e análise estatística foi fornecida pelos Institutos Nacionais de Saúde (R01 CA092039 05 /05S1) e do Instituto Nacional de Pesquisa Dental e Craniofacial (1R03DE020116). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Alta trato aerodigestivo (VADS) cancros, compreendendo da cavidade oral, laringe e esôfago, são a quarta causa mais comum de morte por câncer em todo o mundo [1]. Enquanto o consumo de tabaco e álcool são os principais tipos de câncer VADS fatores de risco [2], a susceptibilidade genética foi levantada a hipótese de desempenhar um papel na patogênese da doença [3,4].

A exposição a clientes potenciais de tabaco e álcool ao dano celular e alterações de ADN que, na ausência de reparação adequado, pode causar desregulação do ciclo celular e o desenvolvimento do cancro [5,6]. Recombinação homóloga (HR) é uma forma importante pelo qual as células reparar lesões do ADN [7,8]. O

gene RAD52

está envolvido no processo de reparação de ADN de recombinação homóloga [9] mediando RAD51, um gene de RH central que forma um filamento helicoidal nucleoproteína envolvidos na busca de homologia e Strand emparelhamento [10].

Genome estudos de associação (GWAS) têm implicado a variante genética rs10849605 em 12p13.33, o locus que engloba

RAD52

no genoma humano, a ser associado a uma modesta, mas estatisticamente significativo, aumento risco de câncer de pulmão [11,12]. Parece mais relevantes para carcinoma de células escamosas do pulmão (LUSC) e cancros do pulmão de células pequenas, mas com pouca evidência dentro de adenocarcinomas do pulmão (LUAD) [11,12]. Embora os mecanismos moleculares que contribuem para a iniciação e progressão são ainda pouco compreendidos, carcinomas de células escamosas (SCC) de diferentes sítios anatômicos compartilham muitas características fenotípicas e moleculares com os outros [13]. O objetivo do presente estudo foi investigar

RAD52

no contexto de susceptibilidade genética para CEC de VADS, para explorar como esta associação pode ser mediada e examinar os eventos de mutação somática no

RAD52

12p13.33 lócus.

Materiais e Métodos

Os sujeitos do estudo

Um total de 9 estudos de câncer VADS caso-controle participou em nosso estudo, totalizando 5,947 VADS casos de câncer e 7,789 controlos. desenhos de estudo e características da população foram descritos em mais detalhes anteriormente [3,14,15] e são descritas resumidamente na Tabela 1. Na maioria dos estudos, os indivíduos do grupo controle foram frequência correspondente aos casos relativos à idade, sexo e fatores adicionais (por exemplo, , local de estudo e hospitalar). consentimento informado por escrito foi obtido de todos os sujeitos do estudo, e as investigações foram aprovados pelos conselhos de revisão institucionais em cada centro de estudo. Análise foi restrita aos carcinomas de células escamosas.

A genotipagem

O rs10849605 foi genotipados usando matrizes Illumina talão ou genotipagem TaqMan (C__1244798_10, Applied Biosystems, Carlsbad, CA) pelo IARC como descrito em outros lugares [3]. O desempenho dos ensaios Taqman foi validado por amostras re-genotipagem de genótipo conhecido (por exemplo HapMap). A distribuição genotípica estava de acordo com o esperado por Hardy-Weinberg em cada país /estudo. Todos genotipagem posterior alcançou uma taxa de concordância duplicado estudo interno de . 99%

The Cancer Genome Atlas dados

Nós acessada na cabeça e pescoço carcinoma espinocelular (HNSC), Cell Lung escamosas carcinoma (LUSC) e pulmão Adenocarcinoma (LUAD) componentes dos dados TCGA (TCGA Número Projeto # 3230 e # 2731). Estes dados são acessíveis através do dbGAP através do TGSF (https://tcga-data.nci.nih.gov/tcga/). Os dados foram descarregados quer a partir de https://cghub.ucsc.edu/para a sequenciação exome ou directamente a partir https://tcga-data.nci.nih.gov/tcga/para os dados de sequenciamento RNA, metilação e genotípicas.

exome sequenciamento.

Nós acessada TCGA sequenciamento exome “nível 1” de dados (não transformados) para 363 HNSC e 459 indivíduos LUSC TCGA e análise bioinformática completo de seus dados de sequências utilizando Picard, GATK, MuTect e Somatic Indel detector (Métodos Um ficheiro em S1). Posteriormente, usado em casa pipelines de bioinformática (Métodos A em arquivo S1) para determinar os mais altos chamadas variantes qualidade. mutações pontuais somáticas foram variantes funcionais ex�icas definidos como quer truncando, impactando splicing ou missense variantes previu tão deletéria pelo SIFT /POLYPHEN2 [16,17].

Copiar número de variação.

As amostras foram hibridizado usando a Human SNP matriz 6.0 plataforma Genome-Wide na plataforma de análise Genoma do Instituto Broad. Foram recuperados nível 3 de dados TCGA de 374 HNSC, 464 LUSC e 476 indivíduos LUAD contendo log normalizada

2 razões das intensidades de fluorescência entre a amostra alvo e uma amostra de referência. Somente foram incluídos em nossos indivíduos de análise para quem tanto do tumor e correspondentes chamadas normais estavam disponíveis. Para um segmento, que considerada de log

2 (razão) -0,5 A ser uma indicação de uma perda, e um log

2 (razão) 0,5 para indicar um ganho. Segmentos com log

2 (relação) entre -0,5 e 0,5, não foram seleccionadas como alterações no número de cópias somática. Anotação foi feito adicionando os genes contidos em cada um dos segmentos restantes utilizando bases de dados ENSEMBL [18].

RNA sequenciamento.

RNA sequenciamento (RNA-seq) de dados TCGA foi recuperado o “nível 3 “dados para 263 HNSC, 223 LUSC e 125 indivíduos LUAD. A normalização destes dados é ainda mais detalhada dentro da seção de métodos estatísticos.

metilação.

Os dados TCGA metilação foi analisado no ensaio Illumina Infinium HumanMethylation 450K BeadChip. Nós acessada TCGA metilação de dados “nível 2” para 263 HNSC, 223 LUSC e 125 indivíduos LUAD. Nós estimamos o nível metilado de cada sítio CpG pelo cálculo do valor M (log

2 (proporção de sondas metiladas e não metiladas)) usando nível TCGA 2 de dados [19]. dados metilação nível 2 já está corrigido-fundo.

rs10849605 TCGA genótipos.

rs10849605 está localizado dentro da região 5 ‘do

RAD52

e não estava coberto por sequenciação exome. Portanto, derivados dos genótipos para 263 HNSC, 223 LUSC e 125 indivíduos LUAD usando os dados Affymetrix 6.0 SNP matriz TCGA.

Métodos estatísticos

Análise de associação.

A associação entre o risco variantes e câncer de VADS foi estimada pelo odds ratio (OR) e intervalo de confiança de 95% (IC) por alelo sob o modelo log-aditivo e genótipo derivado de regressão logística não condicional multivariada, com sexo e estudar determinado país de origem incluído no modelo como covariáveis ​​(Tabela S1). Heterogeneidade das RUP foi avaliada pelo teste Q do Cochran. As análises estatísticas foram realizadas utilizando o software SAS versão 9.3 (SAS Institute, Cary, NC, EUA).

Para controlar potencial heterogeneidade étnica entre casos e controles, foi realizada uma análise de componentes principais utilizando o pacote EIGENSTRAT do EIGENSOFT 5.0 software [20] usando 12.898 marcadores em baixo desequilíbrio de ligação [21]. Foram utilizados os resultantes 12 estatisticamente significativas eigenvetores (conforme definido pelas estatísticas Tracy-widom) na análise de sensibilidade (Tabela A em arquivo S1).

eQTL analisa.

A associação entre rs10849605 genótipo da linha germinativa e

RAD52

tumor níveis de expressão (eQTL) foi testado em 263 HNSC, 223 LUSC e 125 LUAD usando um modelo linear. tem sido repetidamente observado que os tumores adquirem alterações somáticas que também pode influenciar a expressão de genes, particularmente copiar mudanças de número e metilação de ADN [22-24]. Por isso, testou o efeito eQTL de rs10849605 em

RAD52

expressão tumor usando ambos os modelos lineares ajustados e não ajustados conforme descrito na Tabela B no Arquivo S1. Essas análises estatísticas foram realizadas utilizando o software estatístico R (A Fundação R para Statistical Computing, https://www.R-project.org).

A fim de controlar o impacto da heterogeneidade da população, nós inferir população estrutura do 263 HNSC, 223 LUSC e 125 casos LUAD TCGA com o software estrutura [25] usando HapMap liberação nº 23 como a população de referência [26] e restrito analisa a eQTL a 215 HNSC, 192 LUSC e 113 casos LUAD previsto para ser de ascendência europeia (CEU 0,8). Sobre estes, foi realizada ainda uma análise de componentes principais semelhante ao GWAS. As significativas eigenvetores resultantes (como definido pelas estatísticas Tracy-widom) foram utilizados na análise de sensibilidade eQTL (Tabela C no arquivo S1).

Copiar número de análises em GISTIC.

Foi utilizado um publicamente método disponível, chamado Genomic identificação de alvos significativos em Câncer (GISTIC) [27,28], versão 2.0 para encontrar as regiões significativamente amplificados ou excluídos usando copiar TCGA dados numéricos. O algoritmo calcula GISTIC p-valores para cada marcador, comparando a pontuação em cada locus para uma distribuição pontuação de fundo gerada por permutação aleatória dos locais de marcadores em cada amostra. Em seguida, eles corrigir os valores p para múltiplo-teste da hipótese usando o método Benjamini-Hochberg taxa de descoberta de falsas (FDR). Portanto, as pontuações GISTIC representam níveis de significância e são expressos como valores de q (significativas abaixo de 0,25).

RNA sequenciamento de normalização.

Nível 3 RNA dados tumor sequenciamento que nós acessado a partir do TCGA já estava normalizada para o quilobases por milhão lê padrão (RPKM) que corrige para o comprimento espécies e ler profundidade [29], mas não a diversidade da população de ARN. Para controlar isso, aplicado TMM (média aparada de valores M) normalização [30] para os dados RPKM. Isto possivelmente envolve uma perda de eficiência estatística em relação à aplicação TMM de dados brutos, uma vez que a ponderação precisão no TMM deixarão de funcionar. No entanto, não deve adicionar qualquer preconceito ea perda de eficiência será pequeno se a densidade de leitura está perto de uniforme. Usamos implementações no pacote de aparador de BioConductor [31] e a função voom do pacote Bioconductor limma [32]. Os dados de expressão normais sendo disponíveis apenas para alguns casos, não foi possível realizar qualquer análise da expressão diferencial.

Resultados

germinativa genética rs10849605 variação e suscetibilidade a cânceres VADS

Foram genotipados rs10849605 em 5.947 casos de câncer de VADS e 7,789 indivíduos de controle de 9 estudos. Frequência do alelo menor de rs10849605 variou pouco por país, com o alelo de risco (C) sendo mais prevalente em países da Europa e da América Latina, em comparação com a Ásia (51% e 49% versus 40%, respectivamente).

Como observados em carcinoma de células escamosas do pulmão, o alelo C foi associado com um aumento modesto no risco de câncer VADS (Fig. 1, p = 6×10

-4), com a odds ratio (OR) por ter um alelo risco adicional sendo (IC 95%: 1,04-1,15) 1,09. A associação apareceu relativamente consistente em toda a região geográfica (Fig. 1), e não pareceu sensível a estrutura populacional críptica dentro de 1.791 casos e 2.531 controles, onde genoma de dados em toda estava disponível para inferir ascendência genética (Tabela A em arquivo S1). A associação também foi consistente dentro subsites câncer VADS e consumo de tabaco. No entanto, foi mais proeminente nos que consumiram álcool em comparação com os não-bebedores (p_het 0,03) (Fig. 1). Houve pouca evidência para sugerir esta variante alterou os padrões de consumo de tabaco e álcool (p = 0,53 e p = 0,40, respectivamente, anos /maço e etanol /dia tomado como uma variável contínua).

quadrados representam RUP, tamanho do quadrado representa o inverso da variância das RUP log, linhas horizontais representam 95% CIs. A linha vertical sólida indica OR = 1 ea linha vertical pontilhada o geral ou sob o modelo log-aditivo. p_het é a p-valor para heterogeneidade entre os diferentes subgrupos. I2 é a% de variação observada entre os subgrupos (I2 negativos foram definidos como 0).

Integrado

in silico of Fine mapeamento do 12p13.33 lócus

a seguir, empreendeu

in silico

análise da variante rs10849605 e

RAD52

lócus /12p13.33 nos cânceres de cabeça e pescoço e pulmão caracterizadas genomically pelo Cancer Genome Atlas (TCGA) .

Expression característica quantitativa loco (eQTL) de rs10849605 no HNSC e LUSC

rs10849605 está localizado perto do promotor putativo 5 ‘para o

gene RAD52

, portanto, a hipótese de que isto, ou uma variante de proxy correlacionada, pode influenciar

RAD52

expressão do gene. Realizamos um locus de expressão de características quantitativas (eQTL) análise entre rs10849605 e

RAD52

níveis de expressão em HNSC (n = 263), utilizando dados onde ambos RNA-Seq dos tumores e genotipagem foram realizadas por TCGA dentro do mesmo indivíduos. rs10849605 foi significativamente associada com

RAD52

níveis de expressão de genes em HNSC (Fig. 2, n = 263, p = 9×10

-4), sugerindo que rs10849605 é um

cis

-eQTL locus para

RAD52

. O alelo C de rs10849605, associada ao risco de HNSC, foi correlacionada com o aumento de

RAD52

níveis de expressão (Fig. 2). A associação não foi sensível tanto para o ajuste para eventos somáticas (número de cópias ou estado de metilação que podem influenciar a análise eQTL em tumores [22]), HNSC subtipo (laringe /hipofaringe, cavidade oral, orofaringe) ou estrutura da população (Tabelas B e C em ficheiro S1). Foi observado um efeito semelhante em LUSC (Fig. 2, n = 223, p = 8×10

-4), mas nenhum associação eQTL transparente foi observada no adenocarcinoma de pulmão (LUAD, a Fig. 2, n = 125, p = 0,75) . Embora estatisticamente significativa, o eQTL para rs10849605 representaram apenas uma pequena proporção da variância (aproximadamente 4%) no

expressão RAD52

no HNSC e tumores LUSC, uma observação em linha com o risco genético relativamente modesto observado com este variante.

Boxplots mostrando o efeito do genótipo para o SNP

RAD52

rs10849605 em

RAD52

níveis de expressão tumor no HNSC, LUSC e LUAD. O alelo de risco (C) aumenta significativamente a

RAD52

níveis de expressão (p = 9×10

-4 e 8×10

-4, respectivamente) em ambos os cancros escamosas, mas não no adenocarcinoma pulmonar (p = 0,75). Em contraste, não houve evidência de associação entre rs10849605 e expressão níveis de outros genes na região do 12p13.33 (Tabela D no arquivo S1).

alterações somáticas na RAD52 /12p13.33 em Cabeça e de pescoço do carcinoma espinocelular (HNSC) e LUSC

Dentro de mutações somáticas recordou a partir de amostras de sequenciamento exome-tumorais normais pareadas de 305 HNSC e 243 LUSC,

RAD52

foi raramente mutados somaticamente (mutações pontuais e inserções exclusões), com apenas 2 HNSC (0,60% dos tumores) e uma LUSC (0,40% dos tumores) pacientes portadores de uma variante missense somática, e nenhuma inserção somática ou supressão observada.

por outro lado, analisamos a TCGA número de cópias somática variação (CNV) dados de 374 HNSC, 464 LUSC e 476 tumores LUAD e descobriu que o 12p13.33 loco foi uma região frequente de ganho de número de cópias no HNSC (7,2% dos casos) e LUSC (11,2% dos casos ). número de cópias do ganho de 12p13.33 foi observado em uma proporção menor de tumores LUAD (3,9% de casos) (Fig. 3). Houve uma diferença significativa na cópia frequências ganho número somáticas entre SCC e LUAD (p = 3×10

-5). Além disso, utilizou-se GISTIC2 programa estatístico para determinar a importância relativa do ganho 12p13.33 em comparação com a taxa de alteração no número de cópias de todo o genoma [27,28], utilizando os dados do número de cópia somática TCGA fundo. A região 12p13.33 foi identificado por GISTIC2 como uma amplificação focal significativa no HNSC e LUSC (q-value = 0,075 e 0,007, respectivamente), mas não em LUAD (Figura A no arquivo S1).

Os indivíduos foram ordenados por agrupamento não supervisionado com base em

RAD52

níveis de expressão. Heatmap representa os valores normalizados RPKM escala com maiores níveis de expressão representados nos níveis de expressão inferiores em vermelho e azul. Os indivíduos a um ganho de número de cópia (log

2 (ratio) 0,5) de

RAD52

são destacadas em verde (luz amarela em contrário).

RAD52

portadores de ganho parecem ter o mesmo padrão de alta expressão e agrupar. Particularmente em LUAD uma das 3 operadoras de ganho tem a maior

RAD52

nível de expressão.

Presença de cópia somática ganho número também foi correlacionada com maior

expressão RAD52

níveis em ambos HNSC e tumores LUSC, (p = 6×10

-48 e 3×10

-29, respectivamente) (Fig. 3), com número de cópias neste locus responsável por uma grande proporção da variação no

Os níveis de expressão RAD52

de tumor (57% no HNSC e 45% em LUSC). Como esperado, os niveis de expressão de genes foram correlacionados com o número de cópia para outros genes em 12p13.33 (11 em 26). No entanto, rs10849605 pareceu influenciar rs10849605 única

RAD52

níveis de expressão (Tabela D no arquivo S1).

Discussão

Nosso estudo identificou a ser associado com câncer de VADS (p = 6×10

-4). Embora a natureza modesta desta associação limita a nossa capacidade de detectar inter-substratos heterogeneidade, a associação foi relativamente consistente entre os diversos ambientes etiológicos da Europa, Japão, América Latina e sub-continental da Ásia (onde o tabaco de mascar é um importante fator de risco de câncer de VADS ). Observamos que diferentes padrões de LD, ou estrutura populacional críptica, onde não fomos capazes de controlar, poderia influenciar esses resultados. No entanto, os nossos resultados são consistentes com a observação de que rs10849605 (ou variantes correlacionada com ele), também têm sido associadas com o cancro do pulmão, e em particular carcinomas de células escamosas do pulmão. Como encontrado no cancro do pulmão [12], o alelo C do rs10849605 variante de susceptibilidade foi associado com um aumento do risco de VADS modesta.

rs10849605 está localizado no cromossoma 12p13.33, um lugar geométrico que contém o

RAD52

gene.

RAD52

papel celular é DNA dupla vertente de reparação ruptura através de recombinação homóloga, interagindo com genes de reparação do ADN múltiplos relacionados dentro desta função e, portanto, um gene candidato plausível para explicar esta associação [33]. No entanto, não podemos excluir a possibilidade de um gene de susceptibilidade alternativo para

RAD52

devido ao desequilíbrio de ligação. Por isso, usou um

in silico

análise integrativa utilizando a expressão TCGA, genótipo e dados de alteração somáticas multar mapear esse locus de susceptibilidade. 12p13.33 era uma região de ganho significativo do número de cópias somática em HNSC e LUSC, sugerindo que a amplificação de 12p13.33 somáticas é um evento molecular importante em um subconjunto de tumores. No entanto, a região amplificada do 3MBp continha vários genes, além de

RAD52

. Importante, rs10849605 foi um eQTL no HNSC e LUSC para

RAD52

única, sugerindo

RAD52

como o gene motorista candidato mais provável para tanto a susceptibilidade genética e tumorigênese neste locus. Como um eQTL, a rs10849605 VADS eo risco LUSC associado alelo (alelo C) foi correlacionada com o aumento de

RAD52

níveis de expressão. Essa maior

RAD52

expressão aparece envolvido em ambos susceptibilidade genética e somáticos eventos em VADS e LUSC pode indicar que a actividade RAD52 é permitir que as células de tumor têm a integridade do genoma suficiente para evitar a apoptose, uma característica que pode ser particularmente importante no interior da ambiente genotóxico criado pelo fumo do tabaco eo consumo de álcool. Notavelmente, tanto o eQTL e ganhos somáticos foram observados no HNSC e LUSC, mas não LUAD, consistente com a susceptibilidade genética do cancro do pulmão [11,12], reforçando a importância deste lugar em SCC.

Um papel-chave de

RAD52

é fornecer células com um nível de redundância na reparação do ADN [34].

RAD52

é, por conseguinte, particularmente importante em células deficientes na via de BRCA1 de PALB2 BRCA2, proporcionando um mecanismo alternativo para a reparação do ADN [35,36]. a inibição específica de

RAD52

em

BRCA2

células deficientes resulta em instabilidade genómica e inibição do crescimento celular, levando à sugestão de

RAD52

como um potencial alvo terapêutico utilizando abordagens de letalidade sintética [37]. Nossos resultados que ligam

RAD52

maior expressão do gene para VADS e LUSC, juntamente com a nossa observação recente de que uma truncagem rara

BRCA2

variante genética, rs11571833 (K3326X) está associada com um risco 2,5 vezes maior de escamosas carcinomas de células do pulmão e VADS [38,39], sugere que essas abordagens de terapia-alvo pode valer a pena investigar em tumores VADS e LUSC.

Informações de Apoio

S1 Arquivo. Métodos A.

Figura A, picos de amplificação identificados em todo o genoma por GISTIC2 no HNSC, LUSC e LUAD. Os Gistic-scores são mostrados na parte superior e os valores-Q na parte inferior. A linha de significância é desenhada em q-valor = 0,25 e os lócus significativamente amplificados são anotados no lado direito de cada parcela. O 12p13.33 região amplificada está moldado e indicado com uma seta. Tabela A, análise de sensibilidade a estratificação da população. Modelo 1 é a análise de regressão logística associação original, ajustada para sexo e estudar determinado país de origem. Modelo 2 ajusta ainda mais para a estratificação da população, incluindo os 12 eigenvetores significativos (como definido pelas estatísticas Tracy-widom) como co-variáveis ​​na regressão logística. Tabela B, eQTL análises utilizando modelos lineares ajustados e não ajustados para medir o impacto do genótipo rs10849605 em

RAD52

níveis de expressão tumor. O modelo mede o efeito do alelo de protecção T para rs10849605. Número de indivíduos tomadas em conta no modelo, estimativas beta e p-valor são dadas para os três tipos de cancro diferentes e usando os seguintes modelos lineares: 1) não ajustado, como o genótipo influencia a expressão do gene. 2) No caso do cancro HNSC, o subtipo (cavidade oral, laringe /hipofaringe e orofaringe) é usado como co-variável. 3)

RAD52

número de cópias somática é usado como co-variável. 4) Uma vez que estamos interessados ​​aqui na influência dos determinantes somáticas em um aumento de expressão e porque a metilação é inversamente correlacionada com a expressão (locais hypermethylated tendem a diminuir a expressão quando os sites hypomethylated induzir aumento na expressão), foram selecionados 8 dos 24 locais CpG para ser hypomethylated (tal como definido por um valor H-negativo em todos os indivíduos em todos os 3 locais diferentes de cancro). Destes 8, apenas cg15612927 foi significativamente associada com a expressão de

RAD52

em todos os 3 tipos de câncer (valor-p 0,05). Assim, os níveis de metilação do tumor de cg15612927 foi utilizado como covariável. 5) O modelo inicial é ajustado para as três alterações somáticas (subtipo para HNSC, número de cópias somático e níveis de metilação). Tabela C, análise de sensibilidade eQTL. O modelo linear mede o efeito do genótipo rs10849605 em RAD52 níveis de expressão tumor. A primeira linha apresenta os resultados em todos os casos TCGA nós acessados. A segunda linha restringe a análise de casos TCGA previsto para ser de origem europeia. A última linha mostra os resultados do mesmo modelo linear, mas ajustada para os estatisticamente significativas eigenvetores, tal como definido por Tracy-Widom (5 para HNSC e LUSC, 8 para LUAD). Tabela D, 12p13.33 número de cópia contra expressão e análise eQTL no HNSC e LUSC. Análise de associação entre o número de cópias e os níveis de expressão do gene para cada dado na região de 12p13.33 (lado esquerdo da tabela, ‘NA »se nenhuma CNV ou dados de expressão disponíveis). Para as associações significativas apenas, realizamos uma análise eQTL para verificar como rs10849605 influências genótipo cada dado os níveis de expressão de genes (lado direito da mesa). Resultados significativos são destacados em verde (correção de Bonferroni para testes de múltipla)

doi:. 10.1371 /journal.pone.0117639.s001

(DOCX)

S1 Table. Estudar exposições epidemiológicos e dados genéticos

doi:. 10.1371 /journal.pone.0117639.s002

(XLSX)

Reconhecimentos

Os autores agradecem a todos os participantes que tomaram parte nesta pesquisa e os financiadores e apoio e pessoal técnico que fez este estudo possível. Nós também reconhecer e agradecer A iniciativa Cancer Genome Atlas, cujos dados contribuíram fortemente para este estudo.

Deixe uma resposta