PLOS ONE: Várias abordagens analíticas Revelar distintas interações gene-ambiente em fumadores e não fumadores em Lung Cancer

Abstract

doenças complexas, tais como cancro resulta de interacções de múltiplos fatores genéticos e ambientais. O estudo destes factores singularmente não pode explicar o mecanismo patogénico subjacente à doença. abordagem multi-analítica, incluindo regressão logística (LR), classificação e árvore de regressão (CART) e redução de dimensionalidade multifatorial (MDR), foi aplicada em 188 casos de câncer de pulmão e 290 controles para explorar as interações de alta ordem entre os genes de metabolização de xenobióticos e fatores de risco ambientais . O tabagismo foi identificado como o fator de risco predominante em todas as três abordagens analíticas. Individualmente,

CYP1A1 * 2A

polimorfismo foi significativamente associada com maior risco de câncer de pulmão (OR = 1,69; IC95% = 1,11-2,59, p = 0,01), enquanto

EPHX1

Tyr113His e

SULT1A1

Arg213His conferiu risco reduzido (OR = 0,40; IC95% = 0,25-0,65, p 0,001 e OR = 0,51; IC95% = 0,33-0,78, p = 0,002, respectivamente). Em fumantes,

EPHX1

Tyr113His e

SULT1A1

Arg213His polimorfismos reduziu o risco de câncer de pulmão, enquanto que

CYP1A1 * 2A, CYP1A1 * 2C

e

GSTP1

Ile105Val transmitida aumento do risco em não-fumantes. Ao explorar as interações não lineares através da análise CART, fumantes que transportam a combinação de

EPHX1

113TC (Tyr /His),

SULT1A1

213GG (Arg /Arg) ou AA (His /His) e

GSTM1

genótipos nulos apresentaram o maior risco para o câncer de pulmão (OR = 3,73; IC95% = 1,33-10,55, p = 0,006), enquanto efeito combinado de

CYP1A1 * 2A

6235CC ou TC ,

SULT1A1

213GG (Arg /Arg) e betel quid mastigação mostrou risco máximo em não-fumantes (OR = 2,93; IC95% = 1,15-7,51, p = 0,01). análise MDR identificados dois modelos de previsão distintos para o risco de câncer de pulmão em fumantes (tabaco de mascar,

EPHX1

Tyr113His, e

SULT1A1

Arg213His) e não-fumantes (

CYP1A1 * 2A

,

GSTP1

Ile105Val e

SULT1A1

Arg213His) com precisão o equilíbrio testes (TBA) de 0,6436 e 0,6677, respectivamente. Interação entropia interpretações dos resultados MDR mostrou interações não-aditivos de tabaco de mascar com

SULT1A1

Arg213His e

EPHX1

Tyr113His em fumantes e

SULT1A1

Arg213His com

GSTP1

Ile105Val e

CYP1A1 * 2C

em não fumantes. Estes resultados identificaram interações gene-gene e ambiente gene distintas em fumantes e não-fumantes, o que confirma a importância da interação multifactorial na avaliação de risco de câncer de pulmão

Citation:. Ihsan R, Chauhan PS, Mishra AK, Yadav DS, H Kaushal, Sharma JD, et ai. (2011) Várias abordagens analíticas Revelar distintas interações gene-ambiente em fumadores e não fumadores no câncer de pulmão. PLoS ONE 6 (12): e29431. doi: 10.1371 /journal.pone.0029431

editor: Courtney G. Montgomery, Oklahoma Medical Research Foundation, Estados Unidos da América

Recebido: 04 de julho de 2011; Aceito: 28 de novembro de 2011; Publicado: 19 de Dezembro 2011 |

Direitos de autor: © 2011 Ihsan et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi apoiada por doações do Conselho indiano de Pesquisa médica (ICMR), Nova Deli, Índia (49/4 /RMRC /NE /2005-NCD-II /III). Rakhshan Ihsan é um receptor de um Senior Research Fellowship da Universidade Grants Comissão (UGC) Nova Deli, Índia (Ref. No. 10-2 (5) /2005 (ii) -E.U.II). Pradeep Singh Chauhan é um receptor de um Senior Research Fellowship do Conselho de Investigação Científica e Industrial (CSIR), Nova Deli, Índia (Ref. No. 09/630 (0014) /2006-EMR-1). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o cancro do pulmão é o câncer mais comumente diagnosticado ea principal causa de morte por câncer em todo o mundo [1]. Na Índia, constitui 6,2% de todos os cancros com aproximadamente 58.000 casos incidentes relatados em 2008 e é o câncer mais frequente no sexo masculino [2]. (NE) parte nordeste da Índia está mostrando um aumento constante na incidência de câncer e câncer de pulmão está entre os dez principais sites, com a maior taxa de incidência ajustadas por idade (AAR) no estado de Mizoram (24,5 nos homens e 26,3 nas mulheres). distrito Aizwal sozinha mostra um AAR de 36,0 nos homens e 38,7 nas mulheres que é quase três a dez vezes maior do que [3] Delhi. Incidência de câncer de pulmão também é elevado entre os homens em Silchar e Imphal distritos. As altas taxas de incidência sugerem papel de ambos genética, bem como fatores ambientais, como tabagismo, uso de tabaco e consumo de substância cancerígena dietético.

Indivíduos que possuem capacidade modificada para metabolizar substâncias cancerígenas, como os hidrocarbonetos aromáticos policíclicos (PAH), que são onipresentes ambiental , alimentares e carcinógenos do tabaco estão em maior risco de desenvolver câncer. Assim variantes genéticas em genes de metabolização de xenobióticos podem influenciar o seu afastamento da circulação e determinar a resposta a essas substâncias cancerígenas. A fase I xenobióticos metabolizando enzimas como citocromo P-450s (

CYP

s), álcool desidrogenase (

ALDH

) e hidroxilase epóxido (

EPHX

) normalmente ativar os pró-carcinogéneos através oxidação e de desidrogenação convertendo-os assim em metabólitos reativos. Fase II enzimas metabólicas, como a glutationa S-transferases (

GST

), sulfotransferase (

SULT

) e N-acetiltransferase (

NAT

) geralmente resultam em inactivação ou desintoxicação estes metabólitos reativos. O equilíbrio entre a expressão e a actividade de níveis destas enzimas metabolizadoras de xenobióticos, de ambos fase I e II determinar o nível relativo de desintoxicação de substâncias cancerígenas. No entanto, estas vias são também conhecidos por activar a produtos químicos tóxicos e cancerígenos para formas electrof que reagem irreversivelmente com macromoléculas tais como proteínas e ácidos nucleicos que conduzem a carcinogénese.

polimorfismos de nucleótidos individuais (SNPs) em genes de metabolização xenobióticos têm sido estudados extensivamente com risco de câncer de pulmão. A maioria desses estudos epidemiológicos moleculares considerar apenas os principais efeitos desses SNPs e sua força observada de associações poderia ser desafiado por penetrância da variante genética. Além disso, um único locus não pode explicar a susceptibilidade genética em uma doença complexa como o câncer que envolve múltiplas variações genéticas e interações gene-ambiente. As evidências atuais sugerem que as interações de alta ordem de abordagem multigenic permitir delimitação mais precisa dos grupos de risco [4], [5].

No presente estudo, duas abordagens de mineração de dados, CART e MDR foram aplicados juntamente com LR para detectar interações gene-gene e ambiente gene de alta ordem. Ambos CART e MDR assumir métodos livres e não paramétricos modelo de estimativa de interações não lineares, com baixa de falsos positivos, mesmo em tamanhos relativamente pequenos de amostra. validação do modelo através de testes de permutação e falsas probabilidades relatório positivo também foram feitas para superar a estimativa imprecisa. gráficos interação entropia foram construídos para interpretar os efeitos da combinação identificadas por MDR. Para analisar melhor os possíveis efeitos do

EPHX1

e

CYP1A1

SNPs, estimamos suas frequências de haplótipos e risco transmitida ao câncer de pulmão.

Materiais e Métodos

os sujeitos do estudo

Este estudo consistiu de 188 casos de câncer de pulmão diagnosticados histopatologicamente registrados no Dr. Bhubaneswar Instituto Borooah Câncer, Guwahati, Hospital Civil, Aizawl, e Sir Thutob Namgyal Hospital Memorial, Gangtok, os centros colaboradores no nordeste Índia. casos incidentes durante o período de dezembro de 2006 para 2009 e dispostos a participar do estudo foram incluídos. 290 voluntária, idade (± 5 anos) e indivíduos do sexo combinados foram selecionados a partir dos assistentes independentes que acompanharam pacientes com câncer. Isto proporcionou uma fonte prontamente disponível e cooperativa de controles a partir da mesma origem socioeconómica como os casos reduzindo o viés de confusão. Como os nossos centros colaboradores eram hospitais públicos a grande maioria dos indivíduos pertenciam a reduzir a origem socioeconómica meio. dados e características como idade, sexo, tabagismo, uso de tabaco, quid betel e álcool demográficos, foram obtidas de indivíduos em um questionário padrão usado para todos os centros, em uma entrevista em pessoa por um coletor de dados treinados. A maioria dos casos e controles eram alfabetizados, com ensino fundamental completo e alguns até o nível universitário. A história ocupacional dos participantes do estudo revelou que a maioria deles eram trabalhadores agrícolas ou envolvidos em trabalhos mesquinhos e a natureza de tais trabalhos não expô-los a quaisquer riscos ocupacionais. Qualquer história de doença passada ou presente foi inquirida ou se submeter a qualquer medicação no momento da inscrição. Pacientes com única de pulmão como o seu principal local de câncer foram incluídos. Qualquer doente com história de doença maligna familiar ou doença infecciosa pulmonar foi excluída da caixa e controle. controles finais seleccionadas foram incluídos na base de nenhuma história de nenhuma doença óbvia e aqueles que não estão a tomar qualquer medicação na altura do recrutamento. Todos os indivíduos forneceram consentimento informado por escrito para a participação nesta pesquisa, que foi feita sob um protocolo aprovado pelo comitê de ética institucional do Centro de Investigação Médica Regional, Região Nordeste (Conselho Indiano de Pesquisa Médica). Fumantes, chewers e bebedores foram classificados em duas categorias de sempre e nunca. Para fumar, um indivíduo que nunca fumaram ou fumaram menos de 100 cigarros em sua vida e não estavam fumando no momento da notificação foi considerada não fumante ou não-fumantes. Nunca fumantes ou fumantes categoria incluiu fumantes atuais, e aqueles que tinham parado no 1 ano de relatórios [6]. 5 mL de sangue foi recolhido em tubos de EDTA e armazenadas sob temperatura de -70 ° C até serem processadas.

A genotipagem

O ADN genómico foi isolado utilizando o kit de isolamento de DNA de sangue da Qiagen (Qiagen GmbH, Alemanha) e armazenado à temperatura de -30 ° C até análise posterior. Detalhes sobre os SNPs seleccionados para o estudo são resumidos na Tabela S1. As variantes de deleção em

GSTM1

e

GSTT1

foram determinados por multiplex protocolo de reação em cadeia da polimerase e SNPs em

CYP1A1

,

EPHX1, GSTP1, SULT1A1

foram determinada por ensaios de polimorfismo do comprimento do fragmento de restrição-reacção em cadeia com polimerase como descrito anteriormente [7] – [12]. 10% dos casos e controles selecionados aleatoriamente foram genotipados duas vezes para cada SNP, no entanto não foram observadas discrepâncias.

Análise Estatística

Os casos foram pareados individualmente com controles com base na idade (± 5 anos), sexo e etnia, em uma proporção de aproximadamente 1:1.5. Diferença na distribuição das características demográficas e freqüências genotípicas entre casos e controles foram avaliados usando o quadrado Chi (χ

2) e teste exato de Fisher, sempre que necessário. Hardy-Weinberg (HWE) foi avaliada usando a χ

2-teste. As estimativas de risco para o câncer, transmitido pelos genótipos e outras variáveis ​​como tabagismo, mascar tabaco, betel de mascar quid eo consumo de álcool foram determinadas por derivar o odds ratio (OR) e seu correspondente a 95% intervalo de confiança (IC de 95%), utilizando multivariada condicional regressão logística. Para todos os ensaios, o verso p 0,05 foi considerado estatisticamente significativo. A análise dos dados foi realizada no 8.0 pacote de software estatístico Intercooled Stata (Stata Co., College Station, TX).

análise de haplótipos

haplótipos foram construídos a partir dos dados de genótipos diplóides unphased usando o Expectativa -maximização base algoritmo. haplótipos individuais e as suas frequências população estimada foram inferidas e as estimativas de desequilíbrio de ligação (D ‘) entre SNPs foram calculados utilizando ver.4.1 software Haploview.

Identificação de alta Ordem Interações

interações alta ordem foram determinado usando carro, MDR e entropia interação gráficos.

CART.

um método de particionamento recursiva binária foi utilizada para produzir uma árvore de decisão que identificou combinações específicas de fatores que contribuem associadas ao risco de câncer de pulmão usando o CARRINHO software comercialmente disponível (versão 6.6, Salford Systems) [13]. splitting árvore foi feito até nós terminais atingiu um tamanho mínimo pré-definida de 10 indivíduos. árvore Optimal foi selecionado usando um erro padrão regra (1-SE) e 10 validação cruzada vezes. Subgrupos de indivíduos com padrões de risco diferenciais foram identificados em ordem diferente de nós, indicando a presença de interações gene-gene e gene-ambiente. teste exato de Fisher foi utilizado para calcular o risco relativo em cada nó terminal da árvore.

MDR.

O software MDR foi desenvolvido por Ritchie et. ai. em 2001 [4] e revisto por Moore et al [14]. Genótipo e os fatores ambientais foram reunidas num grupo de alto e baixo risco, reduzindo efetivamente a previsão multifatorial da dimensão n a uma dimensão usando software MDR (versão 2.0 beta) (https://www.epistasis.org). Nós aplicamos Tuned algoritmo ReliefF (relva) filtro para remover SNPs ruidosos e evitar overfitting de dados. Os melhores modelos para cada locus foram seleccionados pela repetição da análise por até 10 sementes e aplicação de 10 dobras de validação cruzada de cada vez. A significância estatística dos melhores modelos selecionados para cada locus foi determinada utilizando 1.000 testes de permutação vezes. p-valores daí obtida para TBA e consistência validação cruzada (CVC), foram considerados estatisticamente significativos em 0.05 níveis.

Report falso positivo probabilidade (FPRP)

Relatórios de estudos interação gene-ambiente são muitas vezes desafiado por descobertas falsos positivos, especialmente quando os resultados são gerados por comparações múltiplas. Para estimar o FPRP e avaliar a robustez dos resultados da análise de MDR que usamos a abordagem bayesiana descrito por Wacholder et. ai. [15]. O método requer probabilidades anteriores que a associação variante e doença genética é real. Como probabilidade anterior pode ser uma medida subjectiva e podem ser influenciadas por vários factores, normalmente uma vasta gama é relatado por estudos. Considerando os dados epidemiológicos pobres da população de estudo e de associação inconsistente dos SNPs com o risco de câncer de pulmão que estabelecemos uma gama bastante ampla de probabilidades anteriores (10

-6 a 10

-1) com um poder estatístico estimado para detectar uma OR de 1,5 e 2,0 e o nível α igual a p-valor observado. O ponto FPRP corte foi rigorosamente mantido a 0,2.

Interação entropia gráficos

gráficos de interação foram construídos para visualizar e interpretar os resultados obtidos a partir de MDR usando pacote de software de aprendizagem de máquina Laranja [16]. gráficos de interação utilizar estimativas de entropia, como descrito por Jakulin et al. [17] para determinar o ganho de informações sobre um (status, por exemplo, caso-controle) variável de classe da fusão de duas variáveis ​​juntas mais garantido pelas variáveis ​​de forma independente. Esta medida de entropia é útil para a construção de gráficos de interacção que facilitam a interpretação da relação entre as variáveis. Interacção gráficos são compostos de um nó para cada variável, com ligações aos pares entre eles. A percentagem de entropia removido (isto é, informação de ganho) de cada variável é visualizado para cada nó. A percentagem de entropia removido para cada produto cartesiano de pares de variáveis ​​foi visualizado para cada ligação. Assim, os principais efeitos independentes de cada SNP pode ser comparado com o efeito de interacção. entropia positiva (plotados em verde) indica interação não-linear, enquanto entropia negativa (traçada em vermelho) indica redundância. valor de entropia igual a zero indica a independência ou uma mistura de sinergia e redundância.

Resultados

Características dos sujeitos do estudo

A distribuição de gênero e etnia foi semelhante para casos e controles . A distribuição de machos e fêmeas de frequência foram 77,1% e 22,9% nos casos e 76,2% nos controlos e 23,85, respectivamente. A idade média dos casos e controles foi 60,41 ± 10,58 (intervalo 30-82 anos) e 57,19 ± 10,75 (intervalo 32-85 anos) respectivamente. A distribuição de todos os SNPs no controle estava de acordo com HWE (p 0,05), no entanto alelos de

EPHX1

Tyr113His e

SULT1A1

Arg213His polimorfismos em casos não seguem HWE (p 0,001 e p = 0,004, respectivamente).

Associação de fatores genéticos e ambientais, com o risco de câncer de pulmão por meio de análise LR

A distribuição e principais efeitos de fatores genéticos e ambientais está resumida na Tabela 1. hábitos de risco, tais como fumar, mastigar tabaco e betel de mascar quid foram predominantes entre os casos. No entanto, apenas fumando e betel quid mastigação foram significativamente associados com risco aumentado para câncer de pulmão (OR = 3,06; IC95% = 1,94-4,83; p 0,001 e OR = 1,86; IC95% = 1,21-2,84; p = 0,004, respectivamente) . A distribuição genotípica de

CYP1A1 * 2A

,

EPHX1

Tyr113His,

SULT1A1

Arg213His e

GSTT1

polimorfismo nulo foram significativamente diferentes nos casos de controles (p = 0,014, p 0,001, p = 0,01 e p = 0,04, respectivamente). Principais efeitos de genótipos de suscetibilidade ao câncer de pulmão foram avaliados por meio de regressão logística multivariada condicional. genótipo heterozigoto em

CYP1A1 * 2A

foi associada com maior risco (OR = 1.69,95% IC = 1,11-2,59; p = 0,01), enquanto que genótipos heterozigotos em

EPHX1

Tyr113His e

SULT1A1

Arg213His transmitida redução do risco ao câncer de pulmão (OR = 0,40; IC95% = 0,25-0,65, p 0,001 e OR = 0,51; p = 0.33x-0,78, p = 0,002, respectivamente).

CYP1A1 * 2A

e

EPHX1

His139Arg polimorfismos foram associados com risco aumentado de câncer de pulmão em modelo genético dominante, enquanto que

EPHX1

Tyr113His e

SULT1A1

Arg213His risco reduzido, concedida em modelo genético recessivo (Tabela S2).

análise de haplótipos

a Tabela 2 resume as associações entre as distribuições dos haplótipos em

CYP1A1

frequência e

EPHX1

genes eo risco de câncer de pulmão. As odds ratio foram calculados utilizando o haplótipo mais comum como o grupo de referência. Em

CYP1A1

, “TA” haplótipo foi o mais frequente entre os dois casos e controles e mostrou associação significativa. Só

CYP1A1

-CG haplótipo transmitida aumento do risco de cancro do pulmão (OR = 1,49; IC95% = 1,00-2,21, p = 0,04). Em

EPHX1

, o haplótipo “TA” foi o mais comum com frequências de 44,79% e 45,04% nos casos e controles, respectivamente. Sem haplótipo foi encontrado para ser significativamente associada com o risco de câncer de pulmão.

Risco associado ao SNPs estratificada por fumar

Uma vez que o tabagismo é um fator de risco bem estabelecidos para o câncer de pulmão e foi o mais forte fator de risco independente em LR, nós estratificada ainda mais os dados por tabagismo. Distribuição e risco associado a fatores genéticos após estratificação é mostrada na Tabela 3. heterozigotos e homozigotos variantes genótipos de

CYP1A1 * 2A

polimorfismo transmitida risco significativo de não-fumantes (OR = 2,88; IC95% = 1,22-6,81 , p = 0,016 e OR = 4,35; IC de 95% = 1,47-12,84, p = 0,008). Além disso,

CYP1A1 * 2C

genótipo variante e

GSTP1

genótipo heterozigoto Ile105Val foram significativamente associados com risco aumentado em não-fumantes (OR = 11,81; IC95% = 1,24-111,98, p = 0,03 e OR = 2,40; IC95% = 1,15-5,03, p = 0,01). genótipos heterozigotos em

EPHX1

Tyr113His e

SULT1A1

Arg213His foram associados com 66% e 55% redução do risco em fumantes (OR = 0,34; IC95% = ,18-,63, p = 0,001 e OR = 0,45, IC 95% = 0,25-0,80, p = 0,007, respectivamente). genótipo heterozigoto No entanto, em

EPHX1

His139Arg conferiu risco significativo em fumantes (OR = 1,92; IC95% = 1,07-3,45, p = 0,02).

análise CART

a Figura 1 mostra o modelo de carrinho seleccionado construídas em todas as variantes genéticas investigados e factores de risco ambientais. A árvore final continha oito nós terminais. A primeira divisão do nó raiz estava no hábito de fumar, o que indica que o tabagismo é o fator de risco mais forte para câncer de pulmão. Entre os fumantes, as divisões posteriores mostraram interações entre

EPHX1

Tyr113His,

SULT1A1

Arg213His e

GSTM1

. Em não-fumantes primeira divisão foi em

CYP1A1 * 2A estatuto

, que estava em concordância com a análise LR onde

CYP1A1 * 2A

mostrou forte associação apenas para arriscar em não fumantes. Outras interações foram previstos pelo

SULT1A1

Arg213His polimorfismo e betel estatuto quid. nó Terminal 7, que composto de menos percentagem de casos em não-fumantes, foi tomado como referência para calcular ou para outros nós terminais. Entre os fumantes foi observada risco máximo para node1 do terminal que consiste em

EPHX1

113TT (Tyr /Tyr) ou -113CC (HIS /HIS) genótipos (OR = 4,38; IC95% = 2,12-9,15) e para o nó de terminal 2 com combinação de

EPHX1

113TC (Tyr /His),

SULT1A1

213GG (Arg /Arg) ou AA (His /His) e

GSTM1

genótipos nulos (OR = 3,73; IC95% = 1,33-10,55, p = 0,006). Em não-fumantes de alto risco foi observado para o nó de terminal 5, que compreende de

CYP1A1 * 2A

6235CC ou TC,

SULT1A1

213GG (Arg /Arg) e betel quid mastigação (OR = 2,93; 95 Cl% = 1,15-7,51, p = 0,01). Paralelo ao, análise CART acima em conjuntos de dados separados de fumantes e não-fumantes também foi realizada. No entanto, não detectamos qualquer interação de alta ordem nestas análises (dados não mostrados).

nós terminais são grossos fronteira.

* W: genótipo selvagem; V: genótipo variante, TN: Nó Terminal,

#p valor 0,05

Análise MDR

análise MDR foi aplicado para explorar ainda mais gene-gene e gene-ambiente interacções. Melhores modelos preditivos até 4 ordens de interação, juntamente com o seu CVC e TBA estão resumidos na Tabela 4. A análise foi executado separadamente para dados totais indicados e conjuntos de dados estratificados sobre tabagismo. Para conjunto total de dados, o tabagismo foi o melhor modelo de um locus de maior CVC (10/10) e testar a precisão de 0,6114, que foi estatisticamente significativa (p 0,001) determinou em 1000 o teste de permutação vezes. Para uma interação 2-locus combinação de fumar e

EPHX1

Tyr113His foi mais significativa com a CVC de 10/10 e TBA de 0,6407 (p 0,001). O modelo 3 lócus consistiu de fumar,

EPHX1

Tyr113His e

EPHX1

His139Arg com TBA de 0,6497 (p 0,001) e CVC de 10/10. O modelo de interação 4 loci de fumar,

EPHX1

Tyr113His,

EPHX1

His139Arg e

SULT1A1

Arg213His, foi o melhor modelo identificado, com o máximo de CVC (10/10) e TBA (0,6503, p 0,001). Este modelo tinha um valor de qui-quadrado de 66,31 (p 0,0001) e um OR de 4,93 (IC 95% = 3,32-7,33). Em fumantes o melhor modelo de interação foi o modelo de três loci que consiste em mascar tabaco,

EPHX1

Tyr113His e

SULT1A1

Arg213His ter máxima CVC (10/10) e TBA (0,6436, p 0,001) Entre todos os modelos identificados. O modelo transmitida 3,5 vezes maior risco para câncer de pulmão (95% CI = 2,69-7,69). Em não-fumantes o melhor modelo foi o modelo de três loci composto de

CYP1A1 * 2A

,

GSTP1

Ile105Val e

SULT1A1

Arg213His com CVC de 10/10 e TBA de 0,6677 (p 0,005). e um OR de 7,32 (IC 95% = 3,24-16,53)

Falso relatório positivo probabilidade (FPRP)

a Tabela 5 mostra os FPRPs para o 3 melhores modelos obtidos por análise de MDR. O modelo preditor de 4 loci no conjunto total de dados e modelo 3-loci em fumantes mostrou excelente confiabilidade mesmo quando assumindo muito baixas probabilidades anteriores (de 10

-3 a 10

-6) para detectar RUP de 1,5 e 2,0 . No entanto, o melhor modelo selecionado na categoria não fumador mostrou verdadeira associação apenas com alta probabilidade de 10

-1 para detectar OR = 1,5 e até 10

-2 para detectar OR = 2.0.

interação entropia gráficos

Depois de identificar as combinações de alto risco utilizando abordagem MDR, algoritmo de interacção entropia foi aplicada para interpretar relação entre as variáveis. Os gráficos foram construídos nos resultados MDR obtidos a partir da análise de conjunto total de dados (Figura S1) e no conjunto de dados estratificados por fumar (Figura 2). Em fumantes,

EPHX1

Tyr113His teve um grande efeito independente (4,64%) e uma interação não-aditivo com tabaco de mascar (entropia 1,79%). entropia considerável foi associada com

SULT1A1

Arg213His (1,88%) e sua interação com tabaco de mascar mais afastado 1,49% de entropia do grupo caso-controle. No entanto, não detectar qualquer interação não-linear entre os dois SNPs no modelo. Encontramos pequenas percentagens da entropia no estado de caso-controle explicado pelo consumo de álcool (0,56%) e tabaco de mascar (0,70%) de forma independente, mas uma grande porcentagem de entropia explicada pela interação entre esses dois fatores ambientais (2,47%). Em não-fumantes,

CYP1A1 * 2A

mostraram forte efeito principal com remoção entropia de 4,7%.

GSTP1

Ile105Val também teve um forte efeito independente (remoção entropia = 3,28%) e sua interação com

SULT1A1

Arg213His mais afastado 3,02% da entropia. Observou-se uma forte interacção sinérgica entre

SULT1A1

Arg213His e

CYP1A1 * 2C

como a combinação removido um adicional de 2,61% da entropia total.

O modelo de interação descreve a porcentagem da entropia (ganho de informação) removido por cada variável (principal efeito: representado por nós) e por cada combinação de pares de atributos (efeito de interação: representado por conexões). Os atributos são seleccionados com base nos resultados obtidos no caso de MDR de fumantes (A) e (B) não fumante. Marcadores: Ex3:

EPHX1

Tyr113His, ALC: o consumo de álcool, a confirmar: o tabaco de mascar, SULT:

SULT1A1

Arg213His, 2A:

CYP1A1 * 2A,

2C:

CYP1A1 * 2C

, P1:

GSTP1

Ile105Val

Discussão

O presente estudo utilizou vários métodos analíticos para avaliar primeiro as associações e, em seguida, explorar possíveis. interações de genes de metabolização de xenobióticos com fatores ambientais em risco para o cancro do pulmão. As abordagens de mineração de dados aplicadas têm a capacidade de pesquisar e identificar interações independentemente da importância dos efeitos principais. O achado mais importante deste estudo é o gene-gene e ambiente gene interações consistentemente identificados por todas as três abordagens estatísticas.

O tabagismo é o fator etiológico primário no câncer de pulmão. O mesmo se refletiu no presente estudo como o tabagismo mostrou forte associação em LR, o melhor modelo de um fator em MDR e formaram primeira divisão no carrinho. Interação de

EPHX1

Tyr113His e

SULT1A1

Arg213His foi consistentemente identificados em fumantes. Ambos

EPHX1

Tyr113His e

SULT1A1

Arg213His conferiu risco reduzido no subconjunto fumante em LR. Os dois polimorfismos, juntamente com

EPHX1

His139Arg formado o melhor modelo preditor na análise MDR em fumantes e também formou splits subsequentes dentro de fumantes no carrinho. enzima EPHX1 catabolizando epóxidos de PAH em dihydrodiols, que envolve a geração de metabólitos carcinogênicos mais reativos. A substituição de uma variante sua alelo no codão 113 (

EPHX1

Tyr113His) diminui a actividade desta enzima [18], assim, reduz o risco de cancro. Os estudos sobre o cancro do pulmão sugerem efeito protetor para o

Sua

113 (tipo lento), em comparação com

Tyr

113 (tipo rápido) que confere maior risco caner do pulmão [19] – [21]. O alelo variante também tem sido sugerida para diminuir o risco de cancro do ovário [22]. Temos anteriormente relatados resultados semelhantes da mesma população em câncer de esôfago mostrando

Seus alelo

113 para ser associado com um risco significativamente reduzido em fumantes [23]. Refletindo o mesmo, na análise CART nó Terminal 1 de Imparts mais de 4 vezes de alto risco para os fumantes, possivelmente, alta proporção de vencimento do selvagem

Tyr

113 genótipo homozigoto. reacção de sulfonação de

SULT1A1

é uma reação de desintoxicação, no entanto, também envolve bioativação de certos pró-carcinogéneos, incluindo aminas heterocíclicas e PAHs para formar-DNA cancerígena aduto [24], [25]. Os estudos in vitro sugerem que o modelo de substituição da histidina na posição 213 na sequência de aminoácidos está associada com a diminuição da afinidade para o substrato e um menor nível de proteína [26], que pode proteger contra a carcinogénese química dos PAH no cancro do pulmão [27]. Resultados sobre associação de

SULT1A1

Arg213His eo risco de câncer são inconsistentes, da associação nulo com risco de cancro colorectal [28] e câncer de próstata [29] para aumentar no risco de câncer de mama associado com

A

alelo 213 [30]. Outro estudo sobre câncer colorretal mostrou um risco significativamente reduzido para os indivíduos com

Seus

213 alelo [31]. Uma meta-análise de Kotnis et al [32] mostraram um efeito protetor significativo do polimorfismo em sete estudos de cânceres do trato geniturinário.

Entre os não-fumantes

CYP1A1 * 2A

e

GSTP1

Ile105Val foram os polimorfismos mais importantes identificadas para o desenvolvimento do câncer de pulmão. O alelo variante de ambos os polimorfismos conferiu risco significativo no subgrupo não-fumantes na análise LR. Da mesma forma, MDR 3 modelo de loci de

CYP1A1 * 2A

,

GSTP1

Ile105Val e

SULT1A1Arg213His

polimorfismos foi o melhor preditor de risco em não-fumantes. O

CYP1A1

6235T polimorfismo C MspI (

CYP1A1 * 2A

), está associada à maior atividade enzimática no sentido de benzopireno [33], [34]. Os resultados ambíguos investigações sobre associação entre

polimorfismos e câncer de pulmão CYP1A1

produziram [35], [36]. Similar aos nossos achados, um estudo realizado por Taioli et. ai. [37] relataram associação de

CYP1A1 * 2A

alelo variante com câncer de pulmão, no entanto após estratificação por fumar a associação permaneceu confinado apenas aos não-fumantes. Além disso, em uma análise combinada de 11 estudos sobre

CYP1A1 * 2C

polimorfismo em câncer de pulmão, Le Marchand et al [38] descobriu que ser associado com o risco de não-fumantes, um achado que corrobora nossos resultados. Outro estudo de Jose et al [39] sobre o câncer de pulmão não encontraram nenhuma associação de qualquer

CYP1A1

polimorfismo com fumantes. Resultados semelhantes foram relatados no câncer colorretal, onde genótipos heterozigotos e variantes de ambos CYP1A1 * 2A e CYP1A1 * 2C conferido risco em combinações com NAT2 apenas entre os não-fumantes [40]. ai.

Deixe uma resposta