PLOS ONE: Uma informação teórica Análise de Genética, sexo e idade em Câncer Patients

Abstract

genética da linha germinativa, sexo e vias hormonais de sinalização estão todos bem modificadores do risco de câncer e progressão descrito. Apesar de uma melhor compreensão da forma como germinal variantes genéticas interagem com outros fatores de risco de câncer pode permitir uma melhor prevenção e tratamento do câncer humano, medir e quantificar essas interações é um desafio. Em outras áreas de pesquisa, Teoria da Informação tem sido usada para descrever quantitativamente as interações multivariados semelhantes. Implementamos um romance análise de informação teórica para medir o efeito conjunto de uma alta frequência variante genética da linha germinal da via supressora de tumores p53 (MDM2 SNP309 T /L) e sexo em fenótipos clínicos cancro. Esta análise descreve quantitativamente as interacções sinérgicas entre sexo, o locus MDM2 SNP309, e a idade de início de desenvolvimento de neoplasias em portadores da mutação p53. Esses resultados oferecem uma base molecular e genética para o dimorfismo sexual observado de risco de câncer em portadores da mutação p53 e um modelo é proposto que sugere uma nova estratégia de prevenção do câncer de portadores da mutação p53

Citation:. Atwal GS, Rabadán R , Lozano G, LC Strong, Ruijs MWG, Schmidt MK, et al. (2008) An Analysis informação teórica da genética, sexo e idade em pacientes com câncer. PLoS ONE 3 (4): e1951. doi: 10.1371 /journal.pone.0001951

editor: Juha Klefstrom, da Universidade de Helsinki, Finlândia |

Recebido: 03 de outubro de 2007; Aceito: 26 de fevereiro de 2008; Publicação: 09 de abril de 2008

Direitos de autor: © 2008 Bond et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Apoio este trabalho vem do Cancer Foundation mama Research, The Simons Foundation, o Levy Fundação Leon e do Instituto Nacional do Câncer francês. Um apoio adicional deste trabalho vem de um apoio financeiro Cancer Center, CA16672, e uma subvenção NIH para Louise Strong, CA034936 P01

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

as funções de p53 de stress via de resposta como um caminho crítico supressor de tumores, tal como demonstrado pela observação de que o gene p53 é um dos genes mutados mais comuns em tumores humanos [1]. Além disso, ambos os ratos e os seres humanos que albergam uma linha germinal mutação de inactivação em apenas um alelo do gene p53 desenvolver tumores no início da vida e em frequências muito elevadas [2] – [5]. Os seres humanos portadora de uma mutação de p53 linha germinal inactivação perfazem 50% dos membros da síndrome de predisposição para o cancro de Li-Fraumeni. A idade de início da formação de tumores em portadores de mutações p53 humana tem sido mostrado para ser modificado em quatro estudos independentes por um único polimorfismo de nucleótidos de alta frequência no promotor do oncogene Mdm2 (MDM2 SNP309, T /L) [6] – [9 ]. O alelo G de SNP309 aumenta a afinidade de ligação ao ADN do activador de transcrição Sp1, o que resulta em níveis mais elevados de ARNm de MDM2 e de proteína nas células e tecidos humanos [6], [10] – [12]. Níveis mais elevados de MDM2 levar à atenuação do percurso da p53, em concordância com o papel de MDM2 como um regulador negativo chave da p53 [13]. Em portadores da mutação p53, foi demonstrado em três relatórios independentes que indivíduos com o alelo G de SNP309 são diagnosticadas com cancro, em média, de sete a quinze anos mais cedo do que os portadores da mutação p53 homozigóticos para o alelo T (Tabela 1) [6] – [8]. Propõe-se que os níveis elevados de MDM2 resultante do alelo G de SNP309, em conjunto com o alelo mutante p53, produz uma via supressora de tumores p53 severamente enfraquecida e resultam numa taxa de mutação mais elevado, os processos de reparação do ADN mais pobres, e a apoptose reduzida, levando à formação de tumor mais rápido e mais freqüente [14].

recentemente, estudos com cânceres esporádicos (162 pacientes com linfoma judaica ashkenazi, 969 finlandeses e 164 pacientes com câncer colorretal italianos, 105 pacientes com sarcoma alemães, 341 Norwegian não-pequenas doentes com cancro do pulmão de células e 658 pacientes com cancro da mama judaica Ashkenazi) demonstraram que os efeitos da L-alelo de MDM2 SNP309 locus no tumorigénese pode ser modificado por duas variáveis ​​adicionais; ou seja, sexo e o hormônio específico do sexo feminino-principalmente, estrogénio [15] – [19]. Especificamente, foi mostrado o alelo G de MDM2 SNP309 para acelerar a tumorigénese e aumentar o risco de cancro em mulheres e não nos homens para o cancro colorrectal, linfoma difuso de grandes células B, o cancro do pulmão e para o receptor altamente estrogénio positivo ( 50% dos tumores células), mas não para o receptor de estrogénio negativo carcinoma ductal, invasivo da mama [16], [18], [19]. Isto foi demonstrado para resultar no enriquecimento de indivíduos com o alelo G em mulheres pré-menopáusicas com estes cancros, quando comparada tanto com mulheres pós-menopausa ou mulheres com os mesmos cancros. Recentemente, Hu et ai. fornecida evidência para um mecanismo molecular possível para a forma como o alelo G de SNP309 pode acelerar a formação do tumor, neste modo específico do género e dependentes de estrogênio, por demonstração de que a hormona específica fêmea-principalmente, estrogénio, preferencialmente estimulou a transcrição do gene de MDM2 com o G-alelo de SNP309 [20].

género Curiosamente, também definiram dois estudos independentes para ser um fator de modificação do risco de câncer em portadores da mutação p53 [21], [22]. Especificamente, portadores da mutação p53 do sexo feminino foram mostrados para estar em maior risco de desenvolver câncer do que os seus homólogos masculinos. Por exemplo, por 20, 30, 40, e 50 anos de idade, as mulheres portadoras mostrou respectivos riscos cumulativos de 18%, 49%, 77% e 93% para o desenvolvimento de um primeiro do cancro, enquanto os portadores masculinos mostraram riscos de 10% , 21%, 33% e 68% [22]. O aumento do risco em mulheres portadoras não poderia ser explicada pela alta incidência de cânceres específicos de género, como as diferenças permaneceram após a exclusão de casos de cânceres de mama, ovário e próstata. Embora o possível envolvimento de estrogênio no aumento do risco de câncer em mulheres portadoras foi discutido, esta hipótese ainda não foi testado.

É intrigante hipótese de que o locus SNP309 poderia contribuir para o aumento do risco de câncer observada em mulheres portadoras embora o preferencial estimulação dependente de estrogénio da transcrição MDM2 do alelo G de SNP309. Se for verdade, manipulação estrogênio poderiam ser incorporados nas estratégias de prevenção para as transportadoras p53-mutação com o G-alelo de MDM2 SNP309. Tais pacientes têm estratégias de prevenção do câncer limitado. Neste relatório, a hipótese de que o hormônio específico, principalmente do sexo feminino, o estrogênio, poderia afetar tumorigênese em portadores p53-mutação é testado embora explorar possíveis interações entre MDM2 SNP309 lócus e sexo sobre a incidência de tumores dependentes da idade.

Há tem vindo a aumentar o interesse no desenvolvimento de ferramentas estatísticas para descobrir tais interações, como entre o genótipo e sexo, e seu efeito sobre fenótipos complexos, como a incidência de tumores dependentes da idade. métodos recentes, tanto paramétricas e não paramétricas, incluem redes neurais [23], métodos de particionamento recursivo [24], métodos de particionamento combinatória [25], a redução multifatorial-dimensionalidade [26] e regressão multi-local [27], [28] . Estes métodos são adaptados para atender a questões específicas sobre a natureza das interações multi-locos e invocar diferentes suposições sobre o modelo subjacente gerar esses dados. Aqui nós empregamos um romance quadro informação teórica para abordar a questão específica de saber se sexo e o locus MDM2 SNP309 interagir sinergicamente ou redundante em relação à idade de incidência de tumores em portadores da mutação p53. As propriedades ideais de termos de informação teórica na avaliação da variabilidade e correlação entre diversas variáveis ​​estão familiarizados com as comunidades de aprendizado de máquina e estatísticas, mas talvez não bem conhecido na área de epidemiologia e estatística médica. Uma vantagem adicional no contexto do presente estudo é que os princípios da teoria da informação nos permitem estudar fenótipos complexos expressos como números reais (ou seja, idade de aparecimento de câncer em oposição ao cenário de caso /controle binário), definindo a compartimentação ideal, ou binning, dos dados fenotípicos contínuos.

Métodos

p53 mutação Carriers (MD Anderson Cancer Center)

88 indivíduos que são membros da síndrome de Li-Fraumeni (LFS) famílias (total de 34) com mutações germinativas conhecidos em um alelo de p53 foram previamente genotipados para MDM2 SNP309 [6]. 66 destes foram diagnosticados com, pelo menos, um cancro. Das famílias LFS incluídos no estudo, 12 foram determinados através de estudos sistemáticos de sarcoma sequencial infância dos tecidos moles (7 famílias) e osteossarcoma (5 famílias) pacientes. As famílias remanescentes consistiam de pacientes referidos M. D. Anderson para pesquisa ou estudos clínicos com uma história pessoal ou familiar de câncer do tipo encontrado em LFS. A maior família contribui 14 amostras para este estudo; 16 famílias contribuem um único indivíduo.

p53 mutação Carriers (francês Rede LFS)

Sessenta e um portadores da mutação da linha germinal p53 afectadas ou não afectadas, de 41 famílias LFS não relacionados foram previamente genotipados para MDM2 SNP309 [7]. As características clínicas das famílias e descrição das mutações estavam disponíveis mediante solicitação. Quarenta e um germinativas portadores da mutação p53 afetados foram incorporadas neste estudo. A maior família contribui 3 indivíduos afetados com este estudo; 27 famílias contribuem um único indivíduo afetado.

p53 mutação Carriers (Estudo Dutch /Finnish)

Cento e oito pacientes de 87 LFS ou famílias LFS-como foram previamente selecionados para p53 mutações e genotipados para MDM2 SNP309 [8]. Noventa e sete foram selecionados na Clínica Cancer família da Holanda Cancer Institute e 11 no Hospital Central da Universidade de Helsínquia. Trinta e seis indivíduos afetados de 19 famílias realizadas mutações germinativas conhecidos no gene p53 e foram incorporadas neste estudo.

Análise informação teórica

Dada uma variável, digamos

X

, que pode existir em um dos

K

X

estados, e seu conjunto de probabilidades associadas {

p (X = x

1), P (X = x

2) … P (X = x

K)

}, então a entropia de Shannon fornece uma medida não-paramétrico geral da variabilidade ou conteúdo de informação, de

X

. Esta medida do conteúdo da informação é a única quantidade que satisfaz determinados critérios razoáveis, tais como

H [X]

deveria ser uma função crescente do

K

X

se todas as probabilidades são iguais . A entropia conjunta de duas variáveis ​​medidas em conjunto, dizem

X

e

Y

, também pode ser adequadamente definido, onde

p

(

x

i

,

y

j

) é a probabilidade para os dois eventos

X = x

i

e

Y = y

j

co -occurring. Pode ser mostrado que a seguinte desigualdade para a entropia conjunta deve sempre se aplicam,

H

[

X

,

Y

] ≤

H

[

X

] +

H

[

Y

], com igualdade se e somente se

X

e

Y Quais são variáveis ​​independentes

p

(

x

i

,

y

j

) =

p

(

x

i

)

P

(

y

J

), ou seja, a entropia conjunta será sempre menor do que a soma das entropias individuais, se houver alguma dependência, ou correlação, entre os dois variáveis. A medida da dependência estatística entre duas variáveis,

X

e

Y

, é então simplesmente capturado pela redução na entropia total quando as duas variáveis ​​são medidos em conjunto, isto é, a informação mútua de Shannon. Note que esta não invoca qualquer um dos linear (Gauss) premissas exigidas por outras medidas, como a correlação de Pearson. Esta definição também pode ser equivalentemente escrito como

I

[

X

;

Y

] =

H

[

X

] –

H

[

X

Y

] =

H

[

Y

] –

H

[ ,,,0],

Y

X

], onde a entropia condicional

H

[

X

Y

] é definida como, fazendo evidente que

I. [X; Y]

pode ser interpretado como a redução da variabilidade do

X

devido ao conhecimento do

Y

, e vice-versa

a análise dos dados usando versões discretas de expressões informação teórica, tal como definido no parágrafo anterior, requer a criação de lixeiras que Discretize valores contínuos. Por exemplo, o número real que representa a idade de diagnóstico de cancro tem que finalmente resolvido em um de vários grupos, essencialmente, uma tarefa de compressão de dados. Podemos contar com a teoria da informação e observe que a menos de particionamento tendenciosa de qualquer conjunto de dados é dada pelo princípio da entropia máxima, ou seja, o particionamento em caixas igualmente povoadas ou quantis. Neste caso, qualquer expressão informação teórica calculada a partir dos dados binned tem a propriedade importante e desejável que é invariante para INVERTIBLE transformações de coordenadas, por exemplo multiplicando todas as idades por um fator constante não deve afetar a informação mútua com a variável de SNP. Um problema comum com quantização números reais em caixas é decidir quantas caixas de usar, e para este fim, novamente apelar para a teoria da informação. Um critério sensato pode ser adquirida a partir da observação de que, se tentarmos medir a informação mútua entre duas distribuições independentes finitos-amostradas, em seguida, que empregam muitos caixotes vai over-ajustar os dados, dando origem a um valor diferente de zero de informação mútua, mesmo quando extrapolada para o infinito limite de amostra [29]. Por outro lado, comprimindo os dados em muito poucas caixas de sobre-suaviza os dados, e potencialmente perde estrutura importante nestes dados. Assim, deve haver um trade-off ideal entre compressão encaixe mais e informações. Determinou-se que o número óptimo de recipientes no nosso conjunto de dados eram três, e para estabelecer isto, os valores de informação mútua foram calculados em primeiro lugar com dados misturadas aleatoriamente, para destruir qualquer correlação, e observou-se que, quando o número de compartimentos foi aumentada de três a quatro e superior, os valores de informação mútua extrapolados já não era zero no espaço de barras de erro. Assim, restringindo o número de caixas que incorporam implicitamente uma penalidade depende do tamanho da amostra para o excesso de encaixe dos dados. detalhes mais explícitos sobre este e outros possíveis métodos de estimativa de informação mútua são dadas em [29], [30]

Informações sinérgica

Estes conceitos informação teórica pode ser estendido para sondar naturalmente questões de dependências estatísticos entre mais de duas variáveis. Em particular, os níveis de sinergia e a redundância entre três variáveis ​​pode ser quantificado de um modo de princípio, e foram recentemente formulado no contexto da análise de correlação entre os neurónios [29], [30]. Se usarmos a definição de sinergia entre as duas variáveis ​​

X, Y

em relação a uma terceira variável

Z

, como a quantidade de informação extra

X

e

Y

juntos fornecem cerca de

Z

que pela

X

e

Y

separadamente, então somos imediatamente levar à formulação natural de informações sinérgica como

S ( X, Y, Z) = I (X, Y, Z) -I (X; Z) -I (Y; Z) onde

. As informações sinérgica revela assim como grande parte da variabilidade da

Z

é reduzida por saber tanto

X

e

Y

juntos do que conhecê-los separadamente e, portanto, rigorosamente quantifica a não- efeitos independentes de ambos

X

e

Y

em

Z

. Esta formulação matemática da sinergia pode ser generalizada, naturalmente, a mais de três variáveis.

Análise Estatística

Pode não ser claro como interpretar com precisão os valores de informação teórica determinadas a partir de distribuições empíricas, especialmente porque estatística flutuações crescem com a diminuição do tamanho da amostra. Além disso, devido à concavidade da entropia de Shannon, amostragem finita induz uma polarização negativa na entropia empírica e uma polarização positiva na informação mútua empírica [29]. Esses problemas exigem geração de p-valores para os valores de informação teórica calculada contra uma hipótese nula especificada. No caso de informação mútua, a hipótese nula foi que nenhuma dependência estatística entre uma única variável (ou SNP ou sexo) e idade do diagnóstico, ou seja, a probabilidade conjunta é simplesmente um produto das marginais,

p (variável , idade) = p (variável) p (idade)

. No caso de informações sinérgica, a hipótese nula foi que não houve correlação entre duas variáveis ​​e idade do diagnóstico, preservando a correlação entre as duas variáveis, ou seja,

p (SNP, sexo, idade) = p (SNP, sexo) p (idade)

,

p (SNP, idade) = p (SNP) p (idade) Comprar e

p (sexo, idade) = p (sexo) p (idade)

. Os valores de p foram determinados por um teste de permutação de Monte Carlo. Um número mínimo de 10

6 permutações eram obrigados a gerar uma gama intervalo de confiança de menos de 0.005 no valor de p 0,05.

Um teste de dois lados Mann-Whitney foi utilizado para determinar a significância estatística a diferença na idade média de diagnóstico do tumor entre os grupos com e sem o alelo G de SNP309. Estritamente falando, o teste de Mann-Whitney é uma avaliação não-paramétrico de se dois conjuntos de dados são extraídos a partir da mesma distribuição, mas se os dois conjuntos de dados têm aproximadamente a mesma forma, em seguida, é justificado para interpretar os resultados do teste como uma declaração sobre se a mediana nos dois grupos não são estatisticamente diferentes. Um teste de permutação foi empregue para determinar a significância da diferença na média de idade de diagnóstico de tumores entre os dois grupos [6]. Tanto um teste de Kolmogorov-Smirnov e um teste Cramer-Smirnov-de Von Mises foram utilizados para determinar a significância da diferença nas distribuições de idade de diagnóstico entre os grupos com e sem o alelo G de SNP309. Ao empregar todos esses testes para significância, muitos dos pressupostos inerentes a qualquer um dos testes são eliminados.

Resultados

Para testar os efeitos de, e das interacções entre os sexos e os alelos no o gene MDM2 SNP309 locus de cima tumorigénese em portadores de mutações de p53, todos os portadores da mutação p53 144, que foram genotipados no locus MDM2 SNP309 anteriormente [6] – [8], foram estudados (Tabela 1). Colectivamente, quando os 144 indivíduos foram separados em diferentes genótipos do locus SNP309, indivíduos que possuíam o alelo G quer no estado heterozigótico ou homozigótico (n = 81), mostrou a idade muito significativa de 11 anos mais cedo média da primeira tumoral início em comparação com indivíduos T /T (n = 63) no genótipo (indivíduos T /T, a média é de 33 anos de idade contra 22 anos de idade em G /L e T /G indivíduos, p = 0,0006, Mann Whitney). A idade média no início significativa do primeiro aparecimento do tumor entre os portadores de alelo G também foi visto em ambos os sexos. Homens que levavam a G-alelo tanto no estado heterozigoto ou homozigoto (n = 35), mostrou a idade de um significativo de 12 anos mais cedo média da primeira aparecimento do tumor em comparação aos machos T /T (n = 23) no genótipo (p = 0,0436 , Mann Whitney). As fêmeas que levaram o G-alelo tanto no estado heterozigoto ou homozigoto (n = 46), mostrou a idade de um significativo de 10 anos mais cedo média da primeira aparecimento do tumor em comparação com as fêmeas T /T (n = 40) no genótipo (p = 0,0223 , Mann Whitney).

a fim de comparar diretamente a incidência dependente da idade de câncer entre machos e fêmeas, os indivíduos que desenvolveram principalmente cânceres específicos de cada sexo (mama e próstata) foram excluídos desta análise, deixando STS , osteossarcomas e leucemias como os principais tipos de tumores analisados ​​em ambos os sexos (Figura 1A e B). Dos restantes 101 indivíduos, 57 indivíduos eram do sexo masculino e 44 do sexo feminino (Tabela 1). A informação mútua partilhada entre género, os alelos G e T de MDM2 SNP309 e a idade de diagnóstico primeiro tumor foram calculadas e os resultados são apresentados na Figura 1C. Como esperado a partir das análises anteriormente publicadas destas populações [6] – [8], o locus MDM2 SNP309 afecta a idade de diagnóstico do tumor de uma forma significativa, como demonstrado por um nível significativo de informação mútua (0,10 bocados, p = 0,007, Permutação Teste). Em contraste com o que era esperado a partir das avaliações anteriores de risco geral de câncer em portadores da mutação p53 [21], [22], sexo sozinho não mostrou um nível significativo de informação mútua com a idade do primeiro diagnóstico do tumor (0,002 pedaços, p = 0,9, Permutation Test). Com efeito, quando os 101 indivíduos foram separados em diferentes genótipos do locus SNP309, indivíduos que possuíam o alelo G, quer em heterozigotos ou estado homozigótico, mostrou uma muito significativa de 12 anos de idade no início da média, e a idade de 17 anos mediana de aparecimento primeiro tumor em comparação com indivíduos T /T no genótipo (indivíduos T /T, a média é de 30 anos de idade, variando de 1 a 71 anos, contra 18 anos de idade em G /L e indivíduos T /L, variando de 1 a 59 ano, a Figura 1D e Tabela 2). significância estatística desta idade média de 12 anos antes, e idade de 17 anos antes mediana de aparecimento do tumor foi medido utilizando um teste de permutação e um teste de Mann-Whitney (ver Materiais e Métodos, p = 0,0008 e p = 0,0015, Tabela 2) . Além disso, a significância da diferença nas distribuições das idades de diagnóstico de tumor entre os transportadores alelo G e indivíduos T /T genótipo, como pode ser visto na Figura 1D, foi medido utilizando duas abordagens: o ensaio Kolmogorv-Smirnov e o Cramer- Smirnov-Von Mises teste. Ambos os testes apoiou o significado dessas diferenças por produzindo valores de p 0,0091 e 0,0046, respectivamente (Tabela 2). Em contraste, quando os 101 indivíduos foram separadas com base no sexo sozinho, não há diferenças significativas na média de idade de aparecimento do tumor foram observados. Especificamente, os transportadores p53-mutação do sexo feminino foram diagnosticados, em média, aos 23 anos de idade (variando de 1 a 71 anos de idade) quando comparados com os portadores do sexo masculino, que foram diagnosticados, em média, aos 24 anos de idade (variando de 1 a 59 anos de idade , Figura 1E e Tabela 2).

a fim de comparar a incidência dependente da idade de câncer entre machos e fêmeas, os indivíduos que desenvolveram cancros principalmente específicas de gênero foram excluídos desta análise, deixando STS, osteossarcoma e leukemmias como os principais tipos de tumores analisados ​​como descrito nos gráficos circulares para ambos os machos (a) e (B) as fêmeas. (C) O gráfico de barras mostra os bits de informação mútua entre o locus MDM2 SNP309 e a idade de início do tumor, sexo e a idade de início do tumor e, por último, entre as três variáveis. Os valores p associados são descritos abaixo. (D) A incidência cumulativa de diagnóstico de tumores, tanto para os indivíduos T /T no genótipo (quadrados pretos) e T /G ou G /G (SNP309) em genótipos (diamantes cinzentos) é representada graficamente como uma função da idade. Um quadrado ou um diamante representa pelo menos um indivíduo. (E) A incidência cumulativa de diagnóstico de tumores em ambos os machos (quadrados pretos) e fêmeas (diamantes cinzentos) é representada graficamente como uma função da idade.

Como acima mencionado, uma vantagem de uma análise de informação teórica de interações é que as interações não-aditivos podem ser detectados e quantificados. Curiosamente, esta análise revelou que o locus de MDM2 SNP309 e sexo tomados em conjunto interagem para afectar a idade de diagnóstico de tumores em um não-aditiva, forma sinérgica, tal como demonstrado pelos medidos 0.06 bits de informação sinérgico significativo (p = 0,05, Permutação de teste) . Isto sugere que o efeito modificador bem definido do locus de MDM2 SNP309 sobre a idade do primeiro aparecimento de tumores em portadores de mutações de p53 (Tabela 1) podem ser significativamente diferentes entre os sexos. Para testar isto, a interacção dos alelos de MDM2 SNP309 com a idade de diagnóstico do tumor foi medido em ambos os sexos por cálculo respectivas informações mútuos. Curiosamente, através desta medida, o locus MDM2 SNP309 interage apenas significativamente com a idade de diagnóstico de tumores em mulheres portadoras e não em portadores masculinos. Especificamente, em portadoras, o locus MDM2 SNP309 e da idade da quota de diagnóstico do tumor uma significativa 0,2 bits de informação mútua (p = 0,014, Figura 2A). No entanto, nos portadores do sexo masculino, os 0,114 bits de informação mútua medida não atingiu significância com um p-valor de 0,06.

(A) O gráfico de barras mostra os bits de informação mútua entre o locus MDM2 SNP309 eo idade de tumor aparecimento em mulheres e em homens. Os valores p associados são descritos abaixo. O locus MDM2 SNP309 e da idade da quota de diagnóstico do tumor de informação mútua significativa apenas em mulheres e não em homens. A significância estatística é representada pela marcação preta do gráfico de barras e os valores de p descritos abaixo. A incidência cumulativa de todos os tipos de tumores específicos não-género, tanto para os indivíduos T /T no genótipo (quadrados pretos) e T /G ou G /G em genótipo (diamantes cinzentos) é representada graficamente como uma função da idade de fêmeas (B) e machos (C). Um quadrado ou um diamante representa pelo menos um indivíduo.

Quando separados para os diferentes genótipos do locus SNP309, as 23 mulheres que carregavam o alelo G tanto no heterozigoto ou estado homozigoto, mostram uma significativa de 16 anos antes da idade média, e 23 anos de idade média de aparecimento do tumor em comparação com as 21 fêmeas T /T no genótipo (fêmeas T /T, 31 anos de idade, variando de 2 a 71 anos, contra 15 anos de idade em G /G e T /G fêmeas, que variam de 1 a 54 anos, p = 0,007 e p ​​= 0,0037, Figura 2B e na Tabela 2). As suas respectivas distribuições das idades de diagnóstico de tumores, também diferem significativamente, como medido pelo teste de Kolmogorov-Smirnov e Cramer-Smirnov-Von Mises teste (p = 0,0275 e 0,0077, Tabela 2). Como previsto pela análise informação teórica as diferenças entre o macho transportadoras G-alélicas e os machos T /T no genótipo são muito mais fracos. Quando separados para os diferentes genótipos do locus SNP309, os homens que levaram o G-alelo tanto no heterozigoto ou estado homozigoto, mostrou média de idade de um significativo de 10 anos antes do aparecimento do tumor em comparação aos machos T /T no genótipo (T /T do sexo masculino, 30 anos de idade, que variam de 1 a 55 anos, em comparação com 20 anos de idade em G /L e fêmeas de T /G, que varia de 1 a 54 anos, p = 0,0285, Figura 2C e Tabela 2). No entanto, o significado medida das diferenças nas medianas e distribuições em machos eram apenas boarder-line significativa com valores de p de 0,0672, 0,0478 e 0,0469, respectivamente (Tabela 2). Assim, os valores de p calculados de várias maneiras diferentes foram 5-10 vezes mais fraca para o impacto do G-alelo sobre a idade de início dos primeiros tumores em homens do que mulheres.

Discussão

neste relatório, as dependências estatísticos do locus MDM2 SNP309 e sexo sobre a idade do primeiro aparecimento de tumores em portadores da mutação p53 foram determinados utilizando uma abordagem de informação teórica quantitativa romance. As três populações de pacientes que foram originalmente utilizados para definir MDM2 SNP309 como um modificador de desenvolvimento de neoplasias em portadores da mutação p53 foram analisados ​​(Tabela 1). A análise revelou um nível significativo de informação mútua entre o locus MDM2 SNP309 e da idade do primeiro aparecimento de tumores, mas não entre o sexo ea idade de início do tumor (Figura 1). A abordagem informação teórica permitiu a sondagem de dependências estatística entre as três variáveis ​​(os alelos de MDM2 SNP309, sexo e idade do primeiro aparecimento do tumor). Curiosamente, o locus MDM2 SNP309 e sexo em conjunto foram mostrados para interagir e afetar a idade do diagnóstico do tumor específico do não-género de forma não-aditivo, forma sinérgica (Informações sinérgica = 0.06 bits; p = 0,05). Nas fêmeas, o locus MDM2 SNP309 e da idade da quota de diagnóstico do tumor de informação mútua significativa que, no sexo masculino, o nível de informação mútua medida não chegou a alcançar significância (Figura 2). Em outras palavras, a análise das três variáveis ​​neste estudo revelou que o género de facto desempenhar um papel na incidência dependente da idade, mas apenas quando a informação também é proporcionado sobre a forma alélica de locus SNP309 MDM2. Isto é provavelmente devido à observação de que apenas o alelo G no MDM2 SNP309 é estimulado para produzir mais de ARNm e proteína MDM2 na presença de estrogénio [20]. testes estatísticos padrão que medem a significância das diferenças tanto na média e mediana idades de primeiro aparecimento do tumor e nas distribuições das idades de diagnóstico de tumor entre as transportadoras e os indivíduos T /T no genótipo G-alélicas validados estas observações (Tabela 2).

Como mencionado acima, a abordagem informação teórica pode sondar questões de dependências estatísticas entre mais de duas variáveis ​​e podem quantificar os níveis de sinergia e redundância. estudos genéticos e epidemiológicos em larga escala cada vez mais reconhecido que as variáveis ​​têm interagir de uma maneira não aditiva no que diz respeito ao risco de doença, isto é, as variáveis ​​não agir independentemente um do outro. Destacando essas dependências é fundamental na compreensão de como o risco de doença pode ser modificado sutilmente por uma variável escondida e pode explicar por que diferentes estudos epidemiológicos podem relatar diferentes conclusões baseadas em visualização de uma única variável [17]. Além disso, a identificação e quantificação das interações sinérgicas também pode brilhar uma luz sobre novos mecanismos biológicos, tais como conversas cruzadas entre duas vias de sinalização. No entanto, até à data, não houve nenhuma definição rigorosa e, assim, nenhuma quantificação de tais interacções sinérgicas. A teoria da informação e os métodos descritos aqui formam um quadro natural para abordar estas questões de dependências estatísticas entre as variáveis ​​ao invocar nenhuma suposição paramétricos.

Em conclusão, a análise informação teórica das dependências estatísticos do locus MDM2 SNP309 e sexos com a idade de aparecimento de tumores em portadores de mutações de p53 sugere que o alelo G de funções SNP309 principalmente em portadores da mutação p53 do sexo feminino para acelerar a formação do tumor, proporcionando assim um potencial base genética para o dimorfismo sexual observada no risco de cancro [21], [22 ]. Estas observações em conjunto com as observações que tanto pré-pubescentes e pós- pubescentes fêmeas têm níveis mais elevados de estrogénio [33], [34], e que o estrogénio tem sido mostrado que estimula preferencialmente a transcrição da

MDM2 de

o alelo G [20], fornecer uma hipótese razoável; o G-alelo do locus SNP309 MDM2 poderia contribuir para o aumento do risco de cancro do observado em portadores da mutação p53 fêmeas através da estimulação dependente de estrogénio preferencial da transcrição do gene MDM2.

Deixe uma resposta