PLOS ONE: Assinatura forte da seleção natural dentro de uma FHIT Intron Implicado no cancro da próstata Risk

Abstract

Anteriormente, uma abordagem de ligação gene candidato em pares de irmãos afetados com câncer de próstata identificou um lócus de suscetibilidade ao câncer de próstata em D3S1234 dentro do gene frágil histidina tríade (

FHIT

), um supressor de tumor que induz a apoptose. testes de associação subseqüentes em 16 SNPs abrangendo aproximadamente 381 kb em torno D3S1234 em americanos de ascendência europeia revelou evidência significativa de associação para um único SNP dentro intron 5 de

FHIT

. No atual estudo, re-sequenciação e genotipagem dentro de uma região de 28,5 kb em torno deste SNP delineado ainda mais a associação com o risco de câncer de próstata a uma região de 15 kb. Vários SNPs em sequências sob restrição evolutiva dentro intron 5 de

FHIT

definidos vários haplótipos relacionados com um risco aumentado de câncer de próstata em europeus-americanos. Fortes associações foram detectados por um haplótipo de risco definido pelo SNPs 138543, 142413 e 152494 em todos os casos (χ de Pearson

2 = 12,34, df 1,

P

= 0,00045) e para o haplótipo de risco homozigoto definido por SNPs 144716, 142413 e 148444, em casos que compartilharam 2 alelos idênticos por descendência com os seus irmãos afetados (χ de Pearson

2 = 11,50, df 1,

P

= 0,00070). Além de sequências altamente conservadas que abrangem SNPs 148444 e 152413, estudos populacionais revelaram fortes assinaturas de seleção natural para uma janela 1 kb abrangendo o SNP 144716 em duas populações humanas, o americano Europeia (π = 0,0072, D de Tajima = 3,31, 14 SNPs) e os japoneses (π = 0,0049, Fay H de Wu = 8,05, 14 SNPs), bem como em chimpanzés (Fay H de Wu = 8,62, 12 SNPs). Estes resultados suportam fortemente o envolvimento do

FHIT região dos intrônica em um risco aumentado de câncer de próstata

Citation:. Ding Y, Larson G, Rivas G, Lundberg C, Geller L, Ouyang C , et ai. (2008) Assinatura forte da seleção natural dentro de um

FHIT

Intron Implicado no Prostate Cancer Risk. PLoS ONE 3 (10): e3533. doi: 10.1371 /journal.pone.0003533

Autor: Matthew W. Hahn, da Universidade de Indiana, Estados Unidos da América

Recebido: 11 de setembro de 2008; Aceito: 02 de outubro de 2008; Publicado: 27 Outubro 2008 |

Direitos de autor: © 2008 Ding et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. YD, GL, GR, CL, CO, TGK foram apoiados pelo NIH AG15720, DOE PC020680, e do Instituto de Pesquisas Beckman do City of Hope. LG, JW, JA, JS, MBD, ABB, JMK, PJO, RS, JAS, DJ foram apoiados pelo NIH AG15720. MN foi apoiado pelo NIH HG-002790

Conflito de interesses:. Os financiadores não tiveram nenhum papel na análise de dados, escrita, ou decisões de publicação

Introdução

A complexidade genética de. cancro da próstata tem sido bem demonstrado pela grande escala, os estudos de associação independentes, de todo o genoma que identificadas múltiplos loci risco ao longo do genoma humano [1], [2], [3], [4], [5], [6 ]. Estes loci cada um só aumenta moderadamente o risco de uma pessoa da doença em até 60% e pode coletivamente representam mais de 50% do risco genético de câncer de próstata observada na população humana. loci de risco adicionais continuam a ser descobertos através de meta-análise dos dados existentes e um estudo mais aprofundado.

análise de ligação utilizado recentemente de genes candidatos e testes de associação subseqüentes para implicar uma região de 30 kb dentro intron 5 de

FHIT

no risco de câncer de próstata [7]. O

FHIT

gene, que codifica uma triphosphatase 16,8 kD, composto por 10 exons curtas que medem cerca de 1,5 Mb. Ele reside no local frágil mais frequentemente observada no genoma humano,

FRA3B

(3p14.2); e é uma das primeiras regiões e mais frequentemente deletados em vários tipos de cancro [8], [9]. Embora a eliminação da

gene FHIT

no tecido de câncer de próstata não tem sido amplamente relatado, perda de heterozigosidade (LOH) foi relatada em 2 de 15 tumores através do uso de marcadores microssatélites localizados em íntrons de

FHIT

[10]. Perda de

FHIT

também foi detectado em um

in vitro

modelo de uma linha de células de tumor de câncer de próstata, que foi criado usando HPV-18 para imortalizar uma próstata humana linhagem de células do epitélio adulto normal, seguido pela transformação maligna através da exposição a um agente cancerígeno químico [11], [12]. A análise imuno-histoquímica em tecido de cancro primário confirmou a ausência ou grandemente reduzida expressão dos níveis de proteína FHIT em células tumorais, em contraste com os elevados níveis de expressão no epitélio da próstata normal adjacente [12], [13].

Embora FHIT a expressão da proteína é perdido ou reduzido em muitos tipos de cancros humanos [9], o mecanismo de base para o envolvimento de intron 5 em risco genético de câncer de próstata não é aparente. Uma alteração da linha germinativa na

FHIT

que está associada com o risco de cancro não foi relatado, possivelmente por causa de limitações de estudos anteriores que focado apenas em exões, regiões não traduzidas do ARNm, e promotores. marcos característicos de uma região frágil, como quebras induzida por afidicolina híbridos, locais de integração HPV16, locais de integração pSV2Neo e pontos finais exclusão em linhas celulares de cancro, foram identificados dentro de íntrons de

FHIT

[14]; No entanto, estes pontos de referência não se sobrepõem com a região dentro do intrão 5 que implicados no risco de cancro da próstata. FHIT desempenha um importante papel na indução de apoptose de células que respondem a danos de ADN causados ​​por exposição a uma variedade de agentes ambientais, tais como a radiação, vírus e produtos químicos tóxicos presentes no fumo do tabaco e de minas de estanho [15], [16], [17 ]; no entanto, os elementos genéticos que controlam esses processos não foram identificados.

As forças evolutivas da mutação, seleção natural, deriva genética e recombinação moldaram o padrão de variação no genoma humano. A seleção natural, que age sobre funcionalmente importantes variações genéticas que resultam em alteração de aptidão, como adaptação ao ambiente local e susceptibilidade à doença, pode deixar assinaturas específicas sobre loci afetada [18], e análise de variação genética em populações está a tornar-se central para a compreensão a função de genes [19], [20]. Triagem para assinaturas de seleção natural pode ajudar a descobrir novos elementos funcionais. Portanto, temos usado essa abordagem para determinar a existência de seleção pode ser detectado dentro dos 30 kb

FHIT região dos intrônica. Foi realizado um levantamento re-sequenciação e análise desequilíbrio de ligação (LD) e da estrutura haplótipo em sequências de intrão 5 de

FHIT

em American Europeia, Yoruban e populações japonesas, e vários primatas não-humanos. Com base nesses dados, nós refinado a região associada com o risco de câncer de próstata a um Kb bloco 15 LD e revelou fortes assinaturas de seleção em várias populações humanas e, eventualmente, outras espécies de primatas.

Resultados

Re-sequenciamento

Larson et al. [7] testados 16 SNPs abrangendo uma região 381 kb dentro intron 5 de

FHIT Compra de associação com o risco de câncer de próstata e detectou uma associação significativa com um dos SNPs, rs760317. A associação menos significativa com o risco de câncer de próstata foi encontrado em uma intimamente ligada SNP, rs722070, localizado a 13 kb de rs760317 no lado centromérica; nenhuma associação foi detectada com SNPs no lado do telomérica. Para mapear a associação com o risco de câncer de próstata em alta resolução e procurar evidências de seleção, foi realizada uma pesquisa re-sequenciação utilizando 13 casos e controles de ascendência europeia-americana escolhidas aleatoriamente. O total pesquisado comprimento da sequência foi de 28,5 kb, excluindo duas lacunas seqüência un-amplific�eis de 487 pb e 263 pb. Uma das lacunas continha uma repetição AT e uma longa poli A do trato, e o outro continha AT e AG repete. Dois fragmentos desta região com comprimentos de 19 kb (de 134 kb para 153 kb; GeneBank Adesão # AF152364) e 7 kb (de 142 kb para 149 kb internos à 19 kb; GeneBank Adesão # AF152364) também foram sequenciados em 16 Yoruban e 16 indivíduos japoneses, respectivamente.

em toda a região, foram identificados 216 SNPs e 9 indels, variando de 1 a 24 pb, nos 13 indivíduos europeus-americanos (Tabela S1). Dentro da região de 19 kb, sequenciado em ambos os europeus-americanos e Yorubans, encontramos 146 SNPs e 7 indels comuns a ambas as populações, 99 SNPs e 1 INDEL única para Yorubans e 19 SNPs e 1 INDEL exclusivos para os americanos europeus. Dentro da região de 7 kb sequenciado em todas as três populações, foram detectados 64 SNPs e 4 indels comuns às três populações; 28 SNPs e um indel única para Yorubans; 2 SNPs únicas para europeus-americanos; 1 SNP exclusivo para os japoneses; e 9 SNPs e 1 INDEL comum a duas populações. Indels e SNPs em longas faixas de repetições simples não foram incluídos nestas estatísticas e análises subsequentes, devido à baixa precisão do sequenciamento nestas áreas.

O desequilíbrio de ligação (LD)

Foram calculados Pair- R sábio

2 baseado em SNPs com uma frequência do alelo menor superior a 0,05 (196 SNPs para as amostras 13 Europeias-americanos e 178 SNPs para as amostras 16 Yorubans) utilizando Haploview (Fig. 1A e C) e taxas de recombinação com pontos de acesso usando rhomap (Fig. 1B). Consistente com relatórios anteriores [21], [22], observou-se muito menos LD na amostra Africano, embora o padrão de LD foi de outra forma semelhante entre as populações. A diferença mais notável entre as duas populações foi o de blocos LD 15 kb na população americana Europeia, que foi interrompida por muito mais elevada taxa de fundo de recombinação e pelo menos um hotspot recombinação na população Yoruban (Fig. 1B). Foram selecionadas 48 SNPs do inquérito re-sequenciação e três SNPs publicados em Larson et al. [7] que representava a estrutura básica LD e genotipados esses SNPs em todas as amostras de estudo e controle para avaliar a sua associação com o câncer de próstata.

A. Representação gráfica de r de pares

2 (0-1 representado com escala de cinza do branco ao preto) calculada e visualizada utilizando Haploview por 13 americanos europeus. taxas B. Recombinação (RHO) calculados usando rhomap para Yorubans (linha vermelha, com posições de SNP representados por círculos abertos) e os americanos europeus (linha preta, com posições de SNP denotados por diamantes sólidos) com base em dados de sequenciamento. A linha cinza com triângulos foi baseada em dados de genotipagem em 51 SNPs de 25 casos e 25 controles (europeus americanos). representação gráfica de C. r

2, utilizando para 16 Yorubans. A barra preta sólida representou um bloco LD 15 kb no American Europeia.

Associação Testes

Realizamos testes de associação de SNPs e haplótipos de combinações SNP individuais. Como os dados de ligação inicial previa um modelo recessivo [7], a hipótese de que o subgrupo de casos que fizeram 2 alelos idênticos por descendência (IBD) neste locus com os seus irmãos (2 casos de DII) seriam os principais contribuintes para o observado genética sinal. Portanto, em comparação frequências SNP nos controles contra todos os casos e 2 casos de DII (Tabela S2). associação significativa (cutoff

P

= 0,05, não corrigido para testes de múltipla) foi observada por vários SNPs e maximizada na 137302 (rs9814915, χ de Pearson

2 = 5,16, graus de liberdade (df) 1,

P

= 0,0231) para todos os casos (círculos abertos individuais na Fig. 2A) e 138543 (rs760317, χ de Pearson

2 = 7,42, df 1,

P

= 0,0064) para o 2 subgrupo IBD (círculos pretos individuais na Fig. 2A).

A. testes de associação de SNPs individuais e haplótipos. SNPs individuais foram ancorado em um mapa UCSC Genome com o alinhamento Multiz e conservação de vertebrados (v166; https://genome.ucsc.edu) para a região de 30 kb. A região foi representado com um bar aberto em uma inserção no canto superior esquerdo que descreve os testes de SNP individuais em torno de uma região mais ampla 381 kb. Uma seta apontando para o marcador microssatélite, D3S1234, exibindo o sinal de ligação mais forte no estudo original. A barra preta sólida corresponde ao bloco LD 15 kb no American Europeia. Testes na freqüência do alelo para SNPs individuais são indicados por círculos (aberto para todos os casos e pretas por 2 casos de DII). Os testes de haplotyes de risco são representados por círculos com ligações com linhas. SNPs destacado em vermelho estão em LD forte (r

2 0,9) uns com os outros. B. Nucleotide diversidade (π) calculado para Yorubans (linha vermelha), os americanos europeus (linha preta) e japonês (linha azul). D de C. Tajima calculado para Yorubans (linha vermelha), os americanos europeus (linha preta) e japonês (azul) usando SLIDER. D. Diversidade entre as sequências de humanos e chimpanzés (linha verde escuro incluindo SNPs em humanos e em linha luz verde excluindo SNPs em seres humanos).

Rastreio de associação de haplótipos para todas as combinações de três SNP revelou que a associação mais forte do cancro da próstata risco foi com um haplótipo definido por SNPs 135181, 142413, 152494 e em 2 casos de DII (haplótipo GGT foi enriquecido em 2 casos de DII, χ

2 = 9,73, df 1,

P

= 0,0018, Tabela S3) e SNPs 138543, 142413 e 152494 em todos os casos (haplótipo AGT foi enriquecida em todos os casos, χ

2 = 13,72, df 1,

P

= 0,00021, Tabela S3). A adição de qualquer outra SNP único para a combinação não aumentou a associação com o risco de cancro da próstata, enquanto que omitindo qualquer SNP nas combinações reduziram significativamente o sinal (dados não mostrados). Consistente com um modelo recessiva, as amostras que eram homozigóticos para o haplótipo risco foram significativamente enriquecida em casos em comparação com os controlos.

Interessantemente, ambas as combinações SNP identificados em todos os casos e 2 casos IBD incluídos SNPs 142413 e 152494, que exibiram individualmente associação muito limitada com o risco de câncer de próstata. SNP 152494 foi localizado dentro de uma sequência não codificante altamente conservada, e SNP 142413 foi localizado a 100 pb da outra sequência não codificante altamente conservada (Fig. 2A). Nem SNP estava em forte LD com qualquer outro SNP genotipados em casos e controles. No entanto, SNP 135181 estava em forte LD com SNP 138543 (r

2 = 0,86) e vários outros SNPs genotipados, 135240, 137261, 139813, 144716, 147904 (r

2 variando 0,87-0,97, destacou SNPs em A Fig. 2A). Portanto, estes outros SNPs também exibiram uma associação atraente ao risco de cancro da próstata em combinação com SNPs 142413 e 152494 (SNP combinações representadas por círculos abertos ligados a uma linha na Fig. 2A e Tabela S3). Um adicional de 21 SNPs eram conhecidos por serem fortemente ligada a 135.181 com base em dados de sequenciação. Entre todos os SNPs ligados a 135181, 147907 única estava localizado dentro de uma sequência altamente conservada (Fig. 2A). Portanto, SNP 147,907 pode ser um candidato provável para a causalidade.

Um SNP, 148,444, localizada dentro de uma sequência altamente conservada, apresentou a maior LD (r

2 = 0,37), com SNP 152494 entre todos os SNPs genotipados . Substituindo SNP com 152494 148444 nas combinações de três SNP também definido um haplótipo para os quais foram homozigotos especialmente enriquecido em casos (Tabela S3). Consistente com um modelo recessivo, encontramos a associação mais forte com homozigotos do haplótipo de risco em 2 casos de DII (combinações SNP representados por círculos pretos ligados por uma linha na Fig. 2A) -Muito mais forte do que a maioria das combinações com SNP 152494.

SNPs ressaltando a assinatura da seleção natural nos seres humanos estão associados com o cancro da próstata Risk

Para discriminar SNPs que possam contribuir funcionalidade entre os SNPs mostrando forte associação com o risco de câncer de próstata, foram utilizados dados re-sequenciação do Europeu -americano, Yoruban e populações japonesas para procurar assinaturas de seleção natural, além de conservação, dentro da região de 28,5 kb. Vários principais estatísticas foram calculadas usando SLIDER. Nós comparamos esses parâmetros populacionais do

FHIT

intervalo para os obtidos no ENCODE projeto de sequenciamento HapMap, em que 10 regiões de 500 kb de vários cromossomos em quatro populações humanas foram sequenciados na sua totalidade. Estes dados ENCODE forneceu um controle razoável para a distribuição de todo o genoma de estatísticas específicas da população. Para confirmar as estatísticas observadas nos 13 casos e controles selecionados ao acaso, nós também sequenciaram uma região 2 kb contendo o valor D máximo de Tajima em 14 indivíduos CEPH. Como os dados ENCODE não fornecem genótipos em indels, também foram excluídos indels do nosso

FHIT e região da população análises e comparações.

Foi observado um aumento marcante da diversidade de nucleotídeos que durou vários blocos LD para as três populações humanas (Fig. 2B). O π máxima foi de 0,0072 (0,0065 para os 14 indivíduos CEPH), 0,0077 e 0,0049 por euro-americana, Yoruban e populações japonesas, respectivamente, em comparação com uma média de 0,00071 (,000071-,0055), 0,00074 (,00013-,0046), e 0,00076 (,00013-,0050) dentro das regiões ENCODE 5 Mb. Portanto, a máxima π observada na região de 28,5 kb no intrão 5 de

FHIT

excedeu o máximo π observado a partir das regiões 10 codificam para ambas Europeias-americanos e Yorubans (p 0,0060 para ambas as populações).

Nós também detectou um aumento significativo de D de Tajima na população europeia-americana (Fig. 2C). A janela 1 kb de D máximo de Tajima (3,31,

P = 0,003

assumindo modelo padrão neutro I;

P = 0,006

assumindo modelo neutra II;

P = 0,021

assumindo modelo neutro III) correspondeu a janela de máxima π. Nos 14 indivíduos de CEPH, a mesma janela exibiu D de 3,11 um de Tajima. Apenas uma região CODIFICAR pequena, menos de 0,6% de todas as regiões codificar, exibido um máximo mais elevado de Tajima D. Uma Fay valor H de Wu (8,05 para 14 SNPs,

P

= 0,0067, assumindo um modelo neutro padrão I) foi detectada pela mesma janela na população japonesa. Uma análise janela deslizante de 14 SNP para todas as regiões ENCODE na população japonesa encontrou 237 de 6265 janelas com Fay valor H Wu maior que 8,05 (

P

= 0,038).

Para determinar se a maior diversidade de nucleotídeos foi devido a um aumento da taxa de mutação local, foram avaliadas as diferenças de nucleótidos na 28,5 kb sequenciado região comparando uma sequência humana com uma sequência de chimpanzé recuperado do genoma do navegador UCSC. Para cada janela de 1 kb em toda a região de 28,5 kb, a divergência entre a sequências de chimpanzé humana e variou 0,004-0,026 e uma média de 0,0145 (Fig. 2D). Para a região 1 kb com o π máxima da população euro-americana, observamos uma divergência de 0,0150. valores de divergência para as adjacentes 5 e 10 kb foram 0,0137 e 0,0149, respectivamente. Estas estatísticas foram apenas ligeiramente maior do que a média para o genoma do chimpanzé (0,0123 [23]). Quando SNPs que são observadas em populações humanas foram excluídos, a divergência foi significativamente reduzida (variando 0,002-0,022 e fazendo a média 0,0112), especialmente dentro da região que mostraram alta diversidade de nucleótidos em seres humanos (Fig. 2D). Estas observações excluída a maior taxa de mutação local como uma das principais causas de maior diversidade nas populações humanas.

Dois SNPs, 144716 e 144552, dentro da janela de 1 kb que mostrou o sinal máximo da seleção natural, estavam em forte LD com 135181 e demonstrou um nível comparável de associação ao risco de câncer de próstata em combinação com SNPs 142.413 e quer 152494 ou 148444 (Tabela S3). A região de 142 kb para 149 kb exibido significativamente maior diversidade de nucleotídeos entre os europeus-americanos do que Yorubans, em contraste com as regiões vizinhas e a grande maioria do genoma humano, em que Yoruban diversidade é geralmente semelhante ou superior a diversidade europeia-americana ( A Fig. 2B). Esta região também engloba três combinações SNP: 142413, 144716 ou 147904 e 148444, cada um residindo dentro de uma sequência sob a selecção natural e delinear conjuntamente o haplótipo de risco putativo. Esta sobreposição de seleção e sinais associação significativa implicado co-evolução e funções interativas entre os módulos de sequência no seu envolvimento no risco de câncer de próstata.

Assinaturas da seleção em não humanos Primatas

Os dados de sequenciação em a mesma janela 1 kb em chimpanzés e bonobos ocidentais comuns também revelou potencial de seleção natural. Embora a sequência de chimpanzé possuía uma colecção completamente diferente de SNPs em comparação com a sequência humana, as distribuições de haplótipos exibiu um padrão semelhante ao da população japonesa: predominantemente um haplótipo com extremamente altas frequências do alelo derivadas para vários SNPs (D de Tajima = – 1,81, Fu e D de Li = -3,02, π = 0,0015). A significativamente alta Fay H Wu (8,62 para 12 SNPs,

P = 0,0001

assumindo o modelo neutro standard) sugeriu um efeito carona sob uma recente selecção positiva. Para a seqüência bonobo, dois SNPs raras, cada observada apenas uma vez nos 6 indivíduos, e nenhuma mudança de nucleotídeos fixa estavam presentes na janela de 1 kb (D de Tajima = -1,45, Fuli D = -1,72, π = 0,00034) em relação ao chimpanzé sequência

Três subespécies são reconhecidas entre os chimpanzés comuns com base em sua distribuição geográfica:.

Pan troglodytes verus (PTV)

na África ocidental,

troglodytes troglodytes da bandeja (PPF)

em África central, e

Pan troglodytes schweinfurthii (Pts)

na África oriental. Estudos anteriores sugeriram histórias demográficas distintas para os três subespécies, resultando em um valor médio ligeiramente positivo de D de Tajima para os chimpanzés Ocidentais (

Ptv

) e um valor médio significativamente negativo do D de Tajima para os chimpanzés centrais (

Ptt

). Para estabelecer uma distribuição de todo o genoma de estatísticas populacionais para os chimpanzés comuns, nós recuperada e novamente analisadas dados de sequência de dois estudos anteriores: 50 regiões intergênicas (Genebank acc # AY276396 para AY277244). Sequenciados em 17 chimpanzés comuns (6

Ptv

, 5

Ptt

, 2

Pts

e 4 desconhecido) [24] e 10 não-codificante regiões sequenciadas em 14 chimpanzés centrais [25] a partir do banco de dados do NCBI (Tabela 1) . As estatísticas observadas na região alvo do 1 kb (D de Tajima = -1,81, Fu de Li D = -3,02) colocou-o entre os mais baixos da distribuição de todo o genoma. dados de sequenciamento para um maior número de indivíduos de primatas que é analisada separadamente para cada subespécie serão necessários para avaliar o efeito da seleção natural com maior confiança. No entanto, estes dados preliminares são consistentes com as assinaturas de seleção em um outros do que os humanos espécies de primatas.

Discussão

ligação e de associação anteriores estudos identificaram uma região de aproximadamente 30 kb associado com o câncer de próstata risco. Neste relatório, a análise detalhada da estrutura LD local e testes de associação adicionais refinou o sinal máximo para dentro de uma região de 15 kb, possivelmente envolvendo um haplótipo definido por três ou mais SNPs dentro de sequências sob forte restrição evolutiva.

Evidência de tanto associação e selecção suportado funções importantes e interactivos para as sequências dentro de 15 kb região intrônica de

FHIT

. Os haplótipos de risco definidos pelos principais alelos de vários SNPs em combinações não estavam em LD completo com um único SNP descoberto na região de 28,5 kb e exibiu associações mais fortes com câncer de próstata do que qualquer único SNP testado. Entre os 9 SNPs que delinearam haplótipos de risco, quatro (142413, 147904, 148444 e 152494) foram localizados dentro ou sequências de perto que são altamente conservadas entre os mamíferos; e um (144716) foi localizado dentro de uma sequência que exibiu sinais significativos e distintos de seleção natural dentro diversificada populações de primatas e humanos. Os alelos de 5 SNPs (142413, 135181, 137261, 138543 e 144716) em haplótipos de risco foram ancestral. Os alelos de ambos os SNPs 148444 e 152494 em haplótipos de risco foram derivados e atingiu uma frequência muito elevada ( 0,8) em todas as três populações humanas testadas; portanto, eles pareciam estar sob selecção positiva, especialmente na população Yoruban. Por exemplo, SNP 148.444 sobreposto com janelas 1-kb de D mínimo de Tajima (-1,804 para 10 SNPs) e elevado de Fay e Wu H (9,31 para 17 SNPs) na população Yoruban.

Levin et al. [26] relatou recentemente uma associação inversa do risco de câncer de próstata ao SNP, rs760317 (138543), descrito em nosso estudo original [7]. Os autores atribuíram a associação do alelo “invertida” (G em vez de A) a (i) uma menor frequência alta alelo de rs760317, (ii) um SNP causal adicional não identificado de relativamente baixa desequilíbrio de ligação com rs760317, e (iii) n consideração da interacção entre os dois no seu modelo de análise. No presente estudo, foram identificados dois SNPs adicionais, 142.413 e 152.494 ou 148.444, que interagem com qualquer SNP 138543 ou de um SNP em muito alto LD com 138543, tais como 144716, que determinaram o risco de câncer de próstata. medições LD de pares entre os três SNPs interagindo foram de facto muito baixa (r

2 0,3 para todos os pares possíveis), consistentes com a hipótese originalmente proposto por Lin et al. [27] para explicar uma associação invertida.

Detecção de assinaturas de selecção natural tem sido proposto para mapear genes e elementos reguladores envolvidos em doenças humanas [18], [28]. Neste trabalho, utilizou-se evidência de seleção natural para inferir a funcionalidade de uma região intrônica implicado no cancro da próstata [7]. Desde que detectou sinais fortes de ambos selecção positiva e equilíbrio dentro da mesma região para diferentes humana e populações de primatas não-humanos, acaso e história demográfica sozinho não pode explicar totalmente as nossas observações. Para controlar o efeito da história demográfica, confirmamos D e π de alta Tajima nos mesmos indivíduos que foram sequenciados no Projeto ENCODE Sequenciamento e fornecidos um fundo de todo o genoma. Portanto, a seleção natural apresenta uma explicação plausível para a distribuição não aleatória de genótipos SNP existentes nos dados.

Genética de populações nesta região sugeriu que diversas forças seletivas podem ter sido agindo em diferentes populações de humanos e primatas. É, portanto, intrigante que o

gene FHIT

é conhecida por sua capacidade de resposta a fatores ambientais, como tabagismo [15] e exposição à radiação [17], e medeia a sobrevivência celular ou apoptose [9]. Nós comparamos as mudanças sinônimas e nonsynonymous no

FHIT e região de codificação entre o humano eo chimpanzé e encontrou 4 sinônimos e 2 mudanças nonsynonymous dentro de sua região de codificação 441 pb. Ambas as mudanças nonsynonymous alterou as propriedades químicas dos aminoácidos envolvidos, o que implica que

FHIT

pode ser um dos genes em rápida evolução submetidos a seleção positiva.

estudos de associação convencionais têm em grande parte focado em conhecidos de codificação sequências, que representam apenas cerca de 1,5% do genoma humano. No entanto, estudos recentes têm revelado grandes populações de transcritos de RNA previamente desconhecidas, a maioria dos quais são não-codificante, dentro de íntrons e regiões intergênicas [29], [30]. Muitos destes transcritos estão envolvidos na tumorigénese [31], incluindo a diferenciação de tumor de próstata [32]. Vários estudos independentes também confirmaram o papel das regiões não codificantes em 8q24 na suscetibilidade ao câncer de próstata [2], [33]. Dentro da região que implcated no risco de cancro da próstata, um esforço de todo o genoma para prever a conservação da estrutura secundária do ARN utilizando o programa de computador, EvoFold [34], detectada uma estrutura conservada de 61 pb em torno do SNP 148444. Se tais elementos dentro do intrão 5 locus de transmitir o risco de câncer de próstata através da alteração das

FHIT

/função de expressão ou através de elementos funcionais intr�icas independentes continua a ser investigado.

Materiais e Métodos

Estudo de Assuntos

As amostras de caso e de controlo foram descritos anteriormente [7]. O estudo eo uso de tecidos foram aprovados pelo conselho de revisão institucional em cada site participante. consentimento informado por escrito foi obtido de todos os participantes. Resumidamente, DNAs de 200 pacientes não relacionados descendentes de europeus afetados com câncer de próstata e 143 controles de etnia combinados foram utilizados no estudo atual. O consentimento informado foi obtido de todos os participantes. Além disso, o DNA de 14 CEPH (American Europeia), 16 Yoruban (Africano), e 16 indivíduos japoneses foram obtidas junto aos Coriell Cell Repositories. As amostras dos 14 indivíduos CEPH, 8 dos Yorubans, e 8 dos japoneses tinha sido re-sequenciado no Projeto Resequencing HapMap ENCODE.

Obtivemos o painel DNA de primatas (PRP00003) dos Coriell Cell Repositories. A amostra incluiu um indivíduo de cada uma das seguintes espécies: Chimpanzé comum, bonobos, gorilas, orangotango de Sumatra, Macaca pigtailed, macaco rhesus, macaco aranha negra-handed, Comum lanoso macaco, mico-bigode vermelho de peito, e do lemur anel-atado. Nós também obteve DNA de outros 12 chimpanzés não relacionados comuns Ocidentais (NS03622, NS03623, NS03639, NS03641, NS03650M NS03656, NS03660, NA03450, NG06939, NS03489, NS03610 e NS03659; comunicação pessoal, W. Winckler, do Broad Institute, Cambridge, MA ) a partir do Repositório Coriell Cell, bem como o DNA de cinco indivíduos bonobo não relacionados adicionais (identificadores disponíveis mediante pedido).

SNP genotipagem

o DNA genômico foi extraído como descrito anteriormente [7]. genótipos SNP foram obtidos e SNPs críticas foram confirmadas usando uma combinação de ABI SNaPshot ™ genotipagem em um sequenciador de DNA ABI377, Sequenom Iplex SNP digitação em um sistema MassARRAY, e sequenciamento de ABI3130xl e ABI 3730 plataformas.

Re-sequenciamento

O ADN genómico foi amplificado utilizando iniciadores de PCR de sobreposição e re-sequenciados utilizando PCR e iniciadores internos. SNPs foram detectados utilizando PolyPhred 4.0 [35] e Consed [36]. Para minimizar a taxa de falsos negativos, foi utilizada uma baixa definição-Score de 50 para etiquetar todos os SNPs possíveis e inspecionou cada SNP manualmente para verificar a precisão das atribuições de seqüência. Indels foram registrados através de inspeção manual.

Análises Estatísticas

Nós utilizados Haploview [37] para executar χ

2 testes de Hardy-Weinberg (HWE) para cada marcador genotipados nos casos e controles e não encontraram desvio extremo. Nós também utilizado Haploview para calcular e visualizar r

2 entre cada par de marcadores (frequência menor do alelo, MAF, ≥5%), e comparar as freqüências alélicas de casos e controles. taxas de recombinação foram calculados utilizando rhomap [38] com 10000000 corridas e 1000000 burn-ins. Triagem para associação de haplótipos individual de 3 combinações SNP foi conseguida usando unphased [39].

Deixe uma resposta