PLOS ONE: O uso de Estudos de Associação Genome-Wide para Cancer Research and Drug Reposicionamento

Abstract

Embora os estudos de associação do genoma identificaram muitos loci risco associado ao cancro colo-rectal, a base molecular destas associações ainda não estão claros. Nós teve como objetivo inferir conhecimentos biológicos e destacar genes candidatos de interesse dentro GWAS loci de risco. Foi utilizado um

in silico

gasoduto com base em anotação funcional, característica quantitativa loci mapeamento do gene que actua em cis, PubMed text-mineração, estudos de interação proteína-proteína, sobreposições genéticos com mutações somáticas câncer e fenótipos rato nocaute, e análise de enriquecimento funcional para priorizar os genes candidatos no loci risco de câncer colorretal. Com base nessas análises, observamos que estes genes foram alvos de terapias aprovadas para o cancro colorectal, e sugeriu que as drogas aprovadas para outras indicações podem ser reutilizadas para o tratamento de câncer colorretal. Este estudo destaca o uso de dados disponíveis publicamente como uma solução de custo eficaz para obter conhecimentos biológicos e fornece uma evidência empírica de que a base molecular do câncer colorretal pode fornecer pistas importantes para a descoberta de novas drogas

Citation.: Zhang J, Jiang K, LV G, Wang H, Shen Z, Z Gao, et al. (2015) Uso de Estudos de Associação Genome-Wide para Cancer Research and Drug Reposicionamento. PLoS ONE 10 (3): e0116477. doi: 10.1371 /journal.pone.0116477

Editor do Academic: Giuseppe Novelli, da Universidade Tor Vergata de Roma, Itália

Recebido: 27 de setembro de 2014; Aceito: 08 de dezembro de 2014; Publicação: 24 de março de 2015

Direitos de autor: © 2015 Zhang et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Disponibilidade de dados: Todos os dados relevantes estão dentro do papel e seus arquivos de suporte de informação

Financiamento:. Este trabalho foi apoiado pelo Programa de Apoio à Tecnologia Key Nacional (número Grant: 2104000032), National Natural Science Foundation da China (o item de número: 81372290) e National Natural Science Foundation da China (o item de número: 81372291).

competir interesses:. os autores declararam que não existem interesses conflitantes

Introdução

Desde o advento da alta densidade polimorfismo de nucleotídeo único (SNP) matrizes de genotipagem, os pesquisadores usaram estudos de associação do genoma (GWAS) para identificar inúmeras loci associados com uma infinidade de doenças. A grande maioria dos SNPs identificados por GWAS estão dentro das regiões intergénicas ou intrónicas (aproximadamente 88%) [1,2]. GWAS também permitiu a descoberta de muitas variações genéticas do câncer colorretal (CRC). O próximo passo foi identificar os genes que foram afetados pela variantes causais, o que nos permitam traduzir os SNPs de risco para insights significativos sobre a patogénese.

A maioria dos relatos simplesmente ter implicado o gene mais próximo a um GWAS bateu como um -alvo da variante funcional sem qualquer evidência [1]. A identificação dos loci de expressão de características quantitativas (eQTL) tem sido proposto como um método promissor para encontrar genes candidatos associados com um risco de doença [3] [4]. Note-se que a identificação de um eQTL fornece apenas uma evidência indireta de uma ligação entre o genótipo e transcrição de genes [1].

Tanto quanto sabemos, não há simplesmente nenhuma boa maneira de identificar esses genes-alvo, que é chave para entender o mecanismo pelo qual GWAS variantes ato. Por isso, propôs um gasoduto bioinformática para priorizar os genes candidatos mais prováveis ​​usando vários conjuntos de dados biológicos. Sete critérios foram adotados para priorizar genes candidatos. O amplamente utilizado eQTL critério mencionado acima é apenas um dos sete critérios no pipeline.

Uma forma de acelerar a tradução de dados de GWAS em benefícios clínicos, é usar os resultados para identificar novas indicações para o tratamento com existente moléculas. GWAS pode ser utilizado para construir redes relacionadas com a droga, auxiliando reposicionamento droga. Embora GWAS não identificam diretamente a maioria dos alvos de drogas existentes, existem várias razões para esperar que as novas metas irá, contudo, ser descoberto usando esses dados [5,6]. Resultados iniciais com estudos reaproveitamento de drogas por meio de análise de rede são encorajadores e sugerem caminhos para o desenvolvimento futuro [7]. Ao integrar descobertas genéticas com artrite reumatóide com o catálogo de medicamentos aprovados para a artrite reumatóide e outras doenças, Okada Y et al fornecido um conjunto de dados empíricos para indicar que as abordagens genéticas podem ser úteis para apoiar a genética-driven esforços de descoberta de drogas genômicas em traços humanos complexos [8 ].

no presente estudo, foi utilizado o

in silico

gasoduto para integrar sistematicamente dados sobre loci risco para CRC biologia e descoberta de drogas a partir de uma variedade de bancos de dados.

materiais e Métodos

Uma visão geral do desenho do estudo é ilustrada na Fig. 1. genes candidatos biológicos foram obtidos a partir GWAS-identificados loci risco CRC. Em seguida, os dados genéticos foram integrados com os resultados das análises estatísticas, abordagens computacionais e dados em larga publicamente disponíveis define a priorizar os genes obtidos, e propor novas metas para tratamentos de droga.

Cento e quarenta e sete candidato genes foram obtidos a partir de 50 loci de risco de CRC. Um gasoduto bioinformática foi desenvolvido para a priorização destes genes candidatos. Sete critérios foram utilizados para marcar os genes: (1) variante CRC missense de risco; (2)

cis

-eQTL; (3) PubMed mineração de texto; (4) de PPI; (5) O câncer de mutação somática; (6) fenótipo rato de abate; e (7) o enriquecimento funcional. Extensão da sobreposição com genes-alvo para drogas CRC aprovados também foi avaliado.

CRC loci risco de GWAS

Nós baixado SNPs risco de CRC do Instituto Nacional de Pesquisa do Genoma Humano (NHGRI) GWAS banco de dados de catálogo em 31 de janeiro de 2014 [2]

genes candidatos biológicas de CRC loci risco

é um fato bem conhecido que o risco SNPs indica haplótipos em que as variantes funcionais residem.; Portanto, o próximo passo foi o de identificar os seus genes-alvo. Ao adotar multi-anotações entre SNPs risco e seus genes circundantes, o

snp2gene

permitido anotação convencional devido à sua proximidade, bem como desequilíbrio de ligação [9].

Para cada um dos GWAS SNPs envolvidos, foi utilizado o

snp2gene

para identificar os genes candidatos. Para cada gene no loci de risco, avaliamos se o gene era o gene mais próximo do SNP risco CRC dentro do locus de risco.

Priorização de genes candidatos

Ao usar vários conjuntos de dados biológicos, eu inventei um gasoduto de bioinformática para priorizar os genes candidatos mais prováveis.

em primeiro lugar, anotações funcionais para SNPs risco CRC foram identificados por

ANNOVAR

[10]. variantes associado à característica foram enriquecidas dentro de marcas de cromatina, particularmente em H3K4me3 [11]. dados H3K4me3 de 34 tipos de células poderia fornecer o mapeamento fino de SNPs associados para identificar variação causal nos estudos anteriores [12]. Então, nós avaliamos se os SNPs CRC risco e SNPs no desequilíbrio de ligação (r

2 0,80) foram sobrepostas com picos H3K4me3 de 34 tipos de células. Os dados H3K4me3 foram obtidos a partir dos Institutos Nacionais de Saúde Roteiro Epigenomics Mapeamento Consórcio, através de um procedimento de permutação com 10

5 iterações [12]. Foram identificados genes para SNPs risco de CRC ou SNPs de desequilíbrio de ligação (r

2 0,80), que foram anotadas como variantes missense

Em segundo lugar, avaliamos a

cis

-expression quantitativa. locos de características (

cis

-eQTL) efeitos usando os dados de 5.311 indivíduos europeus do estudo sobre células mononucleares do sangue periférico (PBMC) [13]. Westra HJ et ai. tinha feito um navegador disponível para todos os significativa

cis

-eQTLs, detectado a uma taxa de falso-descoberta de 0,50. (https://genenetwork.nl/bloodeqtlbrowser/) Em seu estudo, eQTLs foram consideradas

cis

-eQTLs quando a distância entre a posição cromossômica SNP eo ponto médio sonda estava a menos de 250 kb. Os eQTLs foram mapeados usando correlação de Spearman em dosagens genótipo imputados. correlações resultantes foram então convertidos em valores P e seus respectivos escores z foram ponderados pela raiz quadrada do tamanho da amostra.

Para avaliar

cis

-eQTL genes de SNPs de risco, foi necessário apenas para fornecer todos SNP risco. Quando o SNP risco CRC não estava disponível em conjuntos de dados eQTL, nós alternativamente utilizados os resultados das melhores SNPs de proxy em desequilíbrio de ligação com a maior r

2 valor (r

2 0,80).

em terceiro lugar, usando as Relações gênico entre implicado Loci (

GRAIL

), foi avaliado o grau de parentesco entre os genes dentro das regiões de doença.

GRAIL

é uma ferramenta para examinar as relações entre genes em doenças diferentes loci associados. Dado muitas regiões genômicas ou SNPs associados com o CRC,

GRAIL

procura por semelhanças no texto científica publicada entre os genes associados [14]. Um valor de p 0,05 foi considerado significativo. Para evitar publicações que relataram ou foram influenciados pelas regiões doença descoberta nos exames recentes, usamos apenas os resumos PubMed publicados antes de dezembro de 2006, antes do recente ataque de papéis da GWA identificando novas associações, evitar qualquer forte tendência para os genes mais próximos para os SNPs associados. Essa abordagem evita eficazmente este problema. [14].

Em seguida, utilizou-se a Associação de Doenças proteína-proteína Fazer a ligação avaliador

(DAPPLE)

para avaliar a presença de conectividade física significativa entre as proteínas codificadas por genes candidatos por interacção proteína-proteína (PPI), relatados na literatura. O

DAPPLE

pega uma lista de SNPs de sementes que os converte em genes com base na sobreposição. A hipótese por trás DAPPLE é que uma variação genética afeta um conjunto limitado de mecanismos subjacentes que são detectáveis ​​pelo PPI [15]. Um valor de p 0,05 foi considerado significativo

Nest, obtivemos câncer genes mutação somática a partir do Catálogo do Somatic Mutações em Câncer (

COSMIC

) do banco de dados [16], e knockout baixado. rato etiquetas fenótipo e informações gene do banco de dados do rato Genome Informática (MGI) [17], em 8 de abril de 2014. Nós definimos todos os genes de risco CRC incluídos no loci risco CRC, e avaliou a sobreposição com fenótipos de câncer com mutações somáticas registrados e etiquetas fenótipo de genes de rato knockout com ortólogo humano. teste de distribuição hipergeométrica foi utilizado para análises estatísticas de sobreposição com significância em um valor de p . 0,05

Finalmente, foi realizada análise de enriquecimento de função para investigar se os genes afetados por SNPs foram enriquecidas para as categorias ou vias funcionais específicas. David Bioinformática Resources, que incluiu Gene Ontology (GO), Enciclopédia Kyoto de genes e genomas (KEGG) e Online Mendelian Inheritance in Man (OMIM) foram utilizados para as análises. [18] Os resultados obtidos foram considerados significativos para a

p

valor de 0,05

Nós marcou cada um dos genes usando os seguintes critérios de selecção, e calculado o número dos critérios satisfeitos:. (1) genes com variantes missense; (2)

cis

-eQTL genes de SNPs de risco; (3) genes priorizados pela mineração de texto PubMed; (4) genes priorizados pela rede PPI; (5) de câncer somática genes de mutação; (6) genes priorizados por fenótipos rato knockout associados; e (7) genes priorizados por meio de análise de enriquecimento funcional.

As correlações de critérios de priorização de genes candidatos foram avaliados pela análise de correlação de Pearson. Cada gene foi marcado com base no número de critérios que foram satisfeitas (pontuação variou de 0-7 para cada gene) em caso de correlações fracas. Genes com uma pontuação de ⩾2 foram definidos como “genes de risco biológicos”.

validação de drogas e descoberta

Se a genética humana pode validar alvos de drogas, então ele pode ser usado para identificar se o aprovado fármacos actualmente utilizados para o tratamento de outras indicações podem ser utilizados para o tratamento de CRC. Apresentamos aqui uma análise do potencial de aplicação de dados GWAS, reposicionamento de drogas.

Obtivemos genes alvos de medicamentos e informação sobre a droga correspondente de Drogas Bank [19] e Terapêutica Metas de banco de dados (TTD) [20] em 18 de outubro de 2013. foram selecionados genes alvo de drogas que tiveram atividades farmacológicas e foram eficazes em modelos ortólogos humanos e as que anotada com qualquer do julgamento aprovado, clínica ou drogas experimentais.

os genes alvo de drogas anotados às drogas CRC foram extraídas manualmente por oncologistas profissionais. Para diminuir as taxas de falsos positivos, apenas os medicamentos em uso clínico atual foram envolvidos no estudo, o que pode ser encontrada nas diretrizes de prática clínica NCCN em cânceres colorretais. [21]

Foram extraídos genes de direta PPI com genes biológicos de risco do CRC utilizando rede de interação proteína análise-2 (

PINA2)

, que integra seis bases de dados PPI criadas manualmente bem conhecidas [22].

Foi avaliada a possibilidade de explorar produtos proteicos dos genes identificados biológicos de risco, ou quaisquer genes de uma rede PPI direta como alvos de drogas ou medicamentos para outras indicações CRC aprovados. Seja x o conjunto dos genes biológicos de risco CRC e genes em PPI direto com eles (n

x genes), y ser o conjunto de genes com produtos de proteínas que são o alvo direto de drogas CRC aprovadas (n

genes y), e z é o conjunto de genes com produtos de proteínas que são o alvo direto de todos os medicamentos aprovados (n

genes z). Definimos n

x∩y e n

x∩z como o número de genes que se sobrepõem entre X e Y e entre X e Z, respectivamente. testes distribuição hipergeométrica foram utilizados para análises estatísticas de sobreposição, e um valor de p 0,05 foi considerado estatisticamente significativo

Resultados

No presente estudo, 50 SNPs CRC-associados foram obtidos a partir NHGRI (. Tabela 1), e 140 genes foram obtidos com base na proximidade e desequilíbrio de ligação usando o

snp2gene

(S1 Tabela).

anotações funcionais de SNPs risco CRC

a maioria dos SNPs (62%) estavam localizados nas regiões intergênicas (S2 tabela). Dois SNPs foram identificados em desequilíbrio de ligação com os SNPs missense (R

2 0,80; S3 Tabela). Em seguida, foram avaliados 50 CRC loci risco de marcas de cromatina epigenéticas enriquecidos [12]. Dos tipos de células 34 investigados, observou-se um significativo enriquecimento de alelos de risco de CRC com picos H3K4me3 em células da mucosa retal (

p

= 0,00014 e 0,00023, respectivamente) (S4 Tabela).

Cis -expression Quantitative trait loci (

cis

-eQTL)

Usando o

cis

-eQTL dados obtidos a partir do estudo PBMC [13], descobrimos que 13 SNPs risco mostrou

cis

-eQTL efeitos (p 0,0016 e FDR 0,5). (S5 Table)

PubMed texto de mineração

Vinte e quatro genes foram priorizados com base em dados obtidos por mineração de texto PubMed usando

GRAIL

com p 0,05 [14] (S6 Table)

interação proteína-proteína (PPI)

Dois genes foram priorizados pela rede PPI usando com base em genes

DAPPLE

com p 0,05 [15] (Tabela S7).

Cancro somática mutação

Entre os 522 genes com mutações somáticas registrados obtidos a partir do banco de dados COSMIC [16], uma sobreposição significativa foi observada em genes associados em cancros não-hematológicas (5/6, p = 2.41E -05) (S8 tabela).

Knockout do mouse fenótipo

Foram avaliados sobreposição com genes implicados em fenótipos rato knockout [17]. Entre as 30 categorias de fenótipos, observou-se nove categorias significativamente enriquecida com genes CRC de risco (p 0,05)., Liderados pelo fenótipo craniofacial (S9 Table)

enriquecimento funcional análise

GO análise indicou que alguns genes foram enriquecidos em três categorias (S10 Tabela); dois com percursos KEGG observados em câncer (p = 0,002), e um com cancro do pulmão de pequenas células (p = 0,011) foram relacionadas funcionalmente (S11 Tabela). análise funcional por OMIM demonstrado conjuntos de gene enriquecida em doenças colorretais (S12 tabela)

Com base nestas novas descobertas, adotamos os seguintes sete critérios para priorizar cada um dos 140 genes de loci risco de 50 CRC:. (1 ) genes com CRC variante missense risco (n = 2); (2)

cis

-eQTL genes (n = 13); (3) genes priorizados pela mineração de texto PubMed (n = 24); (4) genes priorizados pelo PPI (n = 2); (5) os genes do cancro de mutação somática (n = 6); (6) genes priorizados pelos fenótipos rato knockout associados (n = 40); e (7) genes priorizados por meio de análise de enriquecimento funcional (n = 31)

Uma vez que estes critérios mostrou correlações fracas entre si (R

2 0,48; S13 Tabela)., cada gene foi marcado base sobre o número de critérios que foram cumpridas (pontuação variou de 0-7 para cada gene)

Trinta e cinco genes (25,2%) tiveram uma pontuação . 2, que foram definidos como “genes de risco biológicos ‘( S1 Fig.). Três loci incluídos vários genes de risco CRC biológicos, (por exemplo, ROS1 e GOPC por rs2057314) (Tabela 2).

Para fornecer evidência empírica do gasoduto, foram analisados ​​os escores de genes. Os genes com as contagens mais elevadas foram biológicos mais provável que seja mais próxima do SNP risco (62,8% para o gene marcar ⩾ 2, 24% para a pontuação do gene 2; p 0,001). Enquanto isso, as células de mucosa rectal demonstraram proporções significativas de sobreposição com picos H3K4me3 em comparação com outros tipos de células.

Finalmente, foi avaliado o papel potencial da genética em relação à descoberta de medicamentos para o tratamento de CRC. testes distribuição hipergeométrica foram utilizados para análises estatísticas de sobreposição. Obtivemos 11303 genes pares de bases de dados PPI curadoria. Obtivemos 871 genes alvo de drogas correspondentes a aprovação, em ensaios clínicos ou drogas experimentais para doenças humanas (S14 tabela). Por razões de fiabilidade cálculo, apenas CRC drogas na terapia de primeira linha foram envolvidos no estudo. Oito genes alvo de drogas CRC aprovados foram incluídos (S15 Tabela).

Trinta e um genes de risco CRC biológicas sobrepostas com 533 genes a partir da rede PPI expandida (S2 Fig. S3 e Fig.). Encontramos uma sobreposição de 5/8 genes alvo de drogas de drogas CRC aprovados (5/8 vs 70/781, de enriquecimento 12,09 vezes, P = 0,00013). Todos os genes alvo 871 droga (independentemente de indicação de doença) sobreposto com 70 genes a partir da rede de PPI, que sugere que o enriquecimento era 1,55 vezes maior do que o esperado por acaso sozinho (p = 0,00012), mas menos de 7,78 vezes quando comparado com drogas CRC actualmente aprovados (p = 1,78 × 10

-5). Exemplos de terapias CRC aprovados identificados por esta análise incluiu o irinotecano, regorafenib e cetuximab (Fig. 2).

As linhas pretas indicam conexões.

Correlação de drogas aprovadas para outras doenças com gene de risco CRC biológica também foi avaliado. Um exemplo de reposicionamento da droga (fig. 3) é a utilização de crizotinibe, um fármaco aprovado para o cancro do pulmão de não pequenas células, para o tratamento de CRC [16]. O trióxido de arsénio vrinostat, dasatinib, estramustina, e TAMIBAROTENE são todos medicamentos promissores para o tratamento da CRC (Fig. 4).

inumeráveis ​​doença- Discussão

GWAS ter identificado variantes genéticas associadas. No entanto, obstáculos significativos têm dificultado a nossa capacidade de identificar genes afetados por variantes causais e em elucidar o mecanismo pelo qual as influências genótipo fenótipo.

A maioria dos relatos simplesmente ter implicado o gene mais próximo a um GWAS bater sem evidência substancial [1] . Este estudo priorizou os genes alvos mais prováveis. Foram identificados um total de 31 genes de risco CRC biológicos. Embora os genes de risco CRC biológicos são mais propensos a ser genes causais, este ainda necessita de confirmação por estudos moleculares básicos utilizando tecnologias avançadas. Edwards et ai fornecida uma conduta para estudos de acompanhamento, que inclui o mapeamento fino de SNPs de risco, prioritização de SNPs putativos funcionais, e in vitro e in vivo verificação experimental de mecanismos moleculares previstos para identificar os genes alvo [1].

GWAS é criticado por sua falta de tradução clínica por causa do tamanho do efeito. No entanto, pequenos tamanhos individuais efeito não necessariamente impede utilidade clínica. Sanseau et ai proposto o uso de GWAS para reposicionamento droga, o que é considerado como uma estratégia promissora em medicina translacional. Num estudo que investigou 3-hidroxi-3-metil-glutaril-coenzima A, de um medicamento para baixar o colesterol bem conhecidos, SNPs dentro deste gene foram inequivocamente associada com níveis de lipopolissacáridos colesterol de baixa densidade no GWAS dados. [6] O estudo incluiu todos os genes GWAS-associados que foram selecionados a partir do catálogo GWAS, sem conquista sobre drogas CRC.

No presente estudo, nós nos concentramos em repurposing drogas para CRC com base na priorização de genes candidatos em os loci GWAS identificado. Por exemplo, crizotinib, trióxido de arsênico, vrinostat, dasatinib, estramustina, e TAMIBAROTENE também são fármacos promissores reaproveitado para CRC. Embora outras investigações são necessárias para confirmar os resultados deste estudo, opine que essas drogas alvo seleccionados poderiam ser candidatos droga promissora no tratamento da CRC.

Os dados GWAS é útil ao proporcionar insights sobre a biologia das doenças, mas também pode traduzir esses leads em oportunidades rentáveis ​​no desenvolvimento de medicamentos. No entanto, os dados GWAS não fornece informações detalhadas fisiopatológico; Assim, as utilizações de medicamentos recentemente identificados velhas pode ser possivelmente efeitos colaterais [23]. reorientação bem sucedida de um medicamento implica a combinação de resultados da literatura publicada e pesquisa clínica.

Apesar de ter havido uma série de aspectos positivos deste estudo, houve algumas limitações também. Em primeiro lugar, os dados do estudo de PBMC foi utilizado para

cis

-eQTL análise. Embora eQTLs identificados a partir de um tipo de tecido pode ser um substituto útil para o estudo da genética de expressão do gene no tecido outro [24], a utilização de eQTLs de tecidos específicos é provavelmente mais úteis para a compreensão da patogénese de CRC [25]. Em segundo lugar, dos 34 tipos de células estudadas, observou-se apenas um enriquecimento significativo de SNP risco com picos H3K4me3 em células da mucosa retal. No entanto, o enriquecimento não foi significativa para as células do cólon mucosa.

Neste estudo, integrado dados genéticos e análises estatísticas, abordagens computacionais e publicamente dados em larga disponível define a priorizar genes candidatos, e propor novas metas para tratamentos medicamentosos CRC. Acreditamos que genes-alvo e medicamentos selecionados por esta abordagem poderia ser promissor leads no desenvolvimento de medicamentos candidatos para o tratamento da CRC, embora, novas investigações são necessárias para a confirmação desses resultados.

Informações de Apoio

S1 fig. . Distribuição histograma de pontuação gene

Trinta e cinco genes com uma pontuação de 2 foram definidos como “genes de risco biológicos ‘

doi: 10.1371 /journal.pone.0116477.s001

(TIF)

S2 Fig. Sobreposição de 31 genes biológicos mais de 553 genes em PPI direta com eles e genes-alvo de drogas.

Encontramos sobreposição de 5 genes dos genes-alvo 8 de drogas de drogas CRC aprovados (enriquecimento de 12,09 vezes, p = 1,78 × 10

-5). Todos os genes alvo de droga 871 (independentemente de indicação de doença) sobreposto com 70 genes a partir da rede de PPI, indicando um enriquecimento de 1,55 vezes mais elevada do que o esperado por acaso sozinha (p = 1,20 x 10

-4); mas inferior a 7,78 vezes o enriquecimento em comparação com drogas CRC (p = 1,30 × 10

-4)

doi:. 10.1371 /journal.pone.0116477.s002

(TIF)

S3 Fig. rede PPI de genes de risco CRC biológicos e genes-alvo de drogas

Pink:. genes alvo de drogas; genes de risco CRC;: Laranja Cyan:. Genes PPI diretos no banco de dados PINA2

doi: 10.1371 /journal.pone.0116477.s003

(TIF)

S1 Table. Resumo de 140 genes candidatos com base na proximidade e desequilíbrio de ligação

doi:. 10.1371 /journal.pone.0116477.s004

(XLSX)

S2 Table. SNPs risco anotado por

annovar

doi:. 10.1371 /journal.pone.0116477.s005

(XLSX)

S3 Tabela. variante missense em desequilíbrio de ligação (r

2 0,8) com risco único polimorfismos de nucleotídeo anotado por

ANNOVAR

doi:. 10.1371 /journal.pone.0116477.s006

(XLSX)

Tabela S4. Sobreposição do risco de câncer colorretal polimorfismos de nucleotídeo único com picos H3K4me3 em células

doi:. 10.1371 /journal.pone.0116477.s007

(DOCX)

S5 Table.

cis

-expression loci de características quantitativas de polimorfismos de nucleotídeo único risco de câncer colorretal

doi:. 10.1371 /journal.pone.0116477.s008

(XLSX)

S6 Table. Genes priorizados pelo PubMed mineração de texto

doi:. 10.1371 /journal.pone.0116477.s009

(XLSX)

S7 Table. . Genes priorizados pela rede de interação proteína-proteína

doi: 10.1371 /journal.pone.0116477.s010

(XLSX)

S8 Table. Sobreposição de genes de risco de câncer colorretal com câncer genes mutação somática

doi:. 10.1371 /journal.pone.0116477.s011

(XLSX)

S9 Table. Genes priorizados pelo fenótipo do rato knockout utilizando o teste de distribuição hipergeométrica

doi: 10.1371. /Journal.pone.0116477.s012

(DOCX)

S10 Tabela. Genes priorizados por ir análise de enriquecimento

doi:. 10.1371 /journal.pone.0116477.s013

(XLSX)

S11 Tabela. Genes priorizados por meio de análise de enriquecimento KEGG

doi:. 10.1371 /journal.pone.0116477.s014

(XLSX)

S12 Tabela. Genes priorizados por meio de análise de enriquecimento OMIM

doi:. 10.1371 /journal.pone.0116477.s015

(XLSX)

S13 Tabela. Correlações de critérios biológicos priorização de genes candidatos

doi: 10.1371. /Journal.pone.0116477.s016

(XLSX)

S14 Tabela. Uma lista de genes alvo de drogas

doi:. 10.1371 /journal.pone.0116477.s017

(DOCX)

S15 Tabela. Resumo dos medicamentos aprovados para genes do cancro e de destino colorretais

doi:. 10.1371 /journal.pone.0116477.s018

(DOCX)

Agradecimentos

Obrigado pela ajuda dos dados análise de SuZhou Bionovo Gene Co., LTD

fonte de Financiamento:.

Este trabalho foi apoiado pelo Programa Nacional Key Tecnologia Support (Grant número: 2104000032), National Natural Science Foundation da China (ponto número: 81372290) e National Natural Science Foundation da China (o item de número: 81372291)

.

Deixe uma resposta