PLOS ONE: A Rede de genes de câncer com co-ocorrendo e Anti-co-ocorrendo Mutations

Abstract

Alguns genes do cancro contribuir para tumorigênese de uma maneira de qualquer co-ocorrência ou excludentes (anti-co -occurring) mutações; no entanto, o quadro global de quando, onde e como ocorrem estas interações funcionais permanece obscuro. Este estudo apresenta uma abordagem da biologia sistemas para este efeito. Depois de aplicar esse método para dados de mutação do gene do cancro gerados a partir de grande escala e sequenciamento do genoma inteiro de amostras de cancro, uma rede de genes de câncer com mutações co-ocorrendo e anti-co-ocorrência foi construído. A análise desta rede revelou que os genes com mutações co-ocorrem preferem transduções de sinalização directa e que as relações de interacção entre os genes do cancro da rede estão relacionados com a sua semelhança funcional. Também foi revelado que os genes com mutações co-ocorrem tendem a ter frequências de mutação similar, enquanto que os genes com mutações anti-co de ocorrência tendem a ter diferentes frequências de mutação. Além disso, genes com mais exons tendem a ter mais mutações co-ocorrem com outros genes, e os genes que têm estruturas de rede coerente locais mais baixas tendem a ter maior frequência de mutação. A rede mostrou dois módulos complementares que têm funções distintas e têm diferentes papéis na tumorigênese. Este estudo apresentou um quadro para a análise dos resultados de sequenciamento do genoma do câncer. Os dados apresentados e padrões descobertos são úteis para a compreensão da contribuição de mutações genéticas para tumorigênese e valioso na identificação de biomarcadores-chave e alvos de drogas para o câncer

Citation:. Cui Q (2010) A rede de genes do cancro com co-ocorrendo e Anti-co-ocorrência de mutações. PLoS ONE 5 (10): e13180. doi: 10.1371 /journal.pone.0013180

editor: Simon Rogers, da Universidade de Glasgow, Reino Unido

Recebido: 04 de abril de 2010; Aceito: 11 de setembro de 2010; Publicação: 04 de outubro de 2010

Direitos de autor: © 2010 Qinghua Cui. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. O autor não tem nenhum apoio ou financiamento para relatar

Conflito de interesses:.. O autor declarou que não existem interesses conflitantes

Introdução

Cancro surge através alternâncias genéticas e epigenéticas acumulados de somática células [1], [2], [3]. Nos últimos anos, numerosos esforços têm sido feitos para identificar mutações de genes em vários cancros humanos por todo o genoma, ou em grande escala sequenciação [3], [4], [5], [6], [7], [8], [9]. Na verdade, esses estudos identificaram milhares de mutações do gene do cancro, e certos padrões ou regras de mutações do gene do cancro foram descobertos através da análise destes dados de mutação [1], [2], [10], [11]. A descoberta de genes mutantes em cancros humanos e os padrões por trás dos dados de mutação têm proporcionado uma visão crítica sobre os mecanismos subjacentes a formação e desenvolvimento de câncer, e provaram úteis para a terapia do cancro [3], [12]. No entanto, o rápido aumento no dados de mutação genética do cancro sugere um elevado nível de complexidade associada à compreensão do processo tumorigénico [2]. Dada esta complexidade, são necessários mais métodos novos para as análises dos dados de mutação para uma melhor compreensão do cancro.

De um modo geral, as mutações do gene do cancro não ocorrem aleatoriamente. As mutações de determinados genes do cancro tendem a co-ocorrer (mutação co-ocorrendo denominado no presente trabalho), o que sugere que eles possam contribuir em conjunto para a formação e o desenvolvimento do tumor. No entanto, as mutações de alguns outros genes ocorre de um modo mutuamente exclusivo (denominada mutação neste trabalho anti-co-ocorrendo) [8], sugerindo que dois genes com mutações anti-co-ocorrem a jusante podem ter componentes altamente semelhantes. Por exemplo, Ras e Braf mostrar mutações anti-co ocorrendo. Com efeito, activaion de um membro é suficiente para activar a via da MAPK [13]. Embora alguns genes do cancro com mutações co-ocorrendo e anti-co-ocorrência foram revelados, a complexidade das mutações do gene do cancro humanos nos impede de ganhar um panorama global de mutações do gene do cancro co-ocorrendo e anti-co-ocorrem. Para uma melhor compreensão dessas interações funcionais entre os genes do câncer, este estudo apresenta uma abordagem de biologia de sistemas e realiza uma análise abrangente dos genes do cancro com mutações co-ocorrência de mutações e anti-co ocorrendo.

Resultados

rede de co-ocorrendo e anti-co-ocorrência de mutações do gene do cancro

Uma rede de genes de câncer com co-ocorrendo e mutações anti-co ocorrendo (rede CCA) foi construído ligando genes do câncer que têm significativa co-ocorrência ou anti-co-ocorrência com outros genes (ver Materiais e métodos). A rede CCA inclui 306 genes e 1.366 ligações (Arquivo S1; Figura 1). Entre as 1.366 ligações, 1.355 (99,2%) são links de mutação do gene co-ocorrência e apenas 11 (0,8%) são ligações de mutação do gene anti-co ocorrendo. Assim, no presente estudo, todas as análises foram realizadas para os genes com mutações co-ocorrem salvo indicação em contrário ou explicado. A rede CCA inclui cinco componentes de rede. A (maior) componente de rede gigante contém 97,4% (298/306) dos nodos totais, sugerindo que a maioria dos genes têm potenciais relações que contribuem para a tumorigénese. Os graus de nós na rede CCA mostrar uma distribuição de lei de potência (Figura S1), indicando que a rede CCA é uma rede livre de escala.

Cada nó representa um gene do cancro. Genes ligados por ligações cinza representam mutações co-ocorrência. Genes ligados por laços roxos representam mutações anti-co ocorrendo. A rede CCA tem dois módulos. Nós em um módulo são vermelho e nós no módulo dois são verdes.

Preferência de genes com mutações co-ocorrência de transduções sinalização de ativação direta

Acredita-se que os genes do câncer com co mutações -occurring não são distribuídos aleatoriamente no genoma do câncer. Atualmente, não se sabe como ocorrem mutações co-ocorrência. Como as células têm de responder a vários sinais, e uma vez que a sinalização celular é crítica para tarefas, tais como o crescimento celular, a manutenção da sobrevivência celular, a proliferação, diferenciação, desenvolvimento e apoptose, a disfunção de sinalização celular de mutações do gene pode resultar em cancro [1 ]. Para abordar as questões acima, a distribuição de genes com mutações co-ocorrem em vias de sinalização celular humanos e em uma rede de sinalização celular humana foi investigado. Co-ocorrência de genes mutantes foram pela primeira vez mapeados em 183 vias de sinalização humanos, e 42 pares de genes com mutações co-ocorrência foram mapeados para as mesmas vias. em seguida, foi realizado um teste de aleatorização para avaliar se as mutações de genes co-ocorrem preferem ocorrer na mesma via de sinalização (ver Materiais e Métodos). Os resultados sugerem que o gene mutações co-ocorrem preferem existir na mesma via de sinalização (P = 0,002, teste de aleatorização, Figura 2A). Esta observação sugere ainda que as mutações de um único gene em uma via de sinalização não pode necessariamente afectar a via letalmente, e que uma via de disfunções são frequentemente o resultado da co-ocorrência de mutações de dois ou mais genes. Para determinar se os genes com mutações co-ocorrem tendem a ter interacções directas na sinalização celular, a distribuição de genes de cancro com mutações co-ocorrem numa rede de sinalização celular humana foi investigado. Um total de 306 genes do cancro foram primeiramente mapeado na rede de sinalização, e 107 destes genes foram determinadas a existir na rede de sinalização. Para pares de genes com mutações co-ocorrência, 7,0% deles tinham interações diretas na rede de sinalização. Em comparação, para os pares de genes que não tinham mutações co-ocorrência, apenas 2,8% deles tinham interações diretas na rede de sinalização. Isto indica que os genes com mutações co-ocorrendo tendem a ter interações sinalização diretos (p = 0,02, teste exato de Fisher, odds ratio (OR) = 2,45). As células devem usar os sinais corretos (ativação ou seja, ou repressão) para que a resposta certa a vários estímulos [14]. sinais diferentes podem levar as células a diferentes destinos [15], [16]. É interessante para revelar o que sinaliza estes genes do cancro interagindo preferem usar. Para fazer isso, o número de diferentes sinais entre os pares de genes de câncer interagindo foi contado. Os resultados mostram que esses genes utilizar mais sinais de ativação (69,2%), sinais de repressão menos (6,8%) e interações físicas (24,0%) do que a média (47,5%, 14,6% e 37,9% para a ativação, a repressão e ligações físicas , respectivamente). Os sinais utilizados por esses genes do cancro são fortemente desequilibrados (P = 4,1 × 10

-6, teste do qui-quadrado). Além disso, esses genes do cancro preferem usar sinais de activação e evitar o uso de sinais de repressão (P 2,0 x 10

-4, teste de aleatorização; Figura 2B). Estes resultados sugerem que, em muitos casos, as mutações de um único gene em uma via de sinalização não pode afectar significativamente a sinalização celular, e que as mutações acumuladas na activação interacção de sinalização tendem a amplificar os efeitos das mutações do gene do cancro e, por conseguinte, têm influências significativas sobre a disfunção da via de sinalização. Estas mutações podem, portanto, contribuir mais para a formação de câncer e desenvolvimento do que outras mutações.

A seta vermelha indica o número real de pares de genes do câncer que existem na mesma via. A curva representa a distribuição do número aleatório de pares de genes do cancro que existem na mesma via. (B) Distribuição do número de sinais de ativação e repressão entre os pares de genes do cancro com mutações co-ocorrência. O círculo vermelho (apontado por uma seta vermelha) indica o número real de sinais de ativação e sinais de repressão que existem entre os pares de genes de câncer na rede de sinalização humana. O heatmap indica a distribuição união do número aleatório de sinais de ativação e sinais de repressão que existem entre os pares de genes de câncer na rede de sinalização humana. (C) Correlação entre a distância de genes de câncer na rede CCA e sua semelhança expressão.

distância Rede de genes na rede CCA correlaciona-se com a sua expressão semelhança

Os resultados acima sugerem que os genes de câncer com mutações co-ocorrendo tendem a ser mais relacionada funcionalmente do que pares de genes aleatórios. Portanto, os genes que estão próximos uns dos outros na rede pode ser mais do que os genes funcionalmente relacionados que estão longe um do outro. Tem sido relatado que a expressão do gene semelhança tem uma boa correlação com a semelhança gene funcional [17], [18], [19]. Por conseguinte, é esperado que a distância da rede (o comprimento do caminho mais curto entre dois nós de uma rede) destes genes do cancro a ser correlacionada com a sua semelhança expressão. Para confirmar esta expectativa, o autor calculada primeiro a semelhança de pares de genes interagindo na rede CCA com base em dados de expressão de genes humanos apresentadas por Su et ai expressão. [20] pela correlação de Pearson, que é frequentemente utilizado para calcular similaridade expressão do gene (ver Materiais e Métodos). Em seguida, analisou-se a correlação entre a distância de rede e semelhança de genes na rede CCA expressão. Como esperado, a distância da rede e similaridade de expressão são negativamente correlacionados (R = -0,04, P = 6,9 × 10

-11, a correlação de Spearman). Considerando que muitos pares de genes têm a mesma distância da rede, o que pode gerar viés na análise de correlação, pares de genes foram ainda integrados em grupos de acordo com sua distância da rede, e à semelhança de expressão média para cada grupo de pares de genes foi calculado. Tal como mostrado na Figura 2C, a distância da rede de genes agrupados está negativamente correlacionada com a sua semelhança expressão (R ​​= -0,89, P = 0,03, correlação de Spearman). Estes resultados indicam que os genes com mutações co-ocorrem tendem a ser mais funcionalmente relacionados, e vice-versa.

Genes com co-ocorrem mutações tendem a ter frequências de mutação similar, enquanto que os genes com anti-co-ocorrem mutações tendem ter diferentes frequências de mutação

frequência de mutação varia para diferentes genes do cancro e de diferentes tipos de câncer. Por exemplo, p53 é mutado em cerca de 90% de amostras de cancro do esófago, mas apenas em 7,5% de amostras de cancro do rim. Apesar de uma larga escala de genes mutados concomitantes foram identificados neste estudo, os padrões de frequência de mutação destes genes permanecem desconhecidos. Para lidar com a falta, foi calculada a diferença absoluta das frequências de mutação (AD) para quaisquer dois genes vizinhos na rede. Os valores AD para genes com mutações co-ocorrência, genes com mutações-anti-co ocorrendo, e pares de genes aleatórios foram então comparados. Genes com mutações co-ocorrentes foram encontrados a ter valores AD menores do que genes com mutações-anti-co ocorrendo (P = 3,32 × 10

-7, teste de Wilcoxon, Figura 3A). Foi também descobriu que genes com mutações co-ocorrentes têm valores AD menores do que pares de genes aleatória (p = 0,002, teste de aleatorização, Figura 3B), enquanto genes com mutações-anti-co ocorrendo têm maiores valores de anúncios do que pares de genes aleatória (p 0,0002, teste de aleatorização, Figura 3C)

(a) Comparação dos valores de AD para genes com mutações co-ocorrência (vermelho) e genes com mutações-anti-co ocorrendo (verde).. (B) A comparação dos valores médios de AD para genes com mutações co-ocorrência (seta vermelha) e a distribuição dos valores medianos para 5.000 grupos aleatórios de genes com mutações co-ocorrência. (C) Comparação dos valores AD mediana de genes com mutações-anti-co ocorrendo (seta verde) ea distribuição dos valores medianos AD por 5.000 grupos aleatórios de genes com mutações-anti-co ocorrendo.

recursos de rede estão associados com características genéticas

uma característica importante de um nó em uma rede é o seu grau [21]. O grau de um nó é representado como o número de ligações que tem. Esta é uma métrica importante para medir a central de um nó de uma rede. No entanto, permanece desconhecida que genes tendem a ter mais mutações co-ocorrência do que outros genes na rede CCA. Como tal, as associações de grau nó com comprimento nó, frequência de mutação, e o número de exons foram ainda investigadas. Os resultados da análise mostram que o grau não está relacionado com a frequência de mutação ou comprimento gene, mas é positivamente correlacionada com o número de exões (R = 0,13, P = 0,02, correlação de Spearman). Isto sugere que as proteínas compostas por mais exões pode ter uma maior diversidade funcional e, por conseguinte, pode potencialmente ter mais interacções físicas ou bioquímicas com outras proteínas. Isto sugere ainda que a co-ocorrência de mutações dessas proteínas com outras proteínas podem muitas vezes ser necessário para a disfunção de vários caminhos que contribuem para a tumorigénese.

O coeficiente de agrupamento (CC) é ainda outra característica importante para os nós redes [21], uma vez que representa a coerência das regiões locais nas redes. A rede tem uma CCA CC média de 0,48. Isto indica que as mutações de múltiplos genes são muitas vezes necessários na tumorigénese. Além disso, o CC de genes está negativamente correlacionada com a sua frequência de mutação (R ​​= -0,19, P = 7,09 × 10

-4, a correlação de Spearman) e positivamente correlacionada com o seu grau (R = 0,19, P = 6,29 × 10

-4, a correlação de Spearman). Considerando-se que os genes com mutações co-ocorrem tendem a ser funcionalmente relacionadas, tal como revelado acima, este resultado sugere que os genes de uma estrutura de rede local densamente interagiu (ou seja, genes com muitas interacções mútuas) tendem a ser mais robusto contra erros (por exemplo, mutações ) e têm menor letalidade do que aqueles em uma estrutura de rede local escassamente interagiram. Além disso, tanto aumento graus e CC a partir do espaço extracelular ao núcleo (graus médios são 3, 6, 6 e 6,5; CCs medianos são 0,17, 0,40, 0,44 e 0,45), indicando que componentes celulares a jusante tendem a cooperar mais uns com os outros nas disfunções celulares que contribuem para o câncer do que componentes celulares a montante.

a rede CCA mostra estruturas modulares

Semelhante a muitas outras redes biológicas, a rede CCA também mostra estruturas modulares. Numa rede, um módulo de rede refere-se a um grupo altamente interligada de nodos [21]. Nós entre dois módulos de rede são escassamente conectado. Como mostrado na Figura 1, a rede tem CCA claramente dois módulos. Estudos anteriores revelaram que nós em um módulo de rede tendem a trabalhar em conjunto para alcançar uma função específica [21], [22]. Para confirmar se os dois módulos na rede CCA têm funções distintas, as funções moleculares enriquecido (MFS), processos biológicos (BPS), e componentes celulares (CCs) para genes nos dois módulos foram identificados utilizando o software DAVID [23 ] e definir todos os genes do cancro nos dois módulos como a população de fundo. DAVID é uma ferramenta popular para identificar conjuntos enriquecidos de genes (ou seja, caminhos, termos de ontologia gênica), avaliando a importância do enriquecimento de genes interessadas em cada conjunto de genes pré-definida [23]. Levamos os conjuntos de genes com valores de P menor ou igual a 0.05 conjuntos de genes como significativos. Os resultados revelam que os dois módulos têm conjuntos distintos enriquecidos gene (Figura 4; Arquivo S2). Em termos de localização celular, por exemplo, um módulo é enriquecido na membrana e no núcleo, enquanto que o Módulo Dois é enriquecido no espaço intracelular. Ambos os módulos são enriquecidos com a função de ligação, mas tendem a ligar-se com moléculas diferentes. Um módulo é enriquecido com ligação de ADN, enquanto que o Módulo Dois é enriquecido com ligação de moléculas pequenas, tais como adenil ribonucleótido, nucleótidos de purina, ATP, e lípidos. Além disso, os dois módulos também são diferentes na sua processos metabólicos e de sinalização. Estes resultados indicam que os genes com mutações co-ocorrência e anti-co-ocorrência de mostrar arquitetura específica no que diz respeito a ambos topologia e função.

Módulo One (palavras com cor vermelha) é enriquecido na membrana e do núcleo e módulo dois (palavras com cor amarela) é enriquecido no espaço intracelular. As funções enriquecidas e processos biológicos de cada módulo também são traçados nos locais correspondentes.

O autor perguntou se os genes em dois módulos podem funcionar de uma forma compensatória ou concertada para governar várias funções. Para este fim, um conjunto de dados independente de mutações do gene do cancro todo o genoma de 22 amostras de câncer de Sjoblom et al. ‘Foi usado estudo [7] para investigar a distribuição de mutações genéticas nos dois módulos. O autor contou o número de amostras que têm mutações no gene em ambos os módulos, somente no Módulo One, e só no Módulo Dois, respectivamente. Como resultado, entre o total de amostras 22 com câncer, 8 amostras têm mutações genéticas em ambos os módulos, 14 amostras têm mutações genéticas única no Módulo One, e não há amostras têm mutações genéticas única no Módulo Dois. modelagem aleatória da distribuição dos três números mostra que as amostras têm mutações genéticas em ambos os módulos ocorrer com uma possibilidade de 25% no caso aleatória. Este resultado sugere que os genes dos dois módulos têm uma tendência a trabalhar em conjunto de uma forma complementar para gerar fenótipos de tumor. Além disso, todas as amostras possuem pelo menos uma mutação genética no módulo Uma. Este número é significativamente maior do que o caso aleatório (P 2,0 x 10

-4, teste de aleatorização; Figura 5A), indicando que este módulo parece ser o jogador importante e essencial na tumorigénese. Esta conclusão é ainda apoiada pelas seguintes observações. (A) Um módulo é enriquecido em função de anti-oncogene (S2 Arquivo). (B) Genes no Módulo One têm maior fração de metilação (10,0%, 21/210) em células-tronco do câncer do que aqueles no Módulo Dois (1,1%, 1/88). O autor obtidos os números de genes metilados nestes dois módulos de primeiro mapeamento metilado genes em genes nestes dois módulos e, em seguida, a contagem dos números de genes metilados mapeados em Módulo Um e Dois Módulo, respectivamente. teste exacto de Fisher mostra que o cancro metilado genes enriqueceu significativamente a distribuição no módulo Um (P = 0,006), sugerindo que os genes em Módulo Um contribuir mais para a perda a longo prazo da expressão do gene e representa a fase inicial de formação de tumor [1]. (C) A frequência de mutação de genes em Módulo Um é significativamente maior do que a de genes no Módulo Dois (P = 5,75 × 10

-9, teste de Wilcoxon; figura 5B). A significância estatística foi obtido por meio do teste de Wilcoxon para testar a diferença entre dois grupos de frequência de mutação gene do cancro da Módulo Um e Módulo Dois.

O eixo x representa o número (M) das amostras que têm pelo menos uma mutação no Módulo dois. O eixo dos y representa o número (N) de amostras que apresentam mutações em única Módulo Dois. O círculo vermelho (indicado por uma seta vermelha) indica o número real de M e N. A heatmap indica a distribuição de união o número aleatório de m e n e a sua cor representa a densidade de probabilidade. (B) Comparação da frequência de mutação de genes em Módulo Um e genes no Módulo Dois.

Discussão

Apesar de um número de genes do cancro contribuir para tumorigênese de uma forma de co-ocorrência ou anti-co-ocorrem mutações, tem sido difícil de obter um panorama global de quando, onde e como as suas interacções exercer efeitos sobre a formação e o desenvolvimento do tumor. Através da construção de uma rede CCA e realizando uma análise integrativa desta rede, o autor descobriu um quadro global de mutações do gene do cancro co-ocorrendo e anti-co-ocorrem. mutações de ocorrência Co preferencialmente ocorrem em pares de genes funcionalmente relacionados, tais como moléculas de transdução de sinalização, especialmente as moléculas de transdução de sinalização de activação. Os pares de gene do cancro interagindo ter um efeito sobre as suas frequências de mutação. Genes com mutações co-ocorrendo tendem a ter frequências de mutação similares, enquanto genes com mutações-anti-co ocorrendo tendem a ter diferentes frequências de mutação. Topologicamente, a rede CCA mostra dois módulos que têm funções específicas. Os dois módulos tendem a ter colaborações funcionais e um módulo parece ser o jogador central de participação na tumorigênese.

Por causa da enorme diversidade e complexidade das mutações do gene do cancro, cancros, mesmo o mesmo tipo de cancros mostrar muito diferente perfis de mutação e alguns padrões comuns por trás destes dados foram identificados. Portanto, alguns pesquisadores duvidar do valor da genômica do câncer [24]. Por uma análise de nível de sistemas, este estudo apresentou evidências diretas dos princípios de gene do cancro mutações co-ocorrendo e anti-co-ocorrência, que são úteis para a compreensão do mecanismo pelo qual os genes do câncer contribuem para a formação e desenvolvimento de câncer de uma forma de co-ocorrência ou anti-co-ocorrência de mutações.

O sequenciamento de genomas do câncer é um processo contínuo. Actualmente, os dados de mutação pode interpretar sequenciados apenas uma parte das mutações. Como o desenvolvimento da próxima geração de tecnologia de sequenciação do genoma, mais e mais dados de mutação do gene do cancro serão acumulados. Portanto, espera-se que as observações mais fiáveis ​​e novos será realizado no futuro. Este estudo apresenta um quadro biologia de sistemas para a análise integrada de saídas de sequenciamento do genoma do câncer, o que será útil para não só a compreensão de desenvolvimento de neoplasias, mas também a identificação de biomarcadores valiosos e alvos de drogas.

Materiais e Métodos

dados de mutação do gene do cancro

dados de mutação do gene do cancro foram baixados do Catálogo do Somatic Mutações em Câncer (Dezembro de 2008, COSMIC, https://www.sanger.ac.uk/genetics/CGP/cósmico/). A frequência de mutação de um gene foi calculada dividindo o número de amostras totais de cancro que sequenciados este gene com aquele de amostras de cancro com pelo menos uma mutação deste gene, como descrito por Cui et al. [1]. Porque frequência de mutação do gene é significativamente correlacionada com o comprimento do gene (R = 0,4, P = 5,16 × 10

-14, a correlação de Spearman), frequência de mutação genética foi ainda corrigidos pelo comprimento do gene usando a fórmula “comprimento original frequência de mutação /gene”.

genes metilados em células-tronco cancerosas

Os 287 genes metilados em células-tronco de câncer foram obtidos a partir de estudo de Cui et al [1], em que recolheu estes genes a partir de três estudos [25 ], [26], [27]. Vinte e dois dos 287 genes foram encontrados na rede CCA

via de sinalização Humana e sinalização celular rede

Cento e oitenta e quatro vias de sinalização humanos foram obtidos a partir BioCarta (http: //www. .biocarta.com /) e uma rede de sinalização celular humana foi obtida a partir do estudo de Cui et ai. [1]. A rede de sinalização celular humana incluiu 1.634 nós e 5.089 ligações, contendo 2.403 interações de habilitação, 741 interações repressão, 1.915 interações físicas e 30 ligações cujos tipos são desconhecidos (S3 arquivo).

Rede de co-ocorrência e anti -CO-ocorrendo mutações do gene do cancro

para quaisquer dois genes, por exemplo, a e B, o número de amostras de cancro que tanto sequenciado o gene a e B do gene foi identificado pela primeira vez. O número de amostras de cancro com mutações em ambos os genes A e B (AandB), o de câncer de amostras com mutações apenas na Gene A (AnotB), o de câncer de amostras com mutações apenas na Gene B (BnotA), e a de amostras de cancro com mutações no gene nem A nem B gene (notAnotB) foram então contados. A significância (valor P) de mutações do gene do cancro co-ocorrência ou anti-co-ocorrência foi ainda determinada pelo teste exato de Fisher com base nas obtidos quatro números. Uma rede de co-ocorrendo e mutações do gene do cancro anti-co ocorrendo (rede CCA, S1 Arquivo) foi construído definindo um valor P de corte de 0,02. Quaisquer dois genes com valor de P menor ou igual a 0,02 (FDR P = 0,08) foram ligados. Finalmente, uma rede CCA foi construído a partir de este método. A rede final incluiu 306 nós e 1.366 ligações (Figura 1), que foi desenhada por Pajek, a visualização de rede livre e software de análise (https://vlado.fmf.uni-lj.si/pub/networks/pajek/).

o grau eo valor CC para cada nó na rede CCA foi calculado de acordo com a fórmula apresentada por Barabasi e Oltvai (S4 Arquivo) [21]. A frequência de mutação de genes de câncer, também é dado em S4 Arquivo. Os componentes da rede foram identificados através de um programa Java concebidos para este fim (S5 do ficheiro). A distância rede de dois genes foi obtida calculando a duração do seu caminho mais curto, que foi implementado utilizando o algoritmo de Dijkstra. O grau de distribuição foi calculado em R, um software estatístico livre (https://cran.r-project.org/). Como a rede CCA mostrou estruturas modulares muito claras, dois módulos de rede (File S6) foram manualmente identificados sem o uso de outras ferramentas.

Análise de dados de expressão de genes

Este estudo obteve a expressão do gene humano normalizado perfil através 79 tecidos humanos de Su et al. ‘Estudo [20] para a análise da expressão do gene de similaridade. O autor extraída perfis de expressão para os genes incluídos na rede ACC e mais medido a semelhança entre quaisquer dois genes ligados na rede CCA pelo coeficiente de correlação de Pearson absoluta, o que é uma métrica frequentemente utilizados em análise semelhante [17] expressão.

computações estatísticas

Todos os testes estatísticos foram realizados utilizando o software R. Os testes de aleatorização foram executadas por programas Java concebidos para esse fim. A idéia básica dos testes de aleatorização foi introduzido aqui por fazer o teste para o enriquecimento de mutações co-ocorrem em vias de sinalização humanos como um exemplo. Genes foram primeiramente aleatoriamente re-conectado na rede usando o mesmo número de ligações. O número de ligações gerado-ER que estão dentro das mesmas vias de sinalização foi em seguida contadas. Estes procedimentos foram repetidos 5000 vezes. O número de vezes (t) o número aleatório foi maior do que ou igual ao número real foi contado. O valor P foi calculada usando a fórmula

(T + 1) /5001

.

Informações de Apoio

arquivo S1.

O arquivo de rede Pajek da rede de genes de câncer com mutações co-ocorrendo e anti-co-ocorrem

doi: 10.1371 /journal.pone.0013180.s001

(0.05 MB TXT)

arquivo S2. : Lista de funções moleculares enriquecido (CM), processos biológicos (BPS), e componentes celulares (CCs) de genes no Módulo 1 e Módulo 2.

doi: 10.1371 /journal.pone.0013180.s002

(0.05 MB DOC)

arquivo S3. : Lista dos genes, suas funções, localizações celulares e relações de sinalização na rede de sinalização humana

doi:. 10.1371 /journal.pone.0013180.s003

(0,49 MB XLS)

S4 arquivo. : Lista dos nós da rede e seu coeficiente de frequência de mutação, o grau eo agrupamento (CC)

doi:. 10.1371 /journal.pone.0013180.s004

(0.01 MB TXT)

S5 Arquivo. .

O arquivo de código-fonte jave para a identificação de componentes de rede

doi: 10.1371 /journal.pone.0013180.s005

(0.00 MB TXT)

S6 arquivo. : Lista de genes em dois módulos de rede

doi:. 10.1371 /journal.pone.0013180.s006

(0.00 MB TXT)

Figura S1. distribuição

Grau da rede CCA

DOI:. 10.1371 /journal.pone.0013180.s007

(0.41 MB TIF)

Agradecimentos

O autor agradece os revisores para comentários e sugestões valiosas, graças Prof. Yongfeng Shang para conselhos valiosos, e graças Dr. Wei Pang para ajudar no desenho da Figura 4.

Deixe uma resposta