PLOS ONE: um algoritmo novo para a análise integrada de miRNA-mRNA interações baseadas na classificação individual revela Insights sobre o cancro de bexiga

Abstract

Fundo

Os microRNAs (miRNAs) são pequenos RNAs não-codificantes que regulam a expressão do gene. Tem sido proposto que miARNs desempenham um papel importante no desenvolvimento e progressão do cancro. Sua capacidade de afetar múltiplas vias de genes alvejando vários mRNAs torna uma classe interessante de reguladores.

Metodologia /Principais Achados

Temos desenvolvido um algoritmo, análise classificação com base de dados de expressão pares de RNA (CABO ARN), que é capaz de identificar regulação alterada miARN-ARNm entre os tecidos de amostras que atribui estados de interacção para cada amostra sem pré-existentes estratificação de grupos. A distribuição dos estados de interacção afectadas em relação a determinados grupos experimentais é utilizado para avaliar a qualidade de uma interacção previsto. Nós demonstrar a aplicabilidade da nossa abordagem por análise carcinoma urotelial e amostras de tecido de bexiga normal derivado dos 24 pacientes. Usando a nossa abordagem, amostras normais e tecidos de tumores, bem como diferentes fases da progressão tumoral foram com sucesso estratificada. Além disso, os nossos resultados sugerem interações miRNA-RNAm regulados diferencialmente interessantes associados com a progressão do tumor da bexiga.

Conclusões /Significado

A necessidade de ferramentas que permitem uma análise integrativa de microRNA e mRNA de dados de expressão tem sido abordada. Com este estudo, nós fornecemos um algoritmo que enfatiza sobre a distribuição de amostras para classificar as interações miRNA-RNAm diferencialmente regulados. Este é um novo ponto de vista em relação a abordagens atuais. A partir da análise bootstrapping, nosso ranking produz características que constroem classificadores fortes. Uma análise mais aprofundada revela genes identificados como diferencialmente regulados por miRNAs para ser enriquecido em vias de câncer, sugerindo interações biologicamente interessantes

Citation: Hecker N, Stephan C, Mollenkopf HJ, Jung K, Preissner R, Meyer HA (2013. ) Um novo algoritmo de Análise Integrada de miRNA-mRNA interações baseadas na classificação individual revela Insights sobre o cancro de bexiga. PLoS ONE 8 (5): e64543. doi: 10.1371 /journal.pone.0064543

editor: Panayiotis V. Benos, da Universidade de Pittsburgh, Estados Unidos da América

Recebido: 12 de outubro de 2012; Aceito: 17 de abril de 2013; Publicado: 24 de maio de 2013

Direitos de autor: © 2013 Hecker et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi financiado pelo BMBF (MedSys, conceder No. 0.315.450) https://www.bmbf.de/and Deutsche Forschungsgemeinschaft (DFG) GRK 1772 “Sistemas de Biologia Computacional” https://www.dfg.de. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer de bexiga é o quarto câncer mais comum em países industrializados [1]. Muscle carcinoma da bexiga invasivo ainda tem uma alta mortalidade, apesar de melhores terapias de melhoria das técnicas cirúrgicas e tratamentos agressivos. Aproximadamente 90% de todos os neoplasmas são classificados como urothelial carcinoma urotelial (UCC), que pode ser dividido por meio de parâmetros clínicos e morfológicas em dois subgrupos diferentes [2], [3]. A maioria dos UCC pertence ao grupo dos tumores papilares não invasivos (fase ATP), em geral, estes tumores são bem diferenciada, tendem a crescer lentamente e sem grande espalhamento têm um bom prognóstico clínico. O terço restante da UCC são tumores invasivos (estágio pT1 e superior) com diferenciação mal, taxas de progressão elevadas ea capacidade para formar metástases. Ao nível molecular, a maioria UCC não-invasiva estão associados a mutações FGFR3 e perda cromossoma 9 [4], [5], enquanto a inactivação de p53 e a função de PTEN desempenha um papel importante na progressão da UCC invasiva [6]. Em várias publicações, os padrões de expressão transcriptomic têm sido associados a resultados clínicos no carcinoma urotelial [7] – [10]. Além disso, a análise de primeira integrado de ambos miRNA e os dados mRNA foi realizada para obter uma análise mais pormenorizada redes reguladoras e vias de transdução de sinal de câncer envolvidos que causam câncer de bexiga [11], [12]. No entanto, os mecanismos exactos envolvidos na iniciação e progressão do carcinoma urotelial bexiga permanece em grande parte claro. Uma análise mais aprofundada da expressão gênica e de dados de expressão miRNA é crucial para detectar os processos desconhecidos que levam a tumorigênese. Com o estabelecimento de aplicações de microarray, vários métodos computacionais foram desenvolvidos para analisar os dados de expressão de genes. análise de conjunto de genes e análise de enriquecimento de gene são muitas vezes utilizados para identificar genes diferencialmente expressos [13], [14]. As ferramentas mais comuns e serviços web que se aplicam os princípios da análise de enriquecimento de gene são DAVID [15], GeneTrail [16], gorila [17], GeneCodis [18] e goEast [19], para uma visão geral ver referência [20] .

Para além de genes co-expressos, diferencialmente regulados pares de miARNs e mRNAs desempenhar um papel importante em vários processos celulares e doenças. Para avaliar esta questão, vários métodos têm sido desenvolvidos para prever as interacções entre miARNs e mRNAs com base nas suas sequências. A maioria das ferramentas explorar a semente complementar entre miARNs e a 3’UTR do ARNm específico, as informações sobre a conservação da sequência de bases adjacentes e propriedades termodinâmicas de interacções de ARNm miARN alvo. Os diferentes métodos têm sido recentemente revista [21]. Algumas das ferramentas mais comuns são TargetScan [22] – [25], PicTar [26] – [29], Miranda [30] – [32] e PITA [33]. Vários recursos da Web fornecem validado ou previsto interações miRNA-RNAm, por exemplo, TarBase [34], miRecords [35], miRGen [36] e miRBase [37], miRGator oferece perfis de expressão de miRNA e mRNA [38], a Base Estelar [39] e Dorina [40] são bancos de dados que integram miRNA e Ribonucleoproteína sítios de ligação.

Há uma necessidade de métodos que levam em consideração a natureza específica do miRNA regulação induzida. miReduce [41] e Sylamer [42] pode ser usado para avaliar a correlação entre os enriquecimentos em 3’UTRs motivo de semente de ARNm para os genes regulados diferencialmente em experimentos knockout miARN. DIANA-mirExTra implementa métodos de avaliação motif gene semelhantes como um serviço web [43]. Creighton et al desenvolveram um conjunto de macros Excel para combinar conjuntos de genes enriquecidos com previsões de interacção miARN-ARNm [44]. Recentemente, métodos e web-services para a análise integrada de dados de expressão de miRNA e mRNA foram desenvolvidos, como MAGIA [45], [46], MMIA [47], mirAct [48], miRConnX [49] e miRTrail [50] . GenMIR ++ implementa uma abordagem de aprendizagem Bayesian para identificar diferencial regulação miRNA-mRNA [51], [52]. HOCTAR calcula correlações negativas entre miRNA e expressão de mRNA [53]. Outros métodos são baseados na análise de regressão de [54], [55]. Uma abordagem baseada no agrupamento de dados de expressão de ARNm de miARN e em combinação com um t-teste foi desenvolvido por Jayaswal et ai. [56]. A maioria das ferramentas atuais têm deficiências, tais como a utilização de métodos que são propensas a erros a outliers ou eles não permitem a identificação de regulação diferencial entre dois grupos de amostras.

Neste estudo, apresentamos uma nova abordagem que avalia miRNA diferencial -mRNA regulação combinado com a distribuição de amostras para um único interacção. Nossa hipótese é que as interações miRNA-RNAm individuais são característicos de um determinado estado de desenvolvimento de neoplasias. Consideramos diferencial miRNA regulação genética induzida como um problema de duas classes e usar a seguinte suposição. Dada uma interacção entre um miARN e ARNm que é característico para a diferença entre dois grupos de amostras, o miARN é sobre-regulada e o ARNm sub-regulada no primeiro grupo, em relação ao segundo grupo, ou recíproco. A nossa abordagem classifica cada interação previsto para cada amostra independentemente do conhecimento do grupo. Desta forma, pode-se analisar as diferenças individuais dentro de uma coletiva de amostras para um conjunto específico de interações. Além disso dada uma interação, podemos dividir as amostras em grupos esperados que refletem a regulação dos genes induzidos miRNA. O acordo entre os grupos esperados e os experimentais produz um ranking significativo para distinguir potenciais interacções daqueles que não são susceptíveis de ocorrer. Em uma etapa final, que incorporam informações sobre correlação negativa entre miRNA e expressão de mRNA para eliminar falsos positivos.

Identificar as interações miRNA-RNAm regulados diferencialmente é uma basicamente uma forma de seleção de recurso. Para validar as diferentes etapas da nossa abordagem, temos realizado uma análise de componentes principais para analisar a separação das amostras após a atribuição de estados de interação e avaliou o desempenho de nosso ranking para construir classificadores

.

Em particular, temos aplicado nossa abordagem para um colectivo de amostras de tecido da bexiga saudáveis ​​e amostras de tumor da bexiga em diferentes fases. Além disso, nós examinamos a capacidade da nossa abordagem para classificar tumores de próstata câncer e tecidos saudáveis, bem como amostras de cancro do cólon e tecido saudável utilizando amostras de pequenas dimensões [57]. O desempenho dos classificadores foi comparado com um método bem estabelecido para os dados de expressão de genes, análise de previsão de Microrarrays por R (PAMR), que é um classificador centróide mais próximo reforçada [58]. Além disso, foram calculados escores de enriquecimento caminho para genes envolvidos em interações previstos e sugerem interações interessantes para a progressão do tumor cancro da bexiga.

Materiais e Métodos

Pacientes e Amostras de Tecido

A selecção de 24 amostras uroteliais de um colectivo de pacientes com cancro da bexiga descrito anteriormente foi utilizado neste estudo [59]. Oito amostras foram extraídas de tecido da bexiga não maligna (8 pacientes do sexo masculino, idade mediana de 69 anos, intervalo 47-80 anos), 8 amostras de carcinoma urotelial papilar de baixo grau (8 pacientes do sexo masculino, idade mediana de 72,5, faixa de 59-79 anos; 2x pTaG1 e 6x pTaG2)), e 8 amostras de tumores invasivos (6 do sexo masculino, 2 pacientes do sexo feminino, idade mediana de 73 anos, faixa 62-76 anos; 1x pT1G1, 4x pT1G3 e 3x pT2G3). As amostras foram recolhidas imediatamente após a cirurgia em azoto líquido e armazenado a -80 ° C até análise posterior. O estadiamento do tumor foi realizada em conformidade com a União Internacional Contra o Câncer e graduação histológica de acordo com os critérios de /ISUP da OMS de 2004 [60]. Todos os doentes com cancro da bexiga passou por cistectomia radical ou ressecção transuretral no Hospital Universitário Charité em Berlim entre 2008 e 2009 e deu consentimento informado por escrito para a utilização de amostras de tecido representativos para fins de investigação. O estudo foi aprovado pelo Comitê de Ética do Hospital Universitário Charité (File: EA1 /153/07).

Isolamento de RNA e Caracterização de quantidade e qualidade

As amostras de tecidos tumorais analisadas continham células de tumor mais de 80% tal como previamente descrito [59]. Cerca de 20-30 mg de peso húmido de tecido foi tratado com 350 ul de tampão de lise e o ARN total foi isolado utilizando o miRNeasy Mini Kit (Qiagen, Hilden, Alemanha) de acordo com o protocolo do fabricante. Um passo adicional de digestão com DNase I sobre a membrana de gel de sílica de ligação de ARN foi realizada. A quantidade e qualidade do ARN isolado foi determinada por um espectrofotómetro NanoDrop 1000 (NanoDrop Technologies, Wilmington, DE, EUA) e um Bioanalyzer 2100 (Agilent Technologies, Santa Clara, CA, EUA). Foram utilizados 5, somente as amostras com número de integridade do RNA (RIN) valores teste de Kruskal-Wallis, P = 0,486).

baseada Microarray análise RNA

expressão miRNA análise foi realizada por hibridizações de uma cor em catálogo humano 8-plex 15 K microarrays microRNA (AMADID 019.118) de Agilent (Agilent Technologies, Santa Clara, CA, EUA) que fechado 723 76 microARNs virais a partir do Sanger (miRBase libertar 10.1) e humano. Todos os passos da reacção foram realizadas como anteriormente descrito em detalhe [61]. Após a hibridização, microarrays foram lavadas, digitalizado e processado de acordo com o protocolo do fornecedor. Os dados brutos foram normalizados utilizando GeneSpring GX11 Software (Agilent) com parâmetros padrão (limite sinal bruto a 1,0, por cento mudança para percentil 90 como algoritmo de normalização e nenhuma transformação da linha de base). Todos os dados microarray foi depositado no banco de dados NCBI GEO com o número de acesso GSE36121.

expressão de mRNA análise foi realizada por hibridizações de uma cor em microarray do genoma humano inteiro 4 × 44 K v2 (026652) da Agilent compreendendo sondas para 34184 transcritos de ARNm humanos. Após a hibridização, microarrays foram lavadas, digitalizado e processado de acordo com o protocolo do fornecedor. Os dados brutos foram normalizados utilizando GeneSpring GX11 Software (Agilent) com parâmetros padrão (cento mudança para percentil 75 como algoritmo de normalização e uma transformação de base média de todas as amostras). Todos os dados microarray foi depositado no banco de dados NCBI GEO com o número de acesso GSE40355.

Classificação das interações miRNA-RNAm

miRNA-mRNA conjunto de dados de interação.

Validado miRNA humana interacções -mRNA foram obtidos a partir de 5.0 e Tarbase miRecords (versão 11-2010) [34], [35], [62]. previsões de ARNm alvo humano para miARNs foram extraídos a partir de 5.2 e TargetScan microRNA.org (versão 8-2010) [22] – [25], [63]. O recurso microRNA.org compreende previsões calculados pelo algoritmo miRanda [30], [31]. Em caso de microRNA.org, as únicas previsões que foram considerados, foram aqueles anotada como “miRNA conservada” e “boa pontuação mirSVR ‘. Para a análise, a intersecção entre microRNA.org e TargetScan previsões foram adicionados ao conjunto de interacções validados. famílias de miRNA foram extraídos tal como definido no conjunto de dados TargetScan.

Algoritmo de classificação de valores de expressão.

O objetivo do algoritmo é particionar os valores de expressão correspondentes a cada sonda em três sets :. “alto”, “médio” e “baixo”

Vamos ser o valor da expressão de log-normalizado de uma sonda específica para uma dada amostra que seja refere-se a um miARN ou ARNm. é o conjunto correspondente de valores dessa sonda sobre todas as amostras de expressão. Na primeira, os valores de expressão são exponenciadas, isto é. Desta forma, evitamos alguns problemas numéricos. Todos os valores são maiores do que zero, porque se aproxima de zero, como se torna mais negativa, isto é, quando abordagens, também, se então. Claramente, existe uma dependência de como os dados inicial foi normalizada.

Definimos a mudança absoluta dobra como por dois valores. Por favor note, que.

Há duas considerações preliminares. A primeira hipótese é que dois valores de expressão são expressos diferencialmente se a sua mudança de dobragem absoluto é maior do que um certo limiar. O segundo pressuposto é que os valores que mudam vezes absoluta é em um determinado intervalo são expressos de forma semelhante, ou seja, a sua mudança vezes absoluta é inferior ou igual a um limiar.

Dada e uma nonempty definir

B

onde está a cardinalidade do conjunto de

B

, definimos a mudança vezes absoluta entre

a

e a média de conjunto

B

como, se for. Novamente, uma vez que

B

é não vazio, e se e somente se.

Nós definimos esse conjunto de

A

é o bairro de

a

se e somente se onde.

Nós definimos

a

como representante de um conjunto de

a

se e somente se

a

é o bairro de

a

. Por favor note, que não pode haver mais de um representante de um conjunto

A

, ou seja, para dois valores em que

A

está no bairro de

a

e

B

é o bairro de

b,

se, mas também se e.

Nós definimos uma função de pontuação em dois elementos,

a

e

b

e suas vizinhanças

a

e

B

da seguinte forma:

adicione o seguinte restrição para determinar a pontuação final, em que:

a lógica por trás dessa pontuação função é encontrar dois conjuntos de valores expressos de forma semelhante, que abrangem a maioria dos dados, portanto, também que se sobrepõem menos possível, ou seja, o termo cobertura de dados. Além disso, mais igualmente conjuntos de tamanho maior são marcados, isto é, o termo distribuição de tamanho. Caso contrário, um conjunto poderia conter um único membro e o outro conjunto de todos os outros membros. Uma vez que, a cobertura de dados deve ser mais do que linearmente ponderada em comparação com a distribuição do tamanho dos conjuntos, introduzimos uma relação quadrática no prazo de cobertura dados. O último tipo de termos, ou seja, o conjunto de termos de penalização representativas, penalizar os representantes definidos que estão longe de sua vizinhança. O conjunto de termos de penalização representativos devem ter menos influência do que o termo cobertura de dados, de modo que estes termos são introduzidos em apenas um dos dois termos de cobertura de dados.

Para resumir o significado essencial da função de pontuação, identificamos dois diferentes bairros, valores ou seja, de expressão similar. Essas vizinhanças diferem por pelo menos uma alteração de dobragem absoluta definida, mas, em seguida, a alteração absoluta dobra pode ser arbitrária grande. A função de pontuação avalia até que ponto esses bairros são úteis para representar os dados, com base na cobertura de dados não valores absolutos.

Tendo em conta os dois conjuntos resultantes e seus representantes correspondentes que produzem a maior pontuação final, denotamos o representante com o valor mais baixo como eo representante de maior valor como. Com base em e, duas fronteiras e são calculados da seguinte forma:

A razão para isso é a seguinte. Os limites são definidos por o limite superior do conjunto inferior, e o limite inferior do conjunto superior; Se os conjuntos de sobreposição, os limites são trocados

Finalmente, para cada classificação de

v

é definido por:.

Esta classificação vai ser referido como Estado na seguinte.

para a classificação real de valores de expressão, o limiar limite e vizinhança vezes é determinado dinamicamente a partir de uma lista de valores emparelhados predefinidos, ou seja, um par para o elemento i-th na lista. Separadamente para cada sonda de miRNA ou mRNA, o limiar limiar vezes e bairro que deu o mais alto para esse conjunto particular de valores de expressão são utilizados. Para este estudo, definimos

Filtragem e interação estados.

Apenas os miRNA ou sondas de mRNA são considerou que exceder uma determinada pontuação maior do que um limiar onde

t O que É. um valor real arbitrária e a cardinalidade é o número de amostras. Considerando-se um único exemplo, sondas de ARNm que são mapeados para a mesma EntrezGeneID são classificados pelo estado máximo ocorrendo. Em um empate, as preferências para a classificação são baixas (L), alto (H) e, em seguida, médio (M). Antes interacções são classificados, as sondas de ARNm e de miARN são filtrados pela relação de amostras classificadas M, em que é o limiar correspondente. Para uma interacção miARN-ARNm e para cada amostra a classificação de uma interacção é a combinação dos dois estados de miARN e ARNm, por esta ordem, por exemplo, Se um miARN é classificada como L para uma amostra específica e o alvo de ARNm é classificada como H, em seguida, o estado da interacção é de LH. Assim, existem nove estados possíveis para uma interação:

S

= {LH, HL, LM, HM, MH, ML, HH, LL, MM}

Nós grupo estas combinações por. seu significado biológico:

Down-regulada estados

S

compHL

= {HL, ML, HM}; -regulada miRNA causar hipotética regulação negativa do mRNA.

estados-regulada

S

compLH

= {LH, MH, LM} ;. Regulada miRNA causar hipotético aumento da regulação do mRNA.

Os estados indefinidos

S

undef

= {HH, LL, MM} que não seguem a interpretação biológica mencionado acima.

as interações com uma frequência de estados indefinidos mais elevados do que um limite foram excluídos do conjunto de interações. Vamos continuar a se referir ao conjunto de interações que satisfaça os critérios de filtragem acima mencionados como o conjunto de interações reguladas.

Dado dois grupos pré-definidos

A

e

B

, foi definido que uma interação é diferencialmente regulada para

a

e

B

, se o estado com a frequência máxima do grupo

a

é um elemento de eo estado com a frequência máxima do grupo

B

é um elemento de ou recíprocas. Para todos os conjuntos de dados deste estudo, definimos, e.

Jaccard-Index.

Para cada interação, a Jaccard-index é calculado para avaliar a concordância entre os grupos experimentais previamente definidas e as grupos esperados com base no pressuposto de que um ARNm é regulada negativamente por um grupo e-regulada para o outro grupo por um miARN específicos.

Portanto, uma partição é calculado, onde as amostras estão agrupados nos três grupos e. Onde está o conjunto de amostras que têm um estado de interação de qualquer HL, HM, ou ML, é o conjunto de amostras que têm um estado de interação de qualquer LH, LM, ou MH e é o conjunto de amostras cujo estado é ou HH, MM, ou LL.

o Jaccard-Index é então a semelhança entre as duas partições e e assume um valor entre 0 e 1 [64], [65]. A Figura 1 resume os passos que foram realizados para identificar as interações diferencialmente reguladas neste estudo.

Os dados de entrada é representada por rectângulos laranja. Os dados de saída é indicada por rectângulos vermelhos. A elipse se refere ao conjunto de interações inferidos. Este conjunto é independente dos dados de entrada, embora possa ser alterada. Operações para manipular dados são descritos como diamantes.

modelo de classificação simples.

Para avaliar a aplicabilidade do nosso ranking por Jaccard-índices, com base no conjunto de interações diferencialmente regulados selecionados a modelo de classificação simples é construído no qual se prevê o primeiro grupo de um conjunto de amostras, por exemplo, amostras de câncer de um coletivo de amostras cancerosas e não-cancerosas.

Tal modelo contém um conjunto de estados para cada interação

i

do conjunto de interações selecionados

I

, onde ou. Além disso, um conjunto de estados indefinidos está definido. Para cada amostra, a soma das interacções classificadas como o primeiro grupo é dada por para todas as interacções

i

onde o estado da amostra. refere-se à soma das interacções classificadas como do segundo grupo, isto é, todas as interacções

i

onde o estado da amostra e. Em outras palavras, para uma amostra, que incrementa se o estado da amostra indica uma regulação na mesma direcção, tal como definido no modelo para a interacção específica, que incrementa se o estado da amostra corresponde à regulação oposto e nada é incrementado se o estado da amostra corresponde a um estado indefinido interacção. A classificação da amostra é então definida pelo máximo de e.

Um modelo é gerado a partir das interacções maior classificados dentro de um valor limiar para o índice de Jaccard-interacção de um ou de um número definido de interacções aleatorizados dentro uma gama de Jaccard-índices. Os estados são definidos de acordo com o estado com maior frequência para o primeiro grupo.

análise Bootstrapping.

Os valores de expressão normalizados foram divididos aleatoriamente em treinamento e teste sets onde cada conjunto de treinamento contém metade das amostras de cada grupo sem substituição. Se o número de amostras foi ângulo diferente de um grupo, os conjuntos de formações foram atribuídos um exemplo mais do que os conjuntos de ensaio para esse grupo. Em relação ao conjunto de dados câncer de bexiga, para o coletivo de todas as amostras, cada treino e cada conjunto de teste contém oito amostras a partir de qualquer grupo de amostras de câncer de bexiga invasivo ou não-invasivos e quatro amostras de tecido normal. Para o coletivo de amostras de cancro da bexiga, cada treino e cada conjunto de teste contém quatro amostras de câncer de bexiga invasivo e quatro amostras de cancro da bexiga não invasivos. Para os dois coletivos, 100 conjuntos de dados diferentes de treinamento e teste conjuntos foram gerados pela divisão aleatoriamente as amostras sob as restrições mencionadas acima. interações miRNA-RNAm foram calculados e classificados separadamente para cada treino e cada conjunto de teste. Para cada um dos dados 100 define um modelo foi calculado com base no conjunto de treinamento e aplicado ao conjunto de teste correspondente. especificidades, sensibilidades e as taxas de falso-positivos foram computadas com todos os 100 conjuntos de dados significam.

Da mesma forma que o conjunto de dados câncer de bexiga, um conjunto de dados câncer de cólon e tumor da próstata que contêm emparelhado miRNA /mRNA de dados de expressão de micro matriz foi usada para estimar especificidades e sensibilidades. amostras de tecido do cólon e amostras de tecido de próstata foram extraídos a partir do conjunto de dados fornecida por Lu et al. [57] e tratado como dois conjuntos de dados separados. Em mais detalhe, o conjunto de dados do cólon tumor compreende quatro amostras saudáveis ​​e sete amostras de tumor. A próstata conjunto de dados tumor contém seis amostras saudáveis ​​e seis tumorais. Para ambos o cancro do cólon e os dados relativos aos tumores de próstata definidos separadamente, 50 conjuntos de treino randomizados e conjuntos de teste foram gerados, em seguida, significa especificidades e sensibilidades foram calculados da mesma maneira conforme mencionado acima.

Além disso, para o tecido de cancro coletiva amostra do conjunto de dados câncer de bexiga, todo o procedimento foi realizado com um outlier removido e re-atribuído ao grupo esperado de acordo com os resultados da nossa análise, o mesmo outlier.

Análise de Previsão de microarrays para R

para comparar os resultados dos nossos classificadores para outro método, análise de previsão de microarrays para R (PAMR) [58], foi realizada utilizando os mesmos conjuntos de treinamento e teste como mencionado acima. PAMR compreende um K mais próximo classificador centróide encolhida. Um valor limiar é utilizado para definir a extensão da retracção para um modelo, isto é, um valor limite inferior irá gerar um modelo maior e um limite superior modelo menor. PAMR foi aplicado para cada conjunto de dados miRNA normalizou-log e de expressão de mRNA separadamente. Primeiro, determinamos uma faixa de limites separadamente para os dados de miRNA e de mRNA de cada conjunto usando ‘pamr.plotcv “para alguns casos de conjuntos de treinamento de dados. Em seguida, usamos essa gama de limiares para iterar sobre todos os conjuntos de treinamento randomizados correspondentes a um miRNA ou mRNA de um conjunto de dados, computados os modelos e classificados os conjuntos de ensaio correspondentes. ‘Pamr.adaptthresh’ foi usado para redimensionar o modelo antes de classificar o conjunto de teste correspondente. Exceto para os parâmetros padrão de limite foram utilizados para todas as funções do PAMR.

especificidades médios e sensibilidades foram calculados da mesma forma como mencionado acima.

Os coeficientes de correlação

Para cada dos três grupos experimentais, ou seja, amostras de câncer de bexiga invasivo, amostras de cancro da bexiga não invasivos e amostras de tecidos normais, os coeficientes de correlação de Spearman, ρ, foram calculados entre a expressão miRNA e mRNA. Os valores de expressão de log-normalizado foram usados ​​como dados de entrada. Os pares de miARN-mRNAs foram definidos pelo mesmo conjunto de interacções, como mencionado acima. Os valores de expressão foram tratados separadamente para cada um dos três grupos experimentais. Os coeficientes de correlação de Spearman foram calculados para cada par de interações miRNA-RNAm para cada grupo.

O tratamento dos dados de câncer de bexiga Set Online

Nós aplicamos nossa abordagem de dois coletivos diferentes, um coletivo de todas as amostras (8 non-invasive- e 8 amostras de tumores invasivos, bem como 8 pessoas de controle) e um coletivo de amostras de tumores com diferentes estágios de tumor (8 não-invasivo e 8 amostras invasoras) sem pessoas saudáveis. Para ambos os colectivos, apenas miARNs e valores de expressão de mRNAs foram processados ​​mostrando em, pelo menos, 20% das amostras usadas uma “chamada actual”, indicado pelo software de microarray normalização GeneSpring GX. Em seguida, aplicamos a nossa abordagem para identificar as interações diferencialmente regulados. Numa outra etapa, foram selecionados apenas interações que mostram uma correlação negativa, ou seja, ρ≤-0,4, entre valores de expressão normalizados miRNA e mRNA para pelo menos um grupo experimental. Para a colectividade de amostras de tecido de câncer esses grupos são as amostras de câncer de bexiga invasivo e amostras de câncer de bexiga não invasivos. Para o coletivo de todas as amostras dos grupos compõem os dois grupos de amostras de cancro da bexiga e do grupo de amostras de tecidos normais, ou seja, três grupos diferentes.

Clustering

Com base na interacção afirma um componente principal e agrupamento A análise foi realizada. Para este efeito, os estados de interacção foram substituídos em valores reais, como mencionado na Tabela 1. Uma matriz de distâncias foi calculado usando a distância bloco cidade como uma métrica. Depois, agrupamento hierárquico foi realizada utilizando o método de Ward como uma medida de distância [66]. Componentes principais da matriz de distâncias foram calculadas onde a matriz de distância foi tratado como um conjunto de

NN

vectores de dimensão [67].

anotação funcional agrupamento

genes que estão envolvidos nas interações diferencialmente reguladas entre miRNA e mRNA foram analisados ​​utilizando o banco de dados para anotação, visualização e integrados de descoberta (DAVID) [15] com os parâmetros de classificação rigor padrão.

a análise do conjunto de dados câncer de bexiga usando Magia2 e TALASSO

para análise comparativa, foram aplicadas quatro abordagens adicionais para analisar os dois coletivos de amostras de cancro da bexiga, o coletivo de amostras saudáveis ​​e tumorais eo coletivo de amostras de tecido tumoral invasivos e não invasivos. O servidor web TALASSO foi utilizada para identificar interacções de miARN-ARNm com o método TALASSO e algoritmo GenMiR ++ [55]. A união entre Tarbase, miRecoreds 2010 e a interseção de miRandaXL, PicTar 4-way e TargetScan (miRGen) foi selecionado como conjunto de interações miRNA-RNAm putativos.

Além disso, correlações de Spearman e uma abordagem de análise Meta usando o servidor web Magia2 foram usadas para analisar os conjuntos de dados [46]. Para análise com Magia2, a intersecção entre as predições de TargetScan e microRNA.org (Miranda) foi definido como conjunto de interações putativos. Com relação à análise utilizando a correlação de Spearman, apenas interações são considerou que apresentam uma correlação negativa, ou seja, ρ. 0

Para todas as abordagens e os dois coletivos, apenas miRNAs e valores de expressão mRNAs foram processados ​​mostrando em pelo menos 20% das amostras utilizadas um “presente de chamada”, indicado pelo software microarray normalização GeneSpring GX. valores de expressão Log-normalizados foram usados ​​para análise, como mencionado acima.

Deixe uma resposta