PLOS ONE: Cervical Cancer Precursores e contraceptivo hormonal uso em mulheres HIV-positivas: aplicação de um modelo causal e semi-paramétrico métodos de estimação

Abstract

Objectivo

Para demonstrar a aplicação de métodos de inferência causais com dados observacionais nos obstetrícia e ginecologia campo, nomeadamente a modelização causal e estimação semi-paramétrico.

Background

vírus da imunodeficiência humana (HIV) mulheres -positivas estão em risco aumentado para câncer cervical e seus precursores tratáveis. Determinar se potenciais fatores de risco como a contracepção hormonal são verdadeiras causas é fundamental para informar estratégias de saúde pública, como a longevidade aumenta entre as mulheres HIV-positivas nos países em desenvolvimento.

Métodos

Foi desenvolvido um modelo causal de os fatores relacionados ao contraceptivo oral combinado (COC) usar e cervical neoplasia intra-epitelial 2 ou superior (CIN2 +) e modificado o modelo para ajustar os dados observados, retirados de mulheres em um programa de rastreio do cancro do colo do útero em clínicas de HIV no Quênia. Pressupostos necessários para a comprovação de uma relação causal foram avaliados. Nós estimamos a associação em nível de população que utiliza métodos semi-paramétrico:. G-computação, da probabilidade inversa de ponderação tratamento, e orientada estimativa da probabilidade máxima

Resultados

Foram identificados 2 caminhos causais plausíveis do COC usar para CIN2 +: via infecção pelo HPV e através de uma maior progressão da doença. Os dados do estudo permitiu estimar o último apenas com fortes hipóteses de nenhuma confusão desmedida. De 2.519 mulheres com menos de 50 rastreados por protocolo, 219 (8,7%) foram diagnosticados com CIN2 +. modelagem Marginal sugeriu um (de confiança de 95% de intervalo de 0,1%, 6,9%) 2,9% de aumento na prevalência de CIN2 + se todas as mulheres com menos de 50 foram expostos a COC; o significado dessa associação foi sensível ao método de estimativa e exposição má classificação.

Conclusão

O uso de modelagem causal habilitado representação clara da relação causal de juro e os pressupostos necessários para estimar essa relação de os dados observados. métodos de estimação semi-paramétricas fornecidas flexibilidade e redução da dependência em forma de modelo correto. Embora os resultados selecionados sugerem um aumento da prevalência de CIN2 + associada ao COC, a evidência é insuficiente para concluir a causalidade. As áreas prioritárias para futuros estudos para melhor satisfazer critérios de causalidade são identificados

Citation:. Leslie HH, Karasek DA, Harris LF, Chang E, Abdulrahim N, Maloba M, et al. (2014) Cervical Cancer Precursores e contraceptivo hormonal uso em mulheres HIV-positivas: aplicação de um modelo causal e paramétricos Semi-métodos de estimação. PLoS ONE 9 (6): e101090. doi: 10.1371 /journal.pone.0101090

editor: Marcia Edilaine Lopes, Universidade Estadual de Maringá /Universidade Estadual de Maringá, Brasil

Recebido: 02 de março de 2014; Aceito: 03 de junho de 2014; Publicação: 30 de junho de 2014

Direitos de autor: © 2014 Leslie et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. O apoio financeiro para o estudo original foi fornecido pelo NIH /NCRR /OD UCSF-CTSI conceder nenhuma. KL2 RR024130. Sem apoio financeiro foi fornecido os autores para esta análise secundária. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer cervical é o terceiro câncer mais comum entre as mulheres em todo o mundo; 85% da carga global é nos países em desenvolvimento [1]. Uma questão importante, sem resposta no domínio da prevenção do cancro do colo do útero é se o uso de contraceptivos orais combinados (COC) – pílulas que contêm estrogênio e progesterona – aumenta o risco de câncer cervical [2], [3]. Embora o risco de muitos outros tipos de câncer é menor em usuárias de AOC do que os não-usuários, as taxas de câncer do colo do útero são geralmente mais elevadas entre os usuários COC em estudos observacionais [4]. revisões sistemáticas de estudos epidemiológicos observacionais têm encontrado uma associação entre o risco de câncer do colo do útero e da utilização de COC, em particular para o aumento da duração da utilização de COC e para o uso atual e recente, em vez de uso no passado distante [2], [5]. A Agência Internacional para Pesquisa sobre o Câncer tem chamado COC uma substância cancerígena em parte por causa da relação entre COC e câncer cervical [6].

As hipóteses de uma base biológica para esta associação incluem uma relação entre os AOC e aumento da vulnerabilidade a infecção por vírus do papiloma humano (HPV), com ou sem subsequente promoção da proliferação celular anormal. Os estudos existentes não mostram uma diferença na prevalência do HPV entre os utilizadores de COC e não-usuários [7]. No entanto, os modelos animais e em estudos in vitro sugerem que o estrogénio e progestina poderia afectar a expressão do gene do HPV para estimular a proliferação de células no colo do útero humano [6]. A evidência é sugestivo, mas não significa concludentes de uma relação causal: a associação observada pode ser resultado de uma confusão devido a fatores comportamentais, especialmente a utilização reduzida de proteção de barreira entre as mulheres que escolhem COC. Os fatores de risco para o cancro do colo do útero incluem a pobreza, história familiar, idade precoce na primeira gravidez, e ter 3 ou mais gestações a termo [8]; a complexa interação de fatores biológicos e fatores comportamentais interligados, tais como o uso de anticoncepcionais e gravidez resultados torna o isolamento de um nexo de causalidade do uso COC ao câncer do colo do útero especialmente desafiador.

Identificar um risco aumentado devido a COC é particularmente importante em mulheres HIV-positivas, que experimentam maior incidência de câncer cervical e seus precursores [9] – [11], em parte devido à imunossupressão reduzindo apuramento de HPV [12]. HIV está associada com uma idade mais jovem do aparecimento do câncer e aumento da progressão da doença, incluindo câncer invasivo; essa associação é cada vez mais evidente nos países em desenvolvimento como a terapia anti-retroviral altamente activa (HAART) prolonga a sobrevivência entre os indivíduos HIV positivos [13]. O equilíbrio entre os riscos conhecidos de gravidez indesejada e potenciais riscos acrescidos de uso de contraceptivos podem ser diferentes em ambientes de alta prevalência de HIV. A existência de uma relação causal entre a contracepção hormonal, especialmente a contracepção injetável, e aquisição do HIV e progressão é um debate em curso de grande importância para a saúde pública [14]. Examinando o resultado do cancro do colo do útero pode praticamente contribuir para o debate científico sobre o uso de contraceptivos orais combinados em áreas com alta prevalência de HIV.

Neste caso, como em muitos outros, mesmo os melhores dados existentes para distinguir causa da associação são observacional. Desenvolvimentos no campo da inferência causal [15]. particularmente no quadro contrafactual, o uso de grafos acíclicos dirigidos (DAGs) para estruturas de modelagem causais, e estimativa semi-paramétrico aproxima reforçar a nossa capacidade de distinguir a complexa relação entre o comportamento sexual, uso de método concorrente, e outras características demográficas. Neste artigo, demonstramos o uso do quadro contrafactual e DAGs para enquadrar questões causais, e aplicar 3 ferramentas de estimativa semi-paramétrico: g de computação, de probabilidade inversa da ponderação tratamento (IPTW), e orientada estimativa de probabilidade máxima (TMLE). A linguagem formal da counterfactuals permite a definição do experimento ideal: a observação do resultado nos mesmos indivíduos em um e um estado não exposta exposta, com tudo o mais mantido constante. Enquadrando a questão dessa forma concentra a atenção sobre: ​​a) a exposição principal, como o momento ea duração de COC de interesse, b) a exposição níveis precisos pode levar entre grupos comparados, incluindo se as mulheres que nunca usaram COC são uma comparação adequada, e c) o tipo e medição dos resultados, neste caso cervical graus intraepitelial neoplasia 2 e superior (CIN2 +) [16]. Colocando a questão de interesse na língua do counterfactuals estabelece o quadro para a identificação do parâmetro alvo de interesse particular, se isso pode ser incidência ou prevalência, risco ou taxa. Um interesse motivador na etiologia da doença, como neste caso sobre as causas do CIN2 +, sugerem um parâmetro na escala de aditivo, como a diferença de risco ou prevalência diferença [17]. DAGs representar visualmente relações causais e permitir a identificação de fatores de confusão com base nas regras estabelecidas; Em particular, o uso de DAG podem reduzir o número de variáveis ​​necessários para o controlo da confusão de um conjunto minimamente suficiente. Figura S1 fornece uma visão geral da leitura e DAGs manipulação; para uma introdução completa, veja as referências [18] – [20]. Ao tornar explícitas as relações hipotéticas de co-variáveis ​​medidas e não medidas para exposição e desfecho, DAGs apoiar a avaliação da possibilidade de identificar: se o parâmetro alvo de interesse pode ser validamente estimado tendo em conta as variáveis ​​de confusão medidos. Para entender a relação da utilização de COC e CIN2 +, nós avaliar se fatores de confusão suficientes são medidos para interpretar a associação estima como um efeito causal.

A definição de uma questão causal clara e identificação de um conjunto de fatores de confusão suficientes para isolar o efeito de interesse (ou o melhor conjunto possível de fatores de confusão observadas e as premissas resultantes sobre confusão desmedida), estabeleceu o quadro para a estimativa, seja com regressão padrão ou mais novas abordagens. Uma variedade de métodos de estimação foram desenvolvidos que permitem o cálculo dos efeitos médios de nível população com controle para inferência de confusão e robusto [21] – [23]. Muitas dessas ferramentas incorporam selecção do modelo através de algoritmos automatizados que dependem de validação cruzada para evitar modelo overfitting [24]. Modelos desenvolvidos por esses procedimentos de reduzir o risco de viés devido ao modelo de formulário incorreta. Para esta questão, a associação da utilização de COC e CIN2 + entre as mulheres HIV positivas, análise adequada implica modelar corretamente uma série de co-variáveis ​​biológicas e comportamentais. Factores tais como a contagem de células CD4 + e idade, entre outros, são susceptíveis de se relacionar com o resultado de uma forma não-linear; incluí-los em um modelo usando o formulário pode viés incorreto os resultados ao usar selecção do modelo sucessiva prejudica inferência válida. selecção do modelo automatizado juntamente com a inferência teoricamente fundamentada fornece uma alternativa rigorosa para acomodar tal complexidade analítica [25].

Apesar da força conceitual e flexibilidade analítica dessas ferramentas, as idéias e métodos da literatura inferência causal estão apenas começando para aparecer na prática epidemiológica clínica de rotina (por exemplo, referência [26]). Nós ilustrar o uso do quadro contrafactual, DAGs e métodos de estimação semi-paramétricos em abordar a questão: qual é o efeito do uso de contraceptivos hormonais no desenvolvimento de CIN2 + entre as mulheres com HIV? Aplicando essas ferramentas para um conjunto de dados de observação demonstra a sua utilidade no fornecimento da estimativa menos tendenciosa possível a partir dos dados disponíveis e, na sua estimativa não plausivelmente representam um efeito causal devido ao restante viés, iluminando lacunas específicas para abordar em estudos futuros.

Métodos inicial> declaração

o Instituto de Pesquisa médica do Quênia e da Universidade da Califórnia, San Francisco conselhos de revisão institucional fornecidos aprovação ética para análise deste conjunto de dados do programa. Os participantes não forneceu consentimento por escrito para inclusão nesta análise específica; todos os registros de pacientes foram anônimas e de-identificados.

modelo causal

A aplicação do quadro contrafactual, definimos a quantidade de interesse para ser a diferença na prevalência de CIN2 + devido a qualquer exposição a COC comparação para nenhuma exposição. perguntas alternativos de interesse poderia incorporar duração e tempo decorrido após a exposição, que foram mostrados para modificar a magnitude de risco [27]. Na ausência de consenso científico sobre o período latente de CIN2 + em mulheres HIV positivas, a etapa (s) na via oncogênicos que são afetados pelo uso COC, ea dose mínima e tempo máximo desde uso de COC que poderia resultar em CIN2 +, nós somos eleitos para usar uma definição ampla de exposição. Desenvolvemos um DAG por 1) identificação de co-variáveis ​​relacionadas com COC (exposição) ou CIN2 + (resultado), 2) colocando essas variáveis ​​em uma ordem temporal plausível, e 3) denotando permanece incerta e com um nó (ou seja variável) rotulados ‘U’ para desconhecido. Por exemplo, níveis de escolaridade pode influenciar a utilização de COC; educação serve como um proxy para a pobreza, o que potencialmente aumenta o risco de CIN2 +. Educação antecede status de parceria sexual nesta população adulta. A incerteza permanece na relação do COC para CIN2 + após a contabilização de educação e as demais variáveis ​​nomeadas.

Atualizamos o modelo causal completa para refletir as variáveis ​​medidas nos dados observados. Nós posteriormente avaliou se a relação causal de interesse pode ser isolado do efeito das variáveis ​​de terceiros que utilizam as co-variáveis ​​medidos apenas por aplicação do critério backdoor para identificar o potencial de confusão (ver figura S1). O critério backdoor é equivalente a afirmar que os investigadores identificaram e mediram todas as causas comuns da exposição e desfecho, bem como de qualquer 1) fatores de confusão e de exposição ou 2) fatores de confusão e resultados [20]. Se o critério backdoor detém, controlando-se o conjunto de variáveis ​​que preenchem que permite estimar um efeito causal: confusão pode ser controlada de tal modo que o efeito causal é identificável, um termo que significa que é possível estimar directamente a partir dos dados observados

dados

Os dados foram retirados de um programa de rastreio do cancro do colo do útero dentro de um programa de cuidados e tratamento do VIH em Kisumu, no Quênia. procedimentos de programação completa e os resultados foram descritos em outro [28]. As mulheres foram pesquisadas utilizando inspecção visual com ácido acético (VIA), por si só ou em combinação com a inspecção visual com iodo de Lugol (LPIV). rastreamento positivo (positivo VIA ou VIA positivo e VILI positivo) levou a colposcopia e posterior biópsia para determinar o tratamento. Porque somente aqueles triagem positiva poderia ser definitivamente diagnosticada e a adequação da VIA diminui com o avançar da idade [29], apenas as mulheres com menos de 50 foram elegíveis para inclusão nesta análise. Todos os outros dados do estudo, incluindo co-variáveis ​​clínicas e demográficas, foram retirados de registros médicos eletrônicos nas clínicas de HIV e estendeu a duração da inscrição do indivíduo no cuidado; frequência média visita é a cada 3 meses. COC sempre uso foi definido como relatar uso de contraceptivos orais em qualquer visita à clínica antes do rastreio do cancro do colo do útero. co-variáveis ​​adicionais extraídos de dados do paciente incluíram idade, nível de escolaridade, estado civil, gravidity, CD4 + nadir da contagem de células, e o início da terapia anti-retroviral altamente activa (HAART). co-variáveis ​​em falta foram imputados usando imputação múltipla encadeada [30] para criar 10 conjuntos de dados; estimativas foram combinados cruzando conjuntos de dados usando a regra de Rubin. A validade da imputação múltipla se baseia na suposição de falta completa de forma aleatória (MAR), ou seja, que a probabilidade de uma variável a ser observada é aleatória condicionada à co-variáveis ​​incluídas na imputação [30]. MAR é plausível neste contexto:. Principais causas de dados em falta dizem respeito à evolução das práticas de garantia de qualidade de dados em cada local e ao longo do tempo, ambos os quais foram contabilizados na imputação

Estimativa

implementamos 3 métodos para estimar o excesso de prevalência de CIN2 + associada à exposição a COC. de substituição simples (g computação) pode ser baseada na regressão paramétrico; estima o resultado contrafactual para cada observação condicionada à co-variáveis ​​para permitir que o cálculo da diferença de nível populacional da prevalência menor de 2 níveis de exposição [31]. Nós caber uma regressão logística de CIN2 + no COC, controlando para as co-variáveis ​​identificadas no modelo causal final; relatamos resultados da regressão para comparação com a análise tradicional. exposição COC foi posteriormente definido como 1 para o total da amostra e os resultados individuais previsto; repetindo isso com COC definido para 0 desde que a diferença de prevalência de nível população. IPTW aborda confusão modelando a probabilidade do estado de exposição observada para cada observações individuais e de ponderação pelo inverso dessa probabilidade, num esforço para simular a população que teria sido observada se a exposição foram randomizados [21], [32]. Por exemplo, uma mulher cuja idade, estado sócio, e a história da gravidez tornam improvável que ela iria tomar COC (com base nos dados), mas que na verdade foi exposta seria até ponderada substancialmente. Nós encaixar um modelo adaptativo de dados de exposição COC dada co-variáveis, previu a probabilidade de cada indivíduo da exposição a partir do modelo, e estabilizou o peso estimado pela probabilidade global de serem expostos e não expostos. A diferença na prevalência entre as populações ponderados forneceu a estimativa do parâmetro alvo. TMLE é um método mais complexo que regride o resultado sobre a exposição e co-variáveis ​​e atualiza esta estimativa inicial usando a probabilidade de co-variáveis ​​de exposição dado para reduzir o viés para o parâmetro de destino [25], [33]. Nós encaixar modelos de dados de adaptação, tanto para resultado e exposição dentro TMLE. Todas as análises foram realizadas em R 3.0 usando o TMLE e SuperLearner [24], [34] pacotes, bem como código disponíveis com os autores, a pedido.

Implementamos cada abordagem para o conjunto completo de dados e análises de sensibilidade restrita a indivíduos com pelo menos 6 meses de dados observados e relataram uso de COC a mais de 20% das visitas aos pacientes. estimativas de variância foram obtidos por meio de amostragem de inicialização (200 iterações para cada conjunto de dados imputada) para g computação e IPTW e da variância da curva de influência para o TMLE. Finalmente, avaliamos possíveis violações da suposição de positividade (isto é, que existe uma probabilidade não nula de cada nível de exposição para todas as combinações de variáveis ​​independentes), inspecionando a distribuição da exposição dentro das categorias de variáveis ​​independentes e a simetria das estimativas de bootstrap.

resultados de

causal modelo

a Figura 1 mostra o modelo causal completa hipótese, mostrando 2 pontos de tempo (0, 1), embora as relações mostradas iria iterar ao longo do tempo. O valor inclui a tradução da apresentação DAG visual em um modelo causal estrutural [35] (SCM), utilizando equações; SCMs pode ser particularmente valiosa na apresentação de modelos complexos como este. O nó U representa causas desconhecidas de todos os outros nós da DAG; isso pode incluir acaso, bem como fatores causais. Cada conexão (path) no gráfico representa um nexo de causalidade potencial; qualquer caminho excluído é uma forte hipótese de não haver relação causal. Representando os nós em vários pontos de tempo permite descrição clara das variáveis ​​que afetam várias vezes entre si, tais como a utilização de COC e gravidade. Separando pontos de tempo, desta forma garante que todos os caminhos no modelo são unidirecionais, eliminando assim potenciais problemas de causalidade reversa. Nós apresentamos 2 caminhos causais entre COC e CIN2 +. Um deles, via HPV, representa o aumento da vulnerabilidade à infecção pelo HPV. O segundo, em ordem cronológica, após infecção por HPV e transformação oncogénica, representa crescimento aumentado das células anormais na presença de COC. Dada a complexidade do modelo, caminhos excluídos pode ser mais claramente lidos a partir das equações de SCM do que o DAG. Resumidamente, a base para cada restrição exclusão é como se segue. Excluímos HPV como causa de status e HAART posterior utilização imunológico devido à falta de evidência biológica de que o HPV afeta CD4 + soro contagem de células e, portanto, as decisões de tratamento do HIV. Excluímos ainda HPV como causa de parceria posterior sexual, uso de COC, uso de preservativo e gravidity, como a infecção pelo HPV não diagnosticada não seria susceptível de afectar o comportamento, e infecção pelo HPV antes do desenvolvimento de NIC não foi mostrado para afetar a fertilidade [36] . Nós afirmamos que a utilização de COC e uso de preservativo não causam o uso da HAART como neste prescrição definição de HAART é baseada na contagem de células CD4 + e presença de infecções oportunistas, nenhuma das quais é susceptível de ser afectada pelo COC ou o uso do preservativo. Finalmente, remover caminhos de educação, parcerias sexuais, uso de COC no tempo 0, o uso do preservativo, HIV, e HAART para CIN2 +. Muitas destas variáveis ​​são causas indiretas de CIN2 + através de variáveis ​​intermediárias, tais como HPV ou estado imunológico; sugerimos que não há conexão direta fora das variáveis ​​mediadoras. Por exemplo, o uso do preservativo pode causar CIN2 + somente via HPV neste modelo. Afora estas exclusões, todas as outras ligações ordenadas no tempo são consideradas plausíveis e estão incluídos no modelo causal completo.

modelo causal proposto em gráficos e fórmulas formas equivalentes de a relação entre o uso de contracepção e pré-câncer do colo do útero mais 2 pontos de tempo. DAG: dirigido gráfico acíclico; SCM: modelo causal estrutural; SP: parceria sexual; COC: combinada contracepção oral; HAART: terapia anti-retroviral altamente ativa; CIN2 +: intra-epitelial cervical graus neoplasia II e acima; HIV: vírus da imunodeficiência humana; HPV: vírus do papiloma humano; U:. Desconhecido

Colocar para fora a estrutura causal esclarece um ponto de decisão fundamental: pode ambos os caminhos de COC de CIN2 + ser estimado? Limitações dos dados nos impediu de avaliar a exposição e co-variáveis ​​antes do início da doença; portanto, nós nos concentramos no caminho do uso COC durante HIV cuidado de progressão da doença e simplificado do modelo para descrever o processo causal que leva a prevalência de CIN2 + em um único ponto no tempo.

Além disso, o modelo conceitual tem implicações para a seleção covariável na estimativa. experiência de gravidez da vida é um fator de confusão dependente do tempo; falta de dados longitudinais, optou-se controlar para gravidity no momento da inscrição no atendimento HIV (gravidity no tempo = 1) como um proxy de gravidity passado. Em contraste, nós não controlar para uso recente do preservativo, pois não é em si um fator de confusão e é provável que tenha substancialmente mais variabilidade como um proxy para o uso do preservativo passado do que gravidity linha de base faz para a experiência de gravidez antes. tratamento do HIV é um fator de confusão; no entanto, não tem que ser parte de um conjunto suficiente de fatores de confusão se o estado imunológico é controlado como um fator de confusão. Estas decisões nos permitiu simplificar consideravelmente o modelo, condensando todos os fatores de confusão restantes (idade, nível de instrução, estado civil, gravidity e imunossupressão) em um único nó W e recolher toda a variabilidade não medido no nó U (Figura 2).

modelo causal refletindo estrutura de dados observados e os pressupostos necessários. COC: combinada contracepção oral; CIN2 +:. Neoplasia intra-epitelial cervical graus II e acima

Identificabilidade

As premissas de identificabilidade para que o resultado seja uma estimativa consistente da relação causal verdadeira implica que todas as causas comuns de COC e CIN2 + deve ser medido; este é claramente violada dada co-variáveis ​​não mensuráveis, tais como a utilização de COC passado. Dos outros 2 suposições, causas comuns não medidas de utilização do COC e fatores de confusão são susceptíveis de existir, tais como a intenção da gravidez para COC e gravidade. É mais plausível supor que as causas comuns dos fatores de confusão e CIN2 + são todos medidos, embora os dados sobre duração do HIV, por exemplo, iria fortalecer essa suposição. No entanto, só esta suposição é insuficiente para inferir causalidade. Em suma, os pressupostos de identificabilidade não são cumpridas nestes dados observados, o que significa que a estimativa a partir destes dados será confundido em relação ao efeito causal.

Estimativa

Das 2519 mulheres rastreadas e elegíveis para a inclusão, 219 foram diagnosticados com CIN2 +; 89 destes casos estavam entre 890 COC nunca utilizadores (prevalência 10,00%) vs. 130 casos entre 1629 não usuários (prevalência de 7,98%). A análise de regressão indica as chances de CIN2 + são 1,35 vezes maior entre os de sempre usuárias de COC (IC 95% 0,99, 1,85) do que os não-usuários após o controle de co-variáveis. Os resultados g de computação sugerem uma diferença de prevalência ajustada de 2,5% (IC 95% -0.2, 5.1) associado com cada vez usando COC; estimativas de IPTW e TMLE são ligeiramente superiores em 2,9%, e os intervalos de confiança em torno destas estimativas excluem 0 (Tabela 1). A consistência das estimativas sugere mínimas modelo mis-especificação do uso de um modelo paramétrico na estimativa g computação

Tabela 1 e Figura 3 também mostra os resultados de análise de sensibilidade, que são menos consistentes.; cada estimativa é menor do que a análise principal e nenhum é estatisticamente significativa. Embora não haja nenhuma razão para acreditar que a exposição é uma impossibilidade teórica em qualquer combinação de valores de variáveis ​​independentes, análise dos dados mostram violações positividade práticas, como a de que não existem mulheres com maior do que um ensino secundário que não são casados, nulíparas, e usar COC . No entanto, a variância com base-quantil significativo e das amostras de bootstrap na Tabela 1 mostram que estas amostras são razoavelmente simétrica e centrada em torno da estimativa inicial, indicando que o impacto de violações de positividade próximos é susceptível de ser mínima. Para desenhar inferências válidas apesar dos dados em falta, seria necessário para restringir a população-alvo para os representados na amostra ou assumir a associação observada pode ser extrapolado para os grupos não observadas [38].

diferença percentual prevista na prevalência de CIN2 + se todas as mulheres foram expostas a COC usando 3 métodos de estimação semi-paramétricos. G comp: G computação; IPTW: probabilidade inversa de ponderação tratamento; TMLE: alvo estimativa da probabilidade máxima; COC: combinada contracepção oral; CIN2 +:. Intra-epitelial cervical neoplasia graus II e acima

Discussão

A aplicação de DAGs e estimativa semi-paramétrico com a questão de saber se a utilização de COC aumenta o risco de cancro cervical entre as mulheres com HIV demonstra os benefícios conceituais e analíticas de uma abordagem causal inferência com dados observacionais. utilização mais ampla de tais ferramentas podem reforçar a qualidade das provas consideradas para pressionar questões de saúde pública, esclarecendo a questão dos juros, identificando as variáveis ​​críticas necessárias para estimar a quantidade de causalidade, e garantir que a estimativa retorna a quantidade de interesse, sem confiança indevida em suposições modelo paramétrico . Neste exemplo, mais de 35% das mulheres em HIV cuidados relataram uso de COC, um elemento crítico de controle da mulher sobre sua reprodução, que pode ser uma substância cancerígena. prova válida de dano é necessário para implementar políticas de saúde pública de som para esta população vulnerável. O modelo causal proposto para esta questão de pesquisa, codificou as crenças e hipóteses de enquadramento da análise de forma legível que pode ser desafiado e modificado por outros investigadores. Além disso, as decisões tomadas em desenvolver esse modelo ter implicações directas para a análise: nós não controlar para co-variáveis ​​como status HAART eo uso do preservativo, apesar do fato de que na primeira inspeção que poderiam ser considerados como fatores de confusão. DAGs fornecem orientações mais específicas para a inclusão das variáveis ​​de confusão que as definições conceituais de fatores de confusão sozinho e tornar visível o processo de pensamento por trás inclusão e exclusão de co-variáveis ​​[18], [39]. Em outros exemplos, o modelo causal completa pode revelar vários conjuntos suficientes de fatores de confusão, permitindo que os investigadores a selecionar com base em considerações pragmáticas de coleta e análise de dados.

DAGs elucidar os pressupostos necessários para um efeito causal para ser estimável em observação dados. Tal orientação é particularmente relevante para questões como esta que se relacionam com inter-relações complexas e dependentes do tempo entre o comportamento e biologia. Neste caso, embora dois dos métodos de estimação utilizados sugerem um aumento estatisticamente significativo da prevalência de CIN2 + associada com cada vez usando COC entre as mulheres HIV-positivas com menos de 50 no Quênia, as hipóteses de identificação necessários para interpretar este resultado como indicativo de uma relação causal são insustentável. Eles incluem: nenhum nexo de causalidade inversa entre a exposição eo co-variáveis ​​selecionadas para o controle; não restantes causas comuns de utilização do COC recente e CIN2 + seguinte controle para idade, escolaridade, estado civil, gravidity e CD4 + nadir da contagem de células; e há causas restantes de qualquer COC ea confusão ou CIN2 + e os fatores de confusão. co-variáveis ​​não medidas específicas, tais como o comportamento sexual passado rendem principais pressupostos implausível. É possível postular a direção do viés devido à confusão individuais: por exemplo, múltiplas parcerias sexuais confundiria positivamente a relação entre COC e CIN2 +, devido à sua associação positiva com cada um. No entanto, o número de co-variáveis ​​não mensuráveis ​​ou desconhecidas faz estimar seu impacto conjunto difícil e além do escopo desta análise (ver referência [37] para a discussão da análise multivariada bias).

Consideração de identificabilidade também orienta priorização de futuro coleta de dados: pode ser mais fácil para satisfazer a suposição de que todas as causas comuns do resultado e co-variáveis ​​são medidos, tornando desnecessário também medir todas as causas comuns de exposição e co-variáveis. A granularidade de verificação suposição causal fornece orientação para futuros estudos. Nesta aplicação, a coleta de dados longitudinais ou retrospectivos sobre a utilização de COC é fundamental para isolar caminhos causais de interesse. dados mais refinados sobre o uso de COC também abordar os preconceitos devido à má classificação da exposição nesta análise, o que parece provável com base na mudança de resultados observados na análise de sensibilidade utilizando uma classificação mais rigorosa da exposição. Além disso, a recolha de dados sobre co-variáveis ​​como duração do HIV pode ser mais útil do que quantificar construções desafiadoras, tais como intenções de gravidez ao longo do tempo em termos de satisfação dos pressupostos para inferir causalidade a partir de dados observados.

O 3 semi-paramétrico abordagens de estimativa apresentados são uma extensão natural da abordagem conceitual. Em comparação com uma regressão tradicional, que fornece uma razão de chances de prevalência condicionada à co-variáveis, as ferramentas aplicadas permitem a estimativa de uma quantidade de juro de referência de saúde pública: o quanto a prevalência de CIN2 + mudaria se a utilização de COC foram interrompidas ou se programas de planejamento familiar e uso de contraceptivos alcançou uma cobertura mais ampla entre as mulheres infectadas pelo HIV. Essas abordagens fornecem a única quantidade de juros definida no modelo causal. Em contraste, a regressão multivariada retorna coeficientes para a exposição de interesse e para fatores de confusão; o último pode ser interpretada como representando as relações causais [40]. Além disso, embora g computação, IPTW e TMLE pode ser ajustada utilizando modelos de regressão paramétricos, um benefício adicional é o potencial de combiná-los com os procedimentos de montagem modelo para reduzir viés.

Deixe uma resposta