PLOS ONE: Padrões de Informação-Procuro para o cancro na Internet: Uma Análise do Real World Data

Abstract

Embora tradicionalmente as fontes primárias de informação para pacientes com câncer têm sido os que tratam da equipe médica, pacientes e seus familiares cada vez mais para a Internet, embora esta fonte pode ser enganosa e confusa. Nós avaliar os padrões de busca da Internet para entender as necessidades de informação dos pacientes com câncer e seus conhecidos, bem como para discernir seus estados psicológicos subjacentes. Nós rastreados 232,681 utilizadores anónimos que iniciaram consultas específicas de câncer no motor de busca da Web Yahoo mais de três meses, e selecionados para usuários de estudo com altos níveis de interesse por este tema. Pesquisas foram divididos por sobrevivência esperada para a doença que está sendo pesquisada. Foram comparados os padrões de pesquisa de usuários anônimos e seus contatos. Os usuários que procuram informações sobre tumores malignos agressivos exibidos Períodos mais curtos, centrados na informação doença- e tratamento-relacionados. Usuários que buscam conhecimento sobre tumores mais indolentes procurou por períodos mais longos, alternado entre diferentes disciplinas, e demonstrou um grande interesse em temas como grupos de apoio. Conhecidos procurou por períodos mais longos do que o usuário proband quando procuram informações sobre agressivo (em comparação com indolentes) cancros. As necessidades de informação pode ser modelada como a transição entre cinco estados distintos, cada um com uma única assinatura que representa o tipo de informação de interesse para o utilizador. Assim, as fases iniciais de informações de procura para o câncer de seguir um padrão dinâmico específico. As áreas de interesse são dependentes doença e variam entre propósitos e os seus contactos. Esses padrões podem ser usados ​​por médicos e autores médica Web do site para adaptar as informações às necessidades dos pacientes e familiares

Citation:. Ofran Y, Paltiel O, Pelleg D, Rowe JM, Yom-Tov E (2012 ) Padrões de Informação-Procuro para o cancro na Internet: Uma Análise dos dados do mundo real. PLoS ONE 7 (9): e45921. doi: 10.1371 /journal.pone.0045921

editor: Petter Holme, Universidade de Umeå, na Suécia

Recebido: 08 de maio de 2012; Aceito: 27 de agosto de 2012; Publicado: 21 de Setembro 2012 |

Direitos de autor: © Ofran et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Todo o trabalho foi feito como parte da investigação dos respectivos autores, sem qualquer financiamento adicional ou externa

CONFLITO dE iNTERESSES:. DP e AET são funcionários da Yahoo Inc. Yahoo não e não vai ganhar financeiramente com este trabalho. Isto não altera a adesão dos autores para todas as políticas de PLoS One sobre os dados e materiais de compartilhamento. Os autores confirmam que não existem patentes, produtos em desenvolvimento ou produtos comercializados para declarar decorrente do presente trabalho.

Introdução

Trinta e cinco anos atrás, o Dr. Franz Ingelfinger, um gastroenterologista e ex-editor da

New England Journal of Medicine

, foi diagnosticado com adenocarcinoma de esôfago. Em uma palestra proferida na sequência da sua diagnóstico [1], Dr. Ingelfinger descreveu o sofrimento causado pela inundação de informações destinado a ele e sua família. Ele elogiou um de seus amigos para aconselhando-o a, “esquecer as informações que você tem de várias partes e procurar uma pessoa que simplesmente dizer-lhe o que fazer”. “Você precisa de um médico”, disse ele [1]. Voltar no final dos anos setenta, os médicos foram o principal (e para muitos pacientes a única) fonte de informação. Hoje, os pacientes não precisam ser editores de um jornal médico, a fim de enfrentar torrentes de informações jorrando a partir da Internet. Esta barragem de “fatos” desafia papel ea autoridade dos médicos. No caso de diagnóstico de câncer, pesquisa maioria dos pacientes a Internet para obter informações câncer, normalmente antes da sua primeira reunião com um especialista em oncologia [2]. Suas necessidades de informação parecem diferir por tipo [3] câncer. informação baseada Internet foi relatada por pacientes para ser um gatilho para suas decisões sobre a terapia, os ensaios clínicos e até mesmo escolher seus médicos. No entanto, estudos têm demonstrado que os pacientes tendem a não compartilhar informações informal com seus médicos [4] – [6]. Assim, uma boa compreensão de como os pacientes gerenciar aquisição de informação através da Internet é essencial para uma comunicação eficaz médico-paciente que será relevante para as necessidades dos pacientes.

A investigação procurar a maneira como os pacientes para obter informações sobre a Web é difícil. A maioria das pesquisas são realizadas em privacidade longe de instalações médicas ou profissionais de saúde. Portanto, duas maneiras principais podem ser usados ​​para estudá-lo: Primeiro, por meio de questionários retrospectivos ou através de conteúdos gerados durante a pesquisa para esta informação na web. questionários de auto-relato ou entrevistas [7], [8] tem alguns grandes inconvenientes. Em primeiro lugar, há um viés de seleção inerente em relação aos pacientes que consintam em participar da pesquisa, com uma tendência para incluir as pessoas com características sociodemográficas específicas, tais como os níveis de renda e de ensino superior [9]. Em segundo lugar, mesmo uma taxa de não-resposta baixa pode conclusões do estudo viés [10]. Em terceiro lugar, as pesquisas geralmente se concentram em pacientes, embora em muitos casos a recolha de informação através da Internet é conduzida por membros da família do paciente [11], [12]. Última, as informações recolhidas durante os primeiros dias da doença é considerada fundamental para a percepção da doença [13] de um paciente – [15]. No entanto, é muito difícil de realizar pesquisas cobrindo este período curto e estressante [16], e auto-relatos retrospectivos foram mostrados para ser imprecisa [17].

Os motores de busca e outros sites gravar dados produzidos através atividade intencional (por exemplo, escrevendo blogs ou enviar consultas) e indireta de atividade (por exemplo, navegar na web). Conhecido como User-Generated Content (UGC), estes têm sido usados ​​para monitorar a propagação da gripe [18], investigar a utilidade de carbonato de lítio na esclerose lateral amiotrófica [19], e monitorar as mudanças sazonais e geográficas da incidência de depressão [20] entre outras questões epidemiológicas [21] – [23]. Em nosso trabalho, nós examinamos anónimo UGC em grande escala, fornecido pelo motor de busca Yahoo para examinar em busca de informação padrões de câncer relacionado.

Métodos

A coleta de dados e categorização

todas as consultas enviadas por utilizadores do motor de busca da web Yahoo nos EUA entre maio e julho de 2010 foram analisados. Os dados utilizados para a realização deste estudo é a informação privilegiada recolhidas por Yahoo Inc., e coligidos por DP e AET, que são funcionários da Yahoo Inc. As informações em cada consulta incluiu o texto da consulta, a sua hora e data, uma lista de páginas visitadas por o utilizador como um resultado da consulta, e um identificador de utilizador anónimos.

as consultas foram filtrados para incluir apenas consultas específicos do cancro, definidos como aqueles que incluíram o nome de pelo menos um dos 35 específico mais comum cancros listados por SEER [24], e divididos por suas taxas de sobrevida em 5 anos em dois grupos diferentes: agressivo (sobrevida de 5 anos abaixo da mediana geral para pacientes com câncer) e indolente (sobrevida em 5 anos acima da média geral para pacientes com câncer ).

Ética declaração

Toda a investigação aqui descrito foi realizado de acordo com as diretrizes do Yahoo em pesquisa com seres humanos, após aprovação prévia pelo comitê Consultivo de pesquisa Assunto humano interna do Yahoo. Especificamente para esta tarefa, os dados foram primeiro anónimas e agregadas antes da análise, e nenhum dado de usuário-nível individual foi examinada. Estes dados podem estar disponíveis para os investigadores na sequência de uma assinatura dos acordos legais necessários para manter a privacidade do usuário.

Identificando os usuários com elevado interesse em cancros específicos

Entre os 232,681 usuários selecionados que pesquisaram câncer relacionado informações, a maioria dos pesquisadores viram apenas páginas escassos. Estes usuários foram mais provável usando o Yahoo motor de busca como um portal para chegar a um Web-página específica e foram excluídos do estudo. A distribuição do número de páginas visualizadas por cada usuário é altamente enviesada. Na verdade, ela está intimamente aproximada por uma distribuição de poder-lei, com declives de -2,19 (R

2 = 0,97), que descreve um padrão de distribuição pelo qual a maioria dos usuários ver apenas algumas páginas e uma visão minoritária muitas páginas. Portanto, um limite arbitrário de cinco páginas visitadas ao postar perguntas relacionadas ao câncer durante o período de estudo foi escolhido, para identificar usuários com o maior interesse em cânceres específicos. No caso em que os utilizadores procurou por mais do que um tipo de cancro, da doença dominante por pesquisador foi definido como o tipo de cancro específico que procurou com a frequência mais elevada. Usando os critérios acima mencionados, 182,564 usuários foram excluídos e um total de 50,117 usuários que postaram 225,675 consultas foram incluídos no estudo.

A identificação e categorização de páginas web populares

O número de usuários que visualizaram cada página tem uma distribuição de poder de lei similar, com declives de -2,25 (R

2 = 0,98). Para explorar o conteúdo das páginas mais populares, nós nos concentramos apenas em páginas visitadas por pelo menos cinco usuários e inspecionados manualmente uma amostra aleatória de 500 páginas. Foram identificados dez categorias, permitindo a classificação de páginas de acordo com seus temas. Para rotular todas as páginas visitadas por todos os usuários, foi utilizada multidão sourcing, especificamente o serviço Amazon Mechanical Turk (https://www.mturk.com/), que permite que cada página a ser mostrado para os avaliadores que são pagas para categorizar as páginas da Web [25]. Trabalho anterior mostrou que esta classificação é executada com uma precisão comparável à de peritos [26]. Cada página foi enviada para até 5 pessoas independentes para a rotulagem em uma das 10 categorias.

Todas as 5987 páginas frequentemente visitadas foram introduzidas para 776 etiquetadores Mechanical Turk, cada um dos quais marcados, em média, 34 páginas (± 181 páginas ). Destes, 3602 páginas tinha um rótulo distinto acordado por pelo menos 3 rotuladores. O número de páginas em cada categoria é mostrada na Tabela 1. Os restantes 2385 páginas não tinham etiquetas bem definidos, e foram divididos da seguinte forma: Em 46% das páginas, duas categorias receberam dois votos cada um, e em 48% um categoria recebeu dois votos e três receberam um voto cada um. Para explorar razões potenciais para a discordância entre etiquetadores, as páginas eram in-silico quantificado analisando as palavras que continham. Foi utilizado um modelo de espaço vetor [27] para representar as palavras em cada página, e mediu a distância até o baricentro (ou seja, o modelo de média vector) de cada categoria. A distância de todas as páginas não-classificados para as categorias indicadas pelos etiquetadores foi aproximadamente o mesmo (em média, dentro de 5%). No entanto, para páginas onde havia um acordo de maioria entre etiquetadores, essa diferença foi, em média, 20% (teste da soma de classificação, p 10

-10). Nossa conclusão é que as páginas com rotulagem não discreta são genuinamente ambíguos em termos de rotulagem, e são, portanto, excluídos da nossa análise.

reconhecimento de padrões de sua procura |

padrões de busca dos usuários foram definidos como a ordem na qual eles ver páginas de diferentes categorias, assim como o tempo necessário para fazer isso. A necessidade de informação é assumida para ser dinâmica, mudando como uma função de alterações físicas e mentais [28]. A mudança dos padrões do tipo de informação solicitada pode refletir transição entre estados mentais comuns aos indivíduos que compartilham estados clínicos e psicológicos. Esses estados não observáveis ​​estão ocultas, mas podem ser identificadas a partir dos padrões de busca usando Hidden Markov Models (HMMs) [29], que estimam os estados ocultos de um sistema, a probabilidade de transição entre eles, ea probabilidade de cada sinal observável dada a estado oculto. Para encontrar o número mais provável de estados ocultos usuários passou durante o tempo que os observava, primeiro treinados HMMs de um número variável de estados ocultos e 10 visíveis categorias páginas. O melhor número de estados ocultos foi encontrado usando validação, da seguinte forma: nós treinamos o HMM usando dados de navegação de 75% dos usuários, e testou a precisão do modelo, comparando as sequências previstas de pesquisas para os restantes 25% dos usuários com o seu comportamento real. Este procedimento foi repetido 5 vezes, com uma selecção aleatória do parâmetro modelo inicial, para reduzir a possibilidade de convergência para um mínimo local.

conhecidos

probando

Finalmente, a fim de estudar a relação entre pesquisas de conhecimentos sociais, foi utilizada a lista de contatos no aplicativo Yahoo Instant Messenger (YIM) como um proxy para a rede social dos usuários. O número de contatos por pessoa é lei de potência distribuída (α = -0,99, R

2 = 0,93), com uma mediana de 6.

A análise estatística

Foram comparados os padrões de pesquisa utilizando testes não-paramétricos, devido às distribuições não-gaussianas desses padrões. Os valores de P inferiores a 0,05 foram considerados estatisticamente significativos.

Resultados

Qual a probabilidade de nossos candidatos para ser pacientes com câncer real?

Foi utilizado um modelo de regressão linear para comparar a frequência de cada tipo de câncer específico no log de consulta com a sua incidência conhecida ajustada por idade, a sobrevida relativa de 5 anos ajustada à idade, ea idade média do diagnóstico. incidência ajustadas por idade foi altamente correlacionada com a prevalência log de consultas, explicando mais de 65% da variância. (p 10

-5), e foi o correlato única estatisticamente significativa de prevalência log consulta (Figura 1)

a incidência de cânceres está fortemente correlacionada com a frequência com que as consultas relacionadas a elas são publicadas na Internet.

Este trabalho teve como objetivo caracterizar as necessidades e padrões de pesquisa de pacientes e suas famílias, amigos e outras pessoas próximas que utilizam a web como uma importante fonte de informação. Os usuários que selecionaram páginas de apenas uma categoria são susceptíveis ou não os pacientes e seus cuidadores primários (por exemplo, estudantes) ou então os usuários que preferem outras fontes de informação que a Web e usar a Internet ocasionalmente ou apenas quando procurando informações específicas. Em nossa coorte de usuários foram identificados dois grupos de utilizadores: uma, composta de 20.808 (41,5%) indivíduos, que visitaram páginas de duas ou mais categorias (para as categorias de definições veja abaixo) exibindo interesse em múltiplos aspectos de uma doença câncer. Os restantes 29,369 (58,5%) usuários visitaram apenas as páginas de uma única categoria. Os usuários que apresentam uma estreita gama de interesses na informação sobre o cancro derivadas de Web não estão dentro do foco deste trabalho, e assim foram excluídos da nossa análise.

Usuários do primeiro grupo procurou informações por um período médio de 10,0 dias ± 14,5 (dias) durante o período de dados. Por isso, é evidente que um evento específico pode ter provocado a sua pesquisa. Nós especulamos que esses usuários são ou pacientes com câncer recém-diagnosticados ou aqueles muito perto deles, que servem como seus “agentes da Internet”. Nós fornecemos suporte adicional para este abaixo.

Informações de procura de padrões podem representar estados psicológicos subjacentes e estão relacionados doença

O número mais provável de estados ocultos é mostrado na Figura 2. A melhor previsão de padrões de pesquisa é atingido com cinco estados ocultos, que especula-se um produto de transições entre cinco estados mentais durante o período do estudo. O padrão das pesquisas foi relacionada com a agressividade do cancro. A Figura 3 mostra que o diagrama de estado para doenças agressivas é ligeiramente mais linha-like, com os dois primeiros estados, sendo o mais estável, ou seja, os usuários são mais propensos a permanecer nesses estados. Por outro lado, o diagrama de estado para as doenças mais indolentes são altamente interconectado, transições entre estados são mais simétrica, e os estados mais estáveis ​​são os três últimos. Comparando os HMMs aprendidas para indolente contra doenças agressivas, descobrimos que estados de saída são classificados de maneira diferente, e que, para este último, tratamento da informação é mais importante mais tarde no processo de busca. Curiosamente, o apoio só aparece como um estado de saída significativa de cânceres indolentes.

Este gráfico mostra o erro médio em predizer a categoria página que um subconjunto de 25% da população de usuários irão navegar, dado o seu comportamento e navegação passado o modelo de pesquisas de usuário construídas utilizando um subconjunto diferente (os restantes 75%) da população. O erro mais baixo é atingido por 5 estados ocultos, sugerindo que os usuários passam por cinco fases de pesquisa durante o processo de pesquisa.

As transições de estado para cancros com a sobrevivência abaixo da mediana são mais corda-like, com os dois primeiros estados, sendo os estados mais estáveis. Por outro lado, os diagramas de estado para as doenças mais indolentes são altamente interconectado, transições entre estados são mais simétrica, e os estados mais estáveis ​​são os três últimos estados. A tabela mostra todas as categorias de páginas (estados observáveis) com uma probabilidade superior a 0,05 para cada um dos estados de um HMM escondidos, ordenados por diminuição probabilidade. Embora os estados de saída são semelhantes para ambos os grupos de doenças, eles são classificados de forma diferente. Além disso, os pesquisadores para cancros com a sobrevivência abaixo da mediana de procurar informações sobre o tratamento mais tarde no processo de pesquisa. Curiosamente, o apoio só aparece como um estado de saída significativa de cânceres indolentes.

Usuários em busca de cânceres agressivos têm um padrão de pesquisa organizado com grande interesse na informação da doença e tratamento no início e um baixo interesse em apoiar e organizações sociais. Os usuários interessados ​​em cancros mais indolentes seguem uma trajetória menos direta, indo e voltando entre as diferentes categorias e expressando grande interesse em grupos de apoio.

Pesquisas por conhecidos

A lista de contatos de cada usuário de Yahoo Instant Messenger (YIM) estava disponível para identificar a lista de cada usuário de contatos e analisar a sua relação entre pesquisas relacionadas ao câncer. Durante o período do estudo, 279 utilizadores procurou informação sobre o cancro em pelo menos duas categorias, enquanto pelo menos um de seus contatos no YIM fez isso também. Nós não encontrou um nível suficientemente elevado de atividade de pesquisa relacionada ao câncer para os conhecidos dos demais usuários, e, assim, concentrar-se no comportamento de busca deste grupo relativamente pequeno de usuários. Notamos que o número de pares observados de usuários que pesquisam em simultâneo é de aproximadamente 6 vezes maior do que o esperado pelo acaso. Assim, essas pesquisas co-ocorrendo na rede são altamente significativos. O tipo de cancro consultado em pelo menos uma das pesquisas sobreposto entre os utilizadores probandos e conhecidos em 56% dos casos. Isto é comparado a 25% se os usuários são combinados de forma aleatória.

Conhecidos dos usuários que procuram informações sobre as doenças mais indolentes começou a procurar, em média, 15 dias após o primeiro pesquisador. Para doenças agressivas, este período foi de apenas 9 dias (p = 0,06, soma classificação) (Figura 4). Conhecidos procurou por um período muito mais curto do que o primeiro usuário no caso de doença indolente (5,1 ± 8,1 dias versus 13,9 ± 18,9 dias, p = 0,01, teste do sinal). Em contraste, nos casos conhecidos de doença agressiva procurou ligeiramente mais longo do que o primeiro utilizador (12,5 ± 17,3 contra 11,0 ± 14,7 dias, não estatisticamente significativa). O primeiro pesquisador em um par de conhecidos à procura de informações sobre o câncer procurou, em média, por 28% mais doenças (classificação sinal, p = 0,03). Nós supomos isto pode representar pesquisas não-específicas antes do diagnóstico final.

a. Quando os pacientes são diagnosticados com câncer, eles obter informações de médicos, a Internet e os seus amigos e familiares. Ao caracterizar pacientes que buscam informações padrão que possamos compreender melhor as necessidades dos pacientes. B. Padrões de busca na Internet refletem estados psicológicos subjacentes. estados de saída mais prováveis ​​identificadas por HMMs são semelhantes para ambas as doenças indolentes e agressivos e são representados pelos quadrados coloridos. No entanto, os pesquisadores para obter informações sobre cânceres agressivos procurar informações sobre o tratamento mais tarde no processo de pesquisa, enquanto o suporte só aparece como um estado de saída significativa de cânceres indolentes. C. Time-linha de pesquisa relacionada ao câncer pelo buscador proband (mais provável que o paciente ou seu cuidador principal) e outros conhecidos. Conhecidos são os pesquisadores muito ativos para doenças agressivo, mas muito menos para doenças indolentes, com um período mais curto de pesquisa que não se sobrepõe com a dos pesquisadores iniciais.

Finalmente, primeiros pesquisadores em cada par de pesquisadores são mais propensos a examinar páginas relacionadas com tratamentos de câncer (25% a mais, p = 0,01, rank sum) em comparação com o segundo pesquisadores) e informações sobre o câncer (14% a mais, não estatisticamente significativo). Os conhecidos mais tarde, à procura eram mais propensos a navegar em páginas com informações sobre as causas do cancro (116% a mais (estatisticamente não significativa), em comparação com os pesquisadores probandos) e mídia social relacionada ao câncer (75% a mais (estatisticamente não significativa)).

Discussão

o período de 100 dias após o diagnóstico de câncer é reconhecida como a “a situação existencial em câncer” [30]. Em seu artigo, Weisman e Worden [30] descreveu como fundamentais estes primeiros dias são para lidar com a angústia relacionada ao câncer no futuro. Informações adquiridas durante esse período formas e define a perspectiva dos pacientes sobre sua condição.

A Internet revolucionou a forma como os pacientes e seus conhecidos recolher informações. Especialistas em câncer muitas vezes encontram pacientes que foram atraídos pela internet para auto-diagnóstico errôneo, tratamentos infundadas [31], [32], ou que estão angustiados pela exposição a possibilidades de resultados extremos seguintes pesquisas na Internet. Neste estudo, focado nas necessidades de informação dos pacientes com câncer presumidos e seus conhecidos.

Nosso estudo mostra que as necessidades de informação dos pesquisadores intensivos são distintos, dependendo da gravidade do câncer, e mudar rapidamente durante um período de dias (Figura 4). Nós presumimos que o usuário intensivo inicial é o paciente ou perto cuidador (por exemplo, pais, cônjuge). Só mais tarde outros conhecidos como amigos ou outros membros da família participar da busca. Nos cancros agressivos, tempo de procura por parte do paciente é mais curto, ou por causa da necessidade de tratamento urgente ou porque os pacientes preferem reprimir números, estatísticas e fatos destas doenças. Oncologistas que fornecem informações confiáveis, pacientes peças ineficazes e navegação na Web em algum momento enganosa [32]. O surpreendentemente baixa proporção de uso da Internet relatada em pais de crianças com câncer e entre os pacientes com câncer em estágio avançado [33] – [35] pode refletir um fenômeno semelhante. Nossos dados podem, portanto, refletir referência anterior para especialistas em câncer para pacientes com doenças agressivas.

Os pacientes com cânceres agressivos passou um curto período de tempo à procura de informações por si só, no entanto seus conhecidos estavam envolvidos cedo e procurou por períodos relativamente longos. Por outro lado, para os cancros indolentes, conhecidos estavam envolvidos no final do processo de pesquisa e gastou apenas um curto período de tempo pesquisando na Internet. Os resultados sugerem que os pacientes e os prestadores de cuidados primários de pacientes com tumores menos agressivos têm mais tempo para gastar em pesquisa na Internet do que aqueles com tumores agressivos. O atraso na conhecidos ‘pesquisas pode ser devido a pacientes “informações de retenção antes do diagnóstico final. Um atraso mais curto pode representar uma diferença menor em cancros agressivos entre suspeita precoce e diagnóstico ou tratamento decisões finais.

Voltar em 1976 reunindo de forma independente informações sobre a doença ones ‘foi trabalhoso e foi, portanto, muito dependente de informações fornecidas pelos médicos . Hoje em dia, usando a Internet, uma quantidade significativa de informação pode ser recolhida em tempo muito curto. Na verdade a nossa descoberta demonstrou que o tipo ea intensidade de procurar variar dentro de dias, sugerindo que na era da internet “a situação existencial em câncer” dura muito menos de 100 dias, podendo variar entre os pacientes com diferentes tipos de câncer.

Doutores veja pacientes durante um período muito emocionalmente dinâmica e crítica. Pacientes “estado mental afeta as informações do processo buscando, e as informações adquiridas podem, por sua vez, alterar os pacientes” estado mental. A maioria das pessoas começar a pesquisa na Internet antes da reunião com o oncologista [2]. Portanto, a duração do intervalo de tempo entre o diagnóstico eo encaminhamento a especialistas, bem como a intensidade da doença e da urgência do tratamento são susceptíveis de afectar a coleta de informações padrão.

Como demonstramos em nossos resultados, padrões de pesquisa são dependentes da gravidade da doença, assim como o comprimento de todo o processo de pesquisa e a transição entre os estados de um HMM. Surpreendentemente, em um modelo de padrões de pesquisa o número de estados ocultos corresponde ao número de estados mentais previstas pelo modelo Kübler-Ross [36]. No entanto, pesquisas adicionais são necessárias para demonstrar se e como os estados HMM ocultas correspondem aos previstos pelo modelo Kübler-Ross (ou seja, negação, raiva, barganha, depressão e aceitação), ea interação entre esses estados mentais internos e eventos externos .

os estudos que se baseiam na UGC, especialmente aqueles no domínio da saúde, são muitas vezes a única fonte imparcial de informações sobre como os usuários buscam informações. Conforme destacamos neste estudo, estes são essenciais para os médicos a entender melhor seus pacientes, e, por sua vez, para uma melhor troca de informações entre pacientes e cuidadores. No entanto, a necessidade de esses estudos não deve comprometer a privacidade dos usuários. Neste estudo, tomaram medidas específicas para minimizar este risco, tornar anônimos identidade do usuário e através da análise de dados após agregar-lo de vários usuários. Assim, acreditamos que ganharam muitos dos benefícios de estudar UGC, sem comprometer a privacidade do usuário.

A relação entre os candidatos anônimos e

pacientes com câncer verdadeira

é uma armadilha potencial neste trabalho. Para se concentrar em usuários com maior probabilidade de ter uma relação estreita com um paciente com câncer, os usuários de internet que não expressam um amplo espectro de interesse em um tipo específico de câncer foram excluídos. É razoável supor que o número de tais usuários que expressaram um grande interesse em uma única doença por uma razão diferente de um paciente concreto é baixa. Deve notar-se que os pacientes que não procuram informações na web apontou para um parente próximo como alguém que naveguei pela Web para eles [32]. Portanto, explorar o padrão de pesquisa habitual de pacientes ou seus parentes próximos é importante. O nosso estudo pode ter excluído alguns usuários que estavam em pacientes reais fatos se apresentaram interesse em apenas um aspecto da doença, embora possam ter sido representado por requerentes de proxy. Notamos, no entanto, a forte correlação entre a prevalência da doença ea frequência de pesquisa no motor de busca, como o apoio mais provas para os usuários que são pacientes com câncer reais e seus conhecidos mais próximos.

Nosso estudo tem várias limitações. os utilizadores da Internet ingênuos são propensas a auto-diagnóstico errado, por meio de um fenômeno chamado cyberchondria [31], quando os sintomas menores (por exemplo, dor de cabeça) são interpretados como sintomas de doenças graves (por exemplo, câncer de cérebro). Para minimizar preconceitos relacionados com consultas geradas por pessoas que não são pacientes com câncer, apenas um grupo selecionado de usuários (42% 20.808 /50.117, selecionado como detalhado na seção Métodos) foi analisado. O fato de que os padrões de pesquisa diferem pela sobrevivência esperada, aumenta a probabilidade de que estamos propensos lidar com pacientes reais e seus conhecidos. O motor de busca Yahoo foi a nossa única fonte de informação, mas apenas um pequeno subconjunto (estimado em 4%) [37] da população são conhecidos por usar vários motores de busca em paralelo. Os usuários também podem encontrar informações na internet através de outros meios que não os motores de busca. No entanto, os dados indicam que a maioria dos usuários escolher motores de busca como a principal fonte de informações para obter informações relacionadas com a saúde em geral, e para a informação relacionada com o cancro, nomeadamente: Estima-se que 66% dos usuários de começar sua busca para a saúde informações -relacionados em motores de busca [38]. Além disso, um estudo recente descobriu que 71% dos pacientes que procuraram informações sobre o câncer usam principalmente um motor de busca como a ferramenta de escolha em comparação com apenas 13% que preferiu ir diretamente para sites específicos relacionados ao câncer [2]. Busca de informações utilizando outros meios de comunicação representa uma fonte de informação que está faltando em nossa análise. No entanto, o nosso foco em usuários que apresentaram um grande número de consultas relacionadas com o cancro significa que os nossos dados são provenientes de uma população que utiliza motores de busca como uma importante fonte de informação. O sistema Mechanical Turk também pode ser tendenciosa. Distribuição de trabalho para um grande número de rotuladores, cada um dos quais, em média, apenas marcadas 34, páginas polarizações potenciais minimizadas. Os dados foram coletados durante um tempo limitado e, portanto, não se sabe se é a população incluída composta uma coorte inicial. No entanto, nossas descobertas sobre a duração dos períodos de busca típicos (10 dias, em comparação com 90 dias de dados) sugerem que a população que começou a pesquisar antes de coleta de dados começou é relativamente pequeno. Além disso, o algoritmo HMM alinha dados e assume que o início da sequência de pesquisa pode estar em falta. O efeito da coorte não-formação, em nossos resultados é, assim, pequeno. Embora os estudos de maior escala, obviamente, dar maior peso à constatação, este ainda representam a maior base de dados de seu tipo, limitado apenas pela consideração de ordem prática (por exemplo, combinando os dados de vários provedores de pesquisa ou coleta de dados por um longo período de tempo). É provável que os resultados seriam reprodutível em outros estudos similarmente grandes.

Apesar destas limitações, este estudo mostra que os dados de Internet UGC pode ser usado para investigar questões médicas em grande escala. Monitoramento dos usuários padrões de pesquisa pode ajudar os sites para melhorar e estratégias de comunicação sob medida para atender as necessidades dos pacientes dinâmicos, como são conhecidas essas medidas para melhorar a experiência do usuário [39]

. Mais importante, os nossos resultados permitem aos médicos a entender mais plenamente as necessidades de informação dos doentes e destacar a importância da eficaz e abrangente transferência de informações entre médicos e seus pacientes, desde o primeiro dia da suspeita através do processo de diagnóstico. Ao compreender os padrões de uso da Internet, os médicos podem usar esta ferramenta como um parceiro poderoso, em vez de uma fonte de angústia no cuidado de seus pacientes. Além disso, os provedores de conteúdo de Internet precisa para personalizar o seu conteúdo, tendo o histórico de pesquisas paciente em consideração quando servindo conteúdo, como os nossos resultados demonstram que a informação precisa mudanças ao longo do tempo.

Deixe uma resposta