Importância Desde a introdução do ChatGPT no final de 2022, a inteligência artificial generativa (genAI) tem despertado enorme entusiasmo e sérias preocupações.
Observações A história tem demonstrado que tecnologias de uso geral frequentemente falham em entregar os benefícios prometidos por muitos anos (“o paradoxo da produtividade da tecnologia da informação”). A área da saúde possui diversos atributos que tornam a implantação bem-sucedida de novas tecnologias ainda mais difícil do que em outros setores; estes têm desafiado esforços anteriores para implementar IA e registros eletrônicos de saúde. No entanto, a IA de geração (GENAI) possui propriedades únicas que podem encurtar o atraso usual entre a implementação e os ganhos de produtividade e/ou qualidade na área da saúde. Além disso, o ecossistema da área da saúde evoluiu para se tornar mais receptivo à IA de geração (GENAI), e muitas organizações de saúde estão prontas para implementar as inovações complementares em cultura, liderança, força de trabalho e fluxo de trabalho, frequentemente necessárias para que as inovações digitais floresçam.
Conclusões e relevância A capacidade da genAI de melhorar rapidamente e a capacidade das organizações de implementar inovações complementares que permitam que as ferramentas de TI atinjam seu potencial estão mais avançadas do que no passado; portanto, a genAI é capaz de fornecer melhorias significativas na assistência médica mais rapidamente do que era o caso com tecnologias anteriores.
Desde que se tornaram publicamente disponíveis no final de 2022, ferramentas de inteligência artificial generativa (genAI), como o ChatGPT, têm despertado enorme entusiasmo, bem como preocupação, em todos os setores da economia. Mas o impacto potencial da genAI na área da saúde parece particularmente notável. Em um campo no qual se estima que 30% dos US$ 4,3 trilhões gastos anualmente nos EUA agregam pouco ou nenhum valor, 1 no qual dezenas de milhares de pessoas morrem anualmente por erros evitáveis, 2,3 e no qual o acesso à assistência é fragmentado e as desigualdades são comuns, é natural o entusiasmo pelo potencial da genAI para melhorar a qualidade, a eficiência , a equidade e a experiência do paciente.
Embora o otimismo em relação à IA Gen seja certamente justificado, o ceticismo também o é. Em 1993, um de nós (EB) descreveu o “paradoxo da produtividade da tecnologia da informação”, citando exemplos repetidos em diversas áreas nas quais tecnologias promissoras inicialmente falharam — às vezes por décadas — em cumprir a promessa de melhorar a produtividade. 4 A experiência recente da área da saúde com a transformação digital, em grande parte por meio da implementação de prontuários eletrônicos de saúde (PEs), tem se alinhado estreitamente ao modelo do “paradoxo da produtividade”. 5
Neste artigo, descrevemos o paradoxo da produtividade e suas causas e, em seguida, abordamos a questão de se um paradoxo semelhante ocorrerá com a IA Gen na área da saúde. Embora a história diga que sim, existem aspectos únicos tanto da IA Gen quanto do contexto atual da área da saúde que provavelmente ajudarão a enfrentar os desafios. Se isso acontecer, a IA Gen poderá cumprir sua promessa na área da saúde dentro de alguns anos, não décadas.
Pesquisas sobre o paradoxo da produtividade demonstraram que há duas razões fundamentais pelas quais as tecnologias não criam rapidamente o valor prometido. 6 A primeira é que as versões iniciais de muitas tecnologias são falhas; as ferramentas que finalmente dão certo são aquelas que melhoraram com iterações sucessivas.
Embora as melhorias na tecnologia sejam cruciais, pesquisas mostram que o segundo e mais importante fator para superar o paradoxo está relacionado aos processos, à estrutura e à cultura do local de trabalho. Infelizmente, os humanos geralmente são incapazes de apreciar ou implementar as profundas mudanças na estrutura organizacional, na liderança, na força de trabalho e no fluxo de trabalho necessárias para aproveitar ao máximo as novas tecnologias, pelo menos no início. O exemplo icônico vem da invenção do motor elétrico no final do século XIX. 7 Apesar de suas vantagens óbvias sobre as fontes de energia anteriores, décadas se passaram antes que a eletrificação transformasse a manufatura e proporcionasse ganhos significativos de produtividade. Isso ocorreu em grande parte porque os líderes não perceberam que colher os benefícios do motor elétrico exigia repensar a maneira como as fábricas eram dispostas, o trabalho era organizado e os trabalhadores eram treinados e socializados. Esses líderes normalmente substituíam sua grande máquina a vapor por um grande motor elétrico, o que pouco contribuiu para aumentar a produtividade. Foi somente quando mudaram do “acionamento em grupo” (com um motor acionando várias máquinas) para o “acionamento unitário” (cada máquina com seu próprio motor) que a produtividade dobrou ou triplicou, à medida que novos layouts de fábrica levaram à otimização dos fluxos de trabalho. Ao longo dos 150 anos seguintes, esse cenário se repetiu inúmeras vezes, com a lição atemporal de que superar o paradoxo da produtividade requer inovações complementares na forma como o trabalho é realizado, às vezes chamadas de “reimaginar o trabalho”. 8
Ao considerar se a genAI cumprirá sua promessa na área da saúde, uma maneira de moldar a conversa gira em torno de dois fatores críticos. Primeiro, há algo na genAI, em comparação com tecnologias anteriores, que acelerará melhorias iterativas na tecnologia? Segundo, há algo na interseção da genAI com o ecossistema atual da saúde que acelerará o desenvolvimento de habilidades e processos complementares, ou eliminará parcialmente a necessidade deles?
Antes de abordar o paradoxo da produtividade em relação à IA Gen, vale a pena revisá-lo conforme se afirmou com tecnologias anteriores na área da saúde. Observe que estamos nos referindo aqui a tecnologias de uso geral, aquelas que influenciam múltiplas tarefas e especialidades, em vez de tecnologias com foco mais específico, como a cirurgia laparoscópica ou as ferramentas da radiologia intervencionista, cuja implementação tende a ser muito mais fácil. 8 Mas a luta para implementar tecnologias de uso geral pode render muito: desde a Revolução Industrial, os maiores impulsionadores do crescimento sustentado da produtividade têm sido essas tecnologias, desde a máquina a vapor e a eletricidade até os computadores e agora, talvez, a IA.
Nos últimos 15 anos, a transformação tecnológica geral dominante na área da saúde ocorreu com a implementação dos prontuários eletrônicos de saúde (EHRs). 5 A adoção dos EHRs foi acelerada por pagamentos de incentivos federais sob a Lei HITECH, aprovada durante a Grande Recessão de 2008 e implementada a partir de 2010. 9 Em 2009, quando a HITECH se tornou lei, menos de 1 em cada 10 hospitais dos EUA tinha um EHR; uma década depois, menos de 1 em cada 10 não tinha. 10
Embora os prontuários eletrônicos de saúde tenham reduzido a taxa de erros de medicação e proporcionado inúmeros outros benefícios, 11 as evidências de que eles melhoraram a produtividade são mistas, principalmente quando se considera o aumento da carga de documentação dos médicos associado aos prontuários eletrônicos de saúde. 12 – 14 A consequência inesperada mais recente é a explosão de mensagens eletrônicas vindas do portal do paciente para a caixa de entrada do prontuário eletrônico de saúde do médico. 15 Os médicos frequentemente citam o prontuário eletrônico de saúde como um fator-chave em sua insatisfação com o trabalho e nos altos níveis de esgotamento .
Ao refletirmos sobre os desafios enfrentados com a implementação de prontuários eletrônicos de saúde (PEPs), também vale a pena reconhecer que a área da saúde tentou implementar IA décadas antes da IA genética se tornar disponível. Nas décadas de 1960, 1970 e início da década de 1980, diversas empresas e grupos acadêmicos desenvolveram ferramentas de IA projetadas para auxiliar (ou substituir) médicos como diagnosticadores. Nenhuma delas se mostrou útil o suficiente para alcançar ampla aceitação ou viabilidade comercial, o que levou a um “inverno da IA” que durou décadas, durante o qual o interesse e o investimento em IA na área da saúde diminuíram acentuadamente. 17
O setor mostrou sinais de vida novamente em 2011, quando o software de IA Watson da IBM, tão impressionante em sua vitória no Jeopardy!, voltou sua atenção para a área da saúde. No entanto, uma década depois, após não demonstrar valor significativo para organizações de saúde, a Watson Health foi vendida para uma empresa de investimentos “em partes” .
Os fracassos anteriores da IA na área da saúde e a primeira década turbulenta da era do prontuário eletrônico não são surpreendentes. De fato, a área da saúde apresenta alguns desafios à transformação digital ainda mais assustadores do que os observados em outros setores.
Em primeiro lugar, a saúde é altamente regulamentada, com debates complexos e frequentemente controversos (e litigiosos) relacionados à propriedade de dados. Além disso, regulamentações de privacidade rigorosas restringem significativamente o compartilhamento de dados, essencial para a IA Gen. 20
Em segundo lugar, o mercado de EHRs tornou-se altamente concentrado. 21 Com um punhado de empresas agora “donas” dos desktops da grande maioria dos provedores de assistência médica, empresas não especializadas em EHRs, especializadas em ferramentas relacionadas à IA de geração, enfrentam barreiras significativas à entrada.
Em terceiro lugar, há um número enorme de participantes na área da saúde, incluindo médicos, hospitais, planos de saúde, empregadores, empresas farmacêuticas, fabricantes de dispositivos e governo. 22 Isso torna a implementação bem-sucedida da genAI muito mais complexa do que em um setor de venda direta ao consumidor, onde uma ferramenta pode precisar apenas melhorar a experiência de um consumidor individual (que paga por ela do próprio bolso ou por meio de anúncios), ou uma venda direta para uma empresa, que decide se a ferramenta melhora sua posição competitiva sem as complexidades introduzidas por altos níveis de regulamentação ou pagamentos de terceiros. Além disso, muitas das empresas tradicionais na área da saúde têm enorme poder político, capaz de bloquear inovações tecnológicas que, na sua opinião, possam comprometer o atendimento ao paciente ou sua posição econômica.
Em quarto lugar, os dados sobre assistência médica são muito confusos e frequentemente variam dependendo de sua finalidade principal (por exemplo, documentação clínica, relatórios de qualidade, conformidade regulatória, faturamento). 23 Isso torna o uso de qualquer conjunto de dados como fonte de “verdade” para algoritmos de IA potencialmente problemático.
Quinto, o campo da saúde é tudo menos estático, com novas pesquisas constantemente levando a mudanças na compreensão e na prática que precisam ser integradas às recomendações e protocolos de atendimento. Isso significa que um algoritmo de IA gerado a partir de registros históricos pode se mostrar desatualizado e até perigoso.
Por fim, embora “falhe rápido e itere” seja um mantra razoável para um aplicativo voltado para o consumidor, os riscos na área da saúde são altos demais para tolerar falhas no desempenho de ferramentas de tecnologia da informação (TI) que possam resultar em danos ao paciente. Além disso, se o uso de uma ferramenta de TI levar à morte de um paciente, é provável que haja atenção da grande mídia e das mídias sociais, e potencialmente um caso de negligência médica, para lembrar a todos dos riscos.
Argumentamos que o paradoxo da produtividade da TI é comum em muitas empresas, que tecnologias de uso geral anteriores na área da saúde foram vítimas do paradoxo, que o desempenho da IA na área da saúde até o momento tem sido decepcionante e que existem características únicas no ecossistema da saúde que podem tornar a superação do paradoxo ainda mais desafiadora do que em outros setores. Nada disso parece prever que a IA de geração na área da saúde cumprirá rapidamente sua promessa. No entanto, vemos vários motivos para acreditar que a IA de geração levará a ganhos de produtividade e/ou qualidade mais rapidamente do que aqueles alcançados por ferramentas e eras anteriores ( Tabela ).
Fator | Ambiental (E) ou técnico (T) | Comentário |
---|---|---|
Facilidade de uso das ferramentas genAI | T | Requer pouco ou nenhum treinamento especial para desenvolver prompts eficazes; >100 milhões de usuários do ChatGPT nos primeiros 2 meses |
Capacidade das ferramentas genAI de ampliar soluções digitais já desenvolvidas por empresas | E, T | Ecossistema vibrante de empresas que já desenvolvem tecnologias para abordar uma miríade de casos de uso clínicos e não clínicos |
Capacidade das ferramentas genAI de se integrarem aos prontuários eletrônicos de saúde e portais de pacientes e, portanto, não interromperem os fluxos de trabalho profissionais e as práticas dos pacientes existentes | E, T | Os avanços técnicos (APIs) e políticos (requisitos de interoperabilidade) melhoraram a capacidade de integrar ferramentas genAI em EHRs existentes; os fornecedores de EHR também estão desenvolvendo suas próprias soluções de IA |
Capacidade das ferramentas genAI de melhorar rapidamente com base no feedback do usuário e em análises baseadas em IA de falhas solucionáveis na produção | T | Os problemas iniciais com alucinações e vieses já estão sendo abordados (embora de forma imperfeita); é relativamente fácil passar de uma melhoria em uma ferramenta genAI para mudanças reais em seus resultados para os usuários finais |
Os sistemas de prestação de cuidados de saúde, outros utilizadores finais e os desenvolvedores de TI da saúde aprenderam lições com experiências desafiadoras anteriores com a transformação digital | E | A experiência dolorosa anterior com a IA nos cuidados de saúde (que levou ao “inverno da IA”) e com a implementação do EHR levou a sistemas melhorados de governação e supervisão digitais e criou um ceticismo saudável |
O mercado de saúde está dando maior importância ao valor, juntamente com os desafios de esgotamento, recrutamento e retenção de funcionários | E | As crescentes pressões do mercado para fornecer cuidados de alta qualidade, seguros, acessíveis, equitativos e satisfatórios a um custo administrável impulsionarão a adoção da genAI; as tensões na força de trabalho podem fazer com que a genAI seja bem-vinda em vez de vista como uma ameaça |
Em primeiro lugar, as ferramentas relacionadas à genAI são notavelmente fáceis de usar. Embora a produtividade da genAI melhore à medida que os usuários aprendem a criar bons prompts, as ferramentas exigem relativamente pouca experiência do usuário. A curva de adoção sem precedentes do ChatGPT e das versões subsequentes de IA generativa baseada em linguagem (100 milhões de usuários nos primeiros 2 meses) se deve, em parte, ao fato de não exigir treinamento especial. 24 Poucos meses após seu lançamento público, milhões de trabalhadores do conhecimento estavam acessando prompts em inglês simples e descobrindo que a genAI os ajudava a redigir documentos, escrever código de software e criar gráficos, muitas vezes sem a assistência, ou mesmo a aprovação, de suas empresas.
Em segundo lugar, o fato de a IA de geração de dados (GENAI) poder ser entregue via software aos computadores dos usuários também serve para acelerar a adoção. 25 Compare isso com a implementação dos prontuários eletrônicos de saúde (PEPs), uma transição que exigiu um grande investimento em hardware e uma mudança radical na forma como a maior parte do trabalho na área da saúde, tanto clínico quanto administrativo, era organizada. Além disso, existe agora um ecossistema vibrante de startups de saúde financiadas por capital de risco que estavam trabalhando para resolver uma variedade de problemas de saúde na época do lançamento do GPT. 26 Temos conhecimento de pelo menos uma dúzia dessas empresas que adicionaram capacidade de IA de geração de dados (GENAI) às suas ofertas em poucos meses, muitas com resultados impressionantes.
Em terceiro lugar, embora os fornecedores de EHR pareçam “possuir” o espaço dos computadores da maioria dos profissionais de saúde, os avanços nas interfaces de programação de aplicativos (APIs) e nas tecnologias de plug-in facilitarão a obtenção de uma interface relativamente uniforme entre os EHRs e os aplicativos genAI desenvolvidos por terceiros. 27 Tentando se manter à frente dessa potencial ameaça competitiva, os principais fornecedores de EHR também estão integrando rapidamente o genAI em suas próprias ofertas de software. 28 , 29
Em quarto lugar, historicamente, um dos principais fatores para superar o paradoxo da produtividade foi a velocidade com que a tecnologia passou por ciclos iterativos de melhoria. Uma característica importante da genAI é sua capacidade de melhorar ao longo do tempo com supervisão humana limitada. 30 Alguns dos problemas bem conhecidos dos primeiros modelos de linguagem de grande porte, como “alucinações” (nas quais a IA inventa fatos e referências), 31 preconceitos raciais e étnicos, 32 e resultados inadequados, 33 foram parcialmente resolvidos alguns meses depois. Em um exemplo vívido, enquanto o GPT-3.5 redigiu uma solicitação de autorização prévia convincente (mas sem sentido) para um anticoagulante para tratar insônia, 6 meses depois o GPT-4 respondeu à mesma solicitação dizendo: “Seria antiético e inapropriado da minha parte redigir tal solicitação” (Sara Murray, MD, MAS; comunicação pessoal). Pode-se contrastar essa capacidade de iterar rapidamente com o ciclo de melhoria relativamente lento dos prontuários eletrônicos de saúde (PEPs), em que os fornecedores podem resolver problemas por meio de lançamentos incrementais de versões com meses ou até anos de intervalo.
É claro que a capacidade de mudar de forma rapidamente cria seus próprios desafios. Dado que mesmo os desenvolvedores de IA genética frequentemente não entendem completamente como suas próprias ferramentas produzem determinados resultados, é possível que um resultado de uma ferramenta de IA genética voltado para o paciente possa mudar de forma prejudicial e imperceptível. A Food and Drug Administration (FDA) dos EUA está atualmente lidando com a questão de como regular as ferramentas de IA genética em ambientes de saúde, ciente de que seus resultados podem mudar de um minuto para o outro. 34
Pesquisas iniciais sobre genAI fora da área da saúde corroboram a premissa de que essas ferramentas têm a capacidade de gerar ganhos de produtividade e qualidade mais rapidamente do que as tecnologias anteriores. Um de nós (EB) trabalhou com colegas para estudar a implementação em fases de uma ferramenta baseada em genAI para auxiliar mais de 5.000 agentes de suporte ao cliente em uma empresa de software. 35 Os agentes que tiveram acesso à ferramenta tiveram um aumento de 14% na produtividade, acompanhado por melhorias na satisfação do cliente e na retenção de funcionários. A maioria dessas melhorias ocorreu nos primeiros meses de implantação do genAI e envolveu mudanças relativamente pequenas na organização do trabalho. Curiosamente, os trabalhadores menos experientes e qualificados observaram os maiores benefícios, com ganhos de produtividade de 35% à medida que ascendiam rapidamente na curva de aprendizado.
Outros estudos publicados nos últimos meses descobriram que a genAI proporcionou ganhos de produtividade grandes e rápidos ao ajudar engenheiros de software, 36 consultores de gestão, 37 e escritores. 38 Uma análise recente concluiu que até 80% das ocupações, incluindo muitas na área da saúde, envolvem pelo menos algumas tarefas para as quais a produtividade do trabalhador poderia ser substancialmente aumentada por meio da genAI. 39
Em algumas circunstâncias, a introdução da IA Gen, por si só, gerará benefícios rapidamente. Mas, na maioria dos casos, grandes ganhos só virão quando a implementação for acompanhada de mudanças significativas no design do trabalho. Acreditamos que os líderes da área da saúde estão mais preparados para implementar essas mudanças do que no passado. Após vivenciarem os problemas de algumas implantações anteriores de TI, muitos líderes parecem cada vez mais sofisticados em suas reflexões sobre sistemas, gestão de mudanças e a importância do treinamento e da cultura da força de trabalho. Os departamentos de TI da maioria das grandes organizações de saúde agora incluem médicos com formação em informática e profissionais com experiência em design centrado no usuário e pensamento sistêmico.
As empresas do setor digital da saúde também absorveram as lições das últimas décadas, incluindo a importância de inovações complementares, a necessidade de humildade e paciência, e a complexidade e os altos riscos da saúde. Em 2021, refletindo sobre o fim da Watson Health, o CEO da IBM, Arvind Krishna, afirmou: “A saúde sempre será… mais sutil, bem como mais regulamentada, por todos os motivos certos… É uma decisão que pode impactar a vida ou a morte de alguém. É preciso ser mais cuidadoso. Então, na área da saúde, descobrimos que talvez estivéssemos otimistas demais.” 40
Além disso, as mudanças no mercado de saúde provavelmente acelerarão o ritmo de investimento e implantação da genAI. As margens de lucro das organizações prestadoras de serviços de saúde estão cada vez mais ameaçadas por uma variedade de fatores, incluindo reembolso limitado, aumento dos custos trabalhistas, disparada dos custos farmacêuticos e aumento da concorrência — agora tanto de outras organizações de saúde, como farmácias de varejo, quanto de empresas não relacionadas à saúde, como Amazon e Walmart. 41 Embora as preocupações de que a genAI ameace os empregos dos funcionários atuais sejam uma fonte crescente de disputas entre a gerência e os trabalhadores (como nas recentes greves nas indústrias de entretenimento e automobilística), a atual escassez de funcionários administrativos, enfermeiros e algumas especialidades médicas pode amenizar essa tensão na área da saúde. Finalmente, e talvez ironicamente, muitos dos problemas criados por inovações digitais anteriores — como a sobrecarga de documentação e a caixa de entrada do EHR — podem ser resolvidos por novas ferramentas baseadas em genAI, como escribas digitais e chatbots sofisticados.
De fato, esperamos que a genAI conquiste suas primeiras vitórias em sistemas de prestação de serviços de saúde não tanto ao lidar com tarefas voltadas para o paciente (como fazer diagnósticos e recomendar tratamentos), mas sim ao abordar áreas de desperdício e atrito administrativo, seja na criação de um atestado médico, no agendamento de uma consulta com um paciente ou no envio de uma fatura ou solicitação de autorização prévia a uma seguradora. A experiência adquirida nessas áreas provavelmente abrirá caminho para uma implementação mais ampla em áreas que afetam mais diretamente os resultados e a experiência do paciente. Uma análise recente de economistas de Harvard e da consultoria McKinsey projetou que a implementação de sistemas modernos de IA poderia levar a uma economia de 5% a 10% nos gastos com saúde (aproximadamente US$ 200 a US$ 360 bilhões por ano em valores de 2019), principalmente ao abordar casos de uso em operações, funções corporativas e reembolso. 42 Essas economias podem ser subestimadas se a genAI for bem-sucedida em facilitar cuidados de alto valor e baseados em evidências por meio de suporte eficaz à decisão clínica .
O paradoxo da produtividade da TI provavelmente se revelará com a implementação da IA Gen na medicina, assim como aconteceu com tecnologias anteriores, tanto dentro quanto fora da área da saúde. De fato, quando comparada a outros setores, a área da saúde possui diversos atributos que aumentam o desafio de colher os benefícios prometidos pelas ferramentas tecnológicas.
No entanto, estamos otimistas de que os dois principais fatores historicamente cruciais para superar o paradoxo da produtividade — a capacidade das ferramentas digitais de melhorar rapidamente e a capacidade das organizações de implementar inovações complementares que permitam que as ferramentas de TI alcancem seu potencial — estejam mais avançados do que no passado. Por isso, acreditamos que a IA de geração proporcionará melhorias significativas na área da saúde mais rapidamente do que com as tecnologias anteriores.
Isso significa que a assistência médica será completamente transformada pela genAI nos próximos anos? Isso parece improvável, embora certos casos de uso, como escribas digitais e algumas formas de automação de back-office, possam fazer uma grande diferença de forma relativamente rápida. Mas significa que o que poderia ter sido um caminho de décadas para a genAI superar o paradoxo da produtividade na assistência médica pode agora ser percorrido em 5 a 10 anos e, para algumas organizações digitalmente avançadas, ainda mais cedo. Nada disso acontecerá automaticamente. Os desenvolvedores da genAI precisarão abordar efetivamente as preocupações com alucinações, viés, segurança e acessibilidade. Os reguladores precisarão promulgar padrões que facilitem a confiança na genAI sem sufocar indevidamente a inovação. E, mais importante, os líderes da assistência médica precisarão implementar roteiros acionáveis que priorizem as áreas onde a genAI pode gerar os maiores benefícios para suas organizações, prestando muita atenção às inovações complementares que permanecem necessárias e se esforçando para mitigar os problemas conhecidos com a genAI e quaisquer consequências imprevistas que surjam. Dado o papel descomunal do sistema de saúde tanto na saúde humana quanto na economia, os riscos dificilmente poderiam ser maiores.
Conteúdo original em: https://jamanetwork.com/journals/jama/fullarticle/2812615
Respostas