Poluição Ambiental. 2025 Dez 18:127447. doi: 10.1016/j.envpol.2025.127447. Publicado online antes da impressão.
RESUMO
Qin et al. (2025) integram o random forest geograficamente ponderado com co-variáveis ambientais de múltiplas fontes para mapear metais pesados no solo, mostrando que a seleção ótima da largura de banda e a fusão GWRF local com RF global melhoram significativamente a precisão preditiva. Usando diminuição média da impureza e SHAP, eles identificam O3, topografia, proximidade de mineração e precipitação como preditores dominantes. No entanto, a importância das características carece de validação de verdade de referência e as classificações dependem do modelo, correndo o risco de interpretações enganosas apesar da forte previsão do alvo. Como as explicações SHAP herdam vieses de modelos supervisionados, a interpretabilidade não pode ser inferida a partir da precisão. Recomendamos auditoria de estabilidade de classificação e validação agnóstica a rótulos: gerar classificações independentes (por exemplo, aglomeração de características, seleção de características altamente variáveis, ρ de Spearman), e então realizar um teste de estabilidade de classificação deixando uma de fora para avaliar a robustez da ordem. A divulgação transparente da instabilidade de classificação deve acompanhar as métricas de previsão.
PMID:41412925 | DOI:10.1016/j.envpol.2025.127447
Para ler a postagem completa, visite o original: Leia a Postagem Completa

Respostas