Buscar

Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation

31 de Marzo de 2024 in Análisis y Reseñas by Alejandro García

Recientemente, el grupo de Fotogrametría y Teledetección (PRS) de la ETH Zürich ha presentado el modelo Marigold-LCM, una herramienta avanzada para crear mapas de profundidad a partir de una única imagen. Este método innovador utiliza el Modelo de Consistencia Latente para calcular el mapa de profundidad en un único paso, una mejora significativa frente a los 10-50 pasos que se necesitaban anteriormente. Este avance permite ahora el procesamiento de vídeos, como se ha demostrado en la presentación. Este logro es un ejemplo más de cómo la aceleración de la difusión a través de la destilación (como la destilación SD3 mencionada anteriormente) puede ser aplicada, no solo para generar fotos, sino también para crear mapas de profundidad.

Read more


1