31 de Marzo de 2024 in Análisis y Reseñas by Alejandro García
Recientemente, el grupo de Fotogrametría y Teledetección (PRS) de la ETH Zürich ha presentado el modelo Marigold-LCM, una herramienta avanzada para crear mapas de profundidad a partir de una única imagen. Este método innovador utiliza el Modelo de Consistencia Latente para calcular el mapa de profundidad en un único paso, una mejora significativa frente a los 10-50 pasos que se necesitaban anteriormente. Este avance permite ahora el procesamiento de vídeos, como se ha demostrado en la presentación. Este logro es un ejemplo más de cómo la aceleración de la difusión a través de la destilación (como la destilación SD3 mencionada anteriormente) puede ser aplicada, no solo para generar fotos, sino también para crear mapas de profundidad.
Read more19 de Junio de 2024 in Diverso by Alejandro García
Disculpen, no pude resistirlo. Parece que gracias a Luma AI, un tema tabú finalmente ha sido revelado. Ahora podemos realizar benchmarks para generadores de video y ver quién puede abordar mejor estos temas.
Read more14 de Julio de 2024 in Noticias de IA by Sofía González
In a significant development for the AI and data science community, Hugging Face has unveiled an expansive dataset composed entirely of synthetic data. This innovative dataset was generated using an agent-based approach, leveraging the capabilities of large language models (LLMs) such as GPT-4 and VLLM.
Read more