vLLM lanza v0.22.1: Mejora la compatibilidad de CUTLASS para DeepSeek-V4
vLLM ha lanzado la versión v0.22.1, una actualización crítica dirigida a resolver problemas de compatibilidad de CUTLASS con la inicialización de modelos DeepSeek-V4. Este parche mejora la estabilidad y el rendimiento al ejecutar modelos avanzados en entornos de inferencia de alto rendimiento.
vLLM lanza v0.22.1: Mejora la compatibilidad de CUTLASS para DeepSeek-V4 Leer más »










