Lightricks hat LTX-2.3 veröffentlicht. Letzte Nacht. Open-Source, lokal betreibbar, kostenlos. Und es könnte das vollständigste KI-Video-Update seit Monaten sein.
Was ist LTX-2.3?
LTX ist das Open-Source-KI-Videomodell von Lightricks. Es läuft lokal über Hugging Face oder in ComfyUI, das heute Tag-0-Support hinzugefügt hat. Kein Abo. Keine Servergebühren. Dein Material bleibt auf deiner Maschine.
LTX-2.3 ist ein 20-Milliarden-Parameter Audio-Video-Modell. Das heisst: Video und Audio werden gemeinsam aus einem einzigen Prompt generiert. Version 2.3 bringt sechs wesentliche Verbesserungen:
- Natives 9:16-Portrait-Video — generiert das Vertikalformat direkt, nicht zugeschnitten aus dem Querformat. Bessere Qualität für Reels und TikTok.
- Schärfere Details — eine neu entwickelte VAE-Architektur liefert klarere Texturen und sauberere Kanten in jedem Frame.
- Besseres Audio — saubererer Klang, verbesserter Dialog, Musik und Umgebungsgeräusche.
- Flüssigeres Image-to-Video — weniger eingefrorene Frames und Artefakte, natürlichere Bewegung aus Standbildern.
- Besseres Prompt-Verständnis — der verbesserte Text-Encoder versteht komplexe Anweisungen deutlich genauer.
- Text-Rendering — lesbarer Text kann jetzt direkt in Video-Frames gerendert werden. Das war in den meisten Modellen bisher kaum nutzbar.
Warum das wichtig ist
Open-Source-KI-Video hat kommerziellen Tools wie Runway und Kling lange hinterhergehakt. LTX-2.3 schliesst diese Lücke in Bereichen, die für echte Produktionsarbeit wirklich relevant sind.
Der Portrait-Modus ist das Hauptmerkmal. Die meisten KI-Video-Tools zwingen dich, in 16:9 zu generieren und dann auf 9:16 zuzuschneiden oder zu letterboxen. Das kostet Auflösung und Qualität. LTX-2.3 generiert 9:16 nativ. Für Social-Content-Produktion ist das allein schon bedeutend.
Der lokale Ansatz ist ebenfalls ein Vorteil. Wenn du mit Kundenmaterial oder Markenprodukten arbeitest, willst du nicht immer, dass dieses Material über Server Dritter läuft. LTX-2.3 auf eigener Hardware zu betreiben bedeutet: Kundendaten bleiben privat.
Mit dem Tag-0-Support in ComfyUI gibt es bereits fertige Workflow-Templates. Die T2V- oder I2V-Vorlagen lassen sich direkt aus der Template-Bibliothek laden und sofort nutzen.
WIE SEQNCE DAS EINSETZEN WIRD
Wir evaluieren LTX-2.3 genau. Die native Portrait-Generierung und der lokale Datenschutz-Ansatz machen es für Kundenprojekte in regulierten Branchen interessant. Die kombinierte Audio-Video-Generierung wollen wir für atmosphärisches B-Roll mit synchronem Umgebungsklang testen.
Open-Source-Tools wie dieses haben wir im Blick. Wenn die Qualität die Messlatte für kommerzielle Deliverables erreicht, kommt es in den Stack. Wir berichten, sobald wir ordentliche Tests durchgeführt haben.
Kurz zusammengefasst
- Natives 9:16-Portrait-Video, kein Qualitätsverlust durch Zuschnitt
- Audio und Video werden gemeinsam in einem Modell generiert
- Vollständig Open-Source, kostenlos, läuft lokal auf eigener Hardware