Alibaba hat kurz vor dem chinesischen Neujahr eine neue Familie von multimodalen Sprachmodellen, die Qwen3.5-Serie, veröffentlicht. Diese Modelle, die in verschiedenen Größen von 0,8 Milliarden bis 122 Milliarden Parametern erhältlich sind, zeichnen sich durch eine überarbeitete Architektur aus, die Mamba-Layer integriert, um die Rechen- und Speicherkomplexität linear mit der Kontextlänge zu skalieren. Dies ermöglicht eine schnellere Token-Produktion und die Verarbeitung längerer Kontexte. Insbesondere die kleineren Modelle wie Qwen3.5-9B und Qwen3.5-4B zeigen beeindruckende Leistungen, die mit deutlich größeren Modellen konkurrieren können. Während die Modelle bei technischen und logischen Fragen kompetent sind, zeigen sie bei politischen Themen eine starke Zurückhaltung und sind stark zensiert, was auf implementierte "Guardrails" hindeutet.