Empfohlener Einstieg~5.24 GBQ4_K_MKompakt und praktisch als erste Wahl. Hier beginnen, ausser du weisst bereits, dass dein System genug RAM oder VRAM fuer groessere Varianten hat.pb_qwen3_5_9b_dora_v7_stable_q4_k_m.ggufModell herunterladen
Leichtgewichtig~4.98 GBQ4_K_SNoch kompakter mit guter Qualitaet. Ideal fuer CPU-Offloading oder wenn Speicher knapp ist.pb_qwen3_5_9b_dora_v7_stable_q4_k_s.ggufModell herunterladen
Kleinste Variante~4.95 GBQ4_0Die kleinste und schnellste Variante. Beste Wahl fuer reine CPU-Inferenz oder sehr beschraenkten Speicher.pb_qwen3_5_9b_dora_v7_stable_q4_0.ggufModell herunterladen
Hoehere Qualitaet~6.85 GBQ6_KGeeignet, wenn mehr Speicher fuer staerkere Antworten und stabileres codeorientiertes Verhalten verfuegbar ist.pb_qwen3_5_9b_dora_v7_stable_q6_k.ggufModell herunterladen
Hohe Praezision~8.87 GBQ8_0Fuer leistungsfaehige Hardware, wenn Qualitaet wichtiger ist als Downloadgroesse und Speicherbedarf.pb_qwen3_5_9b_dora_v7_stable_q8_0.ggufModell herunterladen
Maximale Qualitaet~16.7 GBF16Fuer anspruchsvolle Workflows mit hoher Genauigkeit, z. B. Codeanalyse, Konvertierung und detailierte Tests.pb_qwen3_5_9b_dora_v7_stable_f16.ggufModell herunterladen
Maximale Qualitaet GPU~16.7 GBBF16Brain-float16 Variante fuer maximale GPU-Performance bei gleichbleibender hoher Qualitaet.pb_qwen3_5_9b_dora_v7_stable_bf16.ggufModell herunterladen
SPR GGUF~5.2 GBQ4_K_M VRAM-safeVRAM-schonende Variante mit reduzierter Speicherbelastung bei weiterhin stabilem Verhalten.spr_qwen3_5_9b_dora_vramsafe_q4_k_m.ggufModell herunterladen
SPR GGUF~6.9 GBQ6_K VRAM-safeHohe Qualitaet mit kontrollierterem VRAM-Einsatz.spr_qwen3_5_9b_dora_vramsafe_q6_k.ggufModell herunterladen
SPR GGUF~8.9 GBQ8_0 VRAM-safeFuer bessere Ausgabequalitaet in lokalen Runtimes mit ausreichend Speicher.spr_qwen3_5_9b_dora_vramsafe_q8_0.ggufModell herunterladen
SPR GGUF~16.7 GBBF16 VRAM-safeHoehere Praezisionsvariante fuer anspruchsvolle Inferenz- und Konvertierungs-Workflows.spr_qwen3_5_9b_dora_vramsafe_bf16.ggufModell herunterladen