PowerBASIC Modellbibliothek

Weitere KI-Modell-Downloads

PowerBASIC-fokussierte Qwen 9B DoRA GGUF Modellvarianten fuer lokale KI-Runtimes wie LM Studio, Ollama, llama.cpp-kompatible Tools, KoboldCpp, text-generation-webui und andere lokale GGUF-faehige Inferenzumgebungen.

Wenn du lokal mit KI-Tools arbeitest und den Fokus bewusst auf PowerBASIC-Code legst, sind diese Modelle als gute Zusatzoption gedacht. Wähle die Quantisierung nach deinem verfügbaren RAM/VRAM: Q4_K_M für einen sparsamen Einstieg, Q6_K für mehr Qualität oder Q8_0/F16/BF16 für maximale Präzision.

Qwen 9B PowerBASIC Modell-Download Visual

Die GGUF-Dateien liegen im gemeinsamen Downloadbereich ausserhalb von AISPR und koennen in LM Studio, Ollama-Imports, llama.cpp-kompatiblen Runnern, KoboldCpp, text-generation-webui und aehnlichen lokalen Modell-Tools verwendet werden.

Einfach starten

Beginne mit Q4_K_M, ausser du weisst sicher, dass dein Rechner genug Speicher fuer groessere Varianten hat.

Qualitaet erhoehen

Nutze Q6_K, wenn du staerkere Ausgabequalitaet willst und mehr Speicher einsetzen kannst.

Referenz-Einsatz

Nutze Q8_0 oder F16/BF16 nur fuer leistungsfaehige Hardware, Archivierung, Konvertierung oder Referenz-Workflows.

Hugging Face

Repository und Modellkarten

Alle aktuellen Modell-Dateien und Release-Informationen liegen in einem Repo mit konsistenten Dateinamen, Metadaten und direkten Download-Links.

Repository öffnen Dateien durchsuchen

Verfuegbare Dateien

Qwen 9B PowerBASIC GGUF Varianten

Online auf Hugging Face: https://huggingface.co/Theogott/pb-qwen3_5-9b-powerbasic-ggufs

Empfohlener Einstieg~5.24 GB

Q4_K_M

Kompakt und praktisch als erste Wahl. Hier beginnen, ausser du weisst bereits, dass dein System genug RAM oder VRAM fuer groessere Varianten hat.

pb_qwen3_5_9b_dora_v7_stable_q4_k_m.gguf

Modell herunterladen

Leichtgewichtig~4.98 GB

Q4_K_S

Noch kompakter mit guter Qualitaet. Ideal fuer CPU-Offloading oder wenn Speicher knapp ist.

pb_qwen3_5_9b_dora_v7_stable_q4_k_s.gguf

Modell herunterladen

Kleinste Variante~4.95 GB

Q4_0

Die kleinste und schnellste Variante. Beste Wahl fuer reine CPU-Inferenz oder sehr beschraenkten Speicher.

pb_qwen3_5_9b_dora_v7_stable_q4_0.gguf

Modell herunterladen

Hoehere Qualitaet~6.85 GB

Q6_K

Geeignet, wenn mehr Speicher fuer staerkere Antworten und stabileres codeorientiertes Verhalten verfuegbar ist.

pb_qwen3_5_9b_dora_v7_stable_q6_k.gguf

Modell herunterladen

Hohe Praezision~8.87 GB

Q8_0

Fuer leistungsfaehige Hardware, wenn Qualitaet wichtiger ist als Downloadgroesse und Speicherbedarf.

pb_qwen3_5_9b_dora_v7_stable_q8_0.gguf

Modell herunterladen

Maximale Qualitaet~16.7 GB

F16

Fuer anspruchsvolle Workflows mit hoher Genauigkeit, z. B. Codeanalyse, Konvertierung und detailierte Tests.

pb_qwen3_5_9b_dora_v7_stable_f16.gguf

Modell herunterladen

Maximale Qualitaet GPU~16.7 GB

BF16

Brain-float16 Variante fuer maximale GPU-Performance bei gleichbleibender hoher Qualitaet.

pb_qwen3_5_9b_dora_v7_stable_bf16.gguf

Modell herunterladen

Jetzt verfuegbar

SPR-Modelle

Online auf Hugging Face: https://huggingface.co/Theogott/spr-qwen3_5-9b-dora-vramsafe-gguf

SPR GGUF~5.2 GB

Q4_K_M VRAM-safe

VRAM-schonende Variante mit reduzierter Speicherbelastung bei weiterhin stabilem Verhalten.

spr_qwen3_5_9b_dora_vramsafe_q4_k_m.gguf

Modell herunterladen

SPR GGUF~6.9 GB

Q6_K VRAM-safe

Hohe Qualitaet mit kontrollierterem VRAM-Einsatz.

spr_qwen3_5_9b_dora_vramsafe_q6_k.gguf

Modell herunterladen

SPR GGUF~8.9 GB

Q8_0 VRAM-safe

Fuer bessere Ausgabequalitaet in lokalen Runtimes mit ausreichend Speicher.

spr_qwen3_5_9b_dora_vramsafe_q8_0.gguf

Modell herunterladen

SPR GGUF~16.7 GB

BF16 VRAM-safe

Hoehere Praezisionsvariante fuer anspruchsvolle Inferenz- und Konvertierungs-Workflows.

spr_qwen3_5_9b_dora_vramsafe_bf16.gguf

Modell herunterladen

Wo die Modelle nutzbar sind: Dies sind standardmaessige GGUF Modelldateien fuer lokale Inferenz. Sie koennen in LM Studio, Ollama nach Erstellung/Import eines Modelfiles, llama.cpp-kompatiblen Tools, KoboldCpp, text-generation-webui, Jan, GPT4All-artigen GGUF-Loadern und anderen Runtimes genutzt werden, die GGUF-Modelle akzeptieren. Wenn eine Runtime einen Modellordner erwartet, lege die Datei in deine lokale Modellbibliothek und waehle sie dort aus.