Uno studio AI locale premium, senza configurazione, e una GUI offline per Stable Diffusion (generazione immagini), LLM (chat), Whisper (speech-to-text) e Kokoro (text-to-speech). Alimentato da esecuzione accelerata via GPU e NPU su Windows, Linux e macOS.
- Che cos’è Uncensored AI Studio?
- Funzionalità principali
- Architettura workspace ed engine
- Modelli supportati
- Architettura delle cartelle
- Guida introduttiva
- Compatibilità hardware e accelerazione
- Risoluzione problemi e FAQ
- Compilazione da sorgente
- Licenza
Uncensored AI Studio è uno studio AI completamente offline, senza configurazione e autonomo per Windows, Linux e macOS. A differenza dei sistemi AI basati su cloud, funziona interamente sul tuo hardware, senza censura, tracciamento, abbonamenti o requisiti di login.
Unifica quattro grandi funzionalità AI locali in un’unica interfaccia desktop ad alte prestazioni:
- 🎨 Generazione immagini (Stable Diffusion): genera e modifica immagini di alta qualità offline usando pesi modello
.safetensors,.ggufo.ckpt. - 💬 Chat testuale (LLM): conversa in privato con modelli linguistici open-source (formato GGUF) alimentati dai backend ufficiali e ad alte prestazioni
llama.cpp. - 🎙️ Speech-to-Text (Whisper): trascrive registrazioni vocali e parlato in testo in tempo reale con un motore
whisper.cppintegrato. - 🗣️ Text-to-Speech (Kokoro TTS): converte output testuali in audio vocale altamente naturale e realistico offline usando il modello ONNX
Kokoro-82M.
- 100% offline e privato: esegue le inferenze localmente. Non richiede internet, telemetria, logging cloud o chiavi API.
- Portabilità senza installazione: l’intero runtime (Node.js, modelli, backend GPU) è autonomo. Nessuna modifica globale all’ambiente di sistema.
- Accelerazione autoconfigurata: rileva automaticamente le specifiche hardware per caricare backend CUDA (Nvidia), ROCm (AMD), Vulkan (Intel/AMD/NVIDIA), Metal (macOS) o OpenVINO (Intel NPU).
- Gestore modelli integrato: incolla URL Hugging Face per scaricare direttamente i pesi, oppure trascina e rilascia pesi locali per importarli.
- Monitor prestazioni live: monitora l’utilizzo di CPU, RAM, GPU e VRAM in tempo reale direttamente nella web UI.
- Galleria output locale: salva le immagini generate affiancate ai parametri del prompt e ai file JSON dei metadati.
Per evitare di esaurire la RAM o la VRAM di sistema, i motori testuali e quelli per immagini sono mutuamente esclusivi per impostazione predefinita. Puoi passare da un workspace all’altro dentro la UI:
- Workspace generazione immagini: usa un nodo backend dedicato
stable-diffusion.cpp. I pesi dei modelli sono archiviati inapp/models/. - Workspace chat testuale: usa un backend server portatile
llama.cpp. I pesi dei modelli (.gguf) sono archiviati inapp/llm-models/. Un piccolo modello iniziale Qwen2.5 Coder può essere scaricato direttamente dal pannello Text Chat. - Worker vocale (Whisper): esegue un processo localizzato
whisper-cliper convertire il tuo input vocale in testo. - Output audio (Kokoro TTS): utilizza
kokoro-jslocalmente lato server per leggere le risposte con voci naturali.
L’app è progettata intorno a modelli locali a file singolo che possono essere caricati direttamente dai motori backend inclusi.
| Tipo di modello | Supportato | Inserire i file in | Note |
|---|---|---|---|
| Checkpoint Stable Diffusion 1.5 | Sì | app/models/ |
Migliore compatibilità. Usa file .safetensors o .ckpt. |
| Checkpoint SDXL | Sì | app/models/ |
Supportati come checkpoint a file singolo. Richiedono più RAM/VRAM rispetto a SD 1.5. |
| Checkpoint SD/SDXL GGUF a file singolo | Limitato | app/models/ |
Sono supportati solo checkpoint completi a file singolo. |
| Cartelle modelli immagine OpenVINO | Solo Intel NPU | app/openvino-models/ |
Scarica dal Model Manager dopo aver eseguito la configurazione OpenVINO. |
| Modelli immagine CoreML | Solo Apple Silicon | app/models/ |
Richiede macOS su Apple Silicon e il percorso di configurazione CoreML. |
| Workflow Flux, HiDream, Hunyuan, Wan, Qwen Image, Z-Image | No | N/A | Di solito richiedono file separati per diffusion, VAE e text encoder e non sono caricamenti one-click di checkpoint in questa app. |
| File LoRA, ControlNet, solo VAE, solo text encoder o solo diffusion | No | N/A | I file companion non vengono caricati come modelli immagine autonomi. |
Modelli immagine noti e funzionanti disponibili dal Model Manager:
| Nome | Nome file | Tipo | Dimensione approx. | Uso consigliato |
|---|---|---|---|---|
| Juggernaut XL v9 Lightning | Juggernaut_RunDiffusionPhoto2_Lightning_4Steps.safetensors |
SDXL | 6,6 GB | Fotorealismo di alta qualità su macchine di fascia media/alta. |
| DreamShaper XL Lightning | DreamShaperXL_Lightning.safetensors |
SDXL | 6,6 GB | Immagini SDXL generiche, fantasy, render e illustrazione. |
| DreamShaper 8 | DreamShaper_8_pruned.safetensors |
SD 1.5 | 2,1 GB | Generazione immagini più veloce e con meno memoria. |
| CyberRealistic V8 | CyberRealistic_V8_FP16.safetensors |
SD 1.5 | 2,0 GB | Immagini realistiche SD 1.5 e sistemi con meno memoria. |
| Rev Animated | rev-animated-v1-2-2.safetensors |
SD 1.5 | 2,0 GB | Immagini stilizzate/anime SD 1.5. |
| LCM DreamShaper OpenVINO | OpenVINO/LCM_Dreamshaper_v7-fp16-ov |
OpenVINO | 2,7 GB | Modello di test Intel Core Ultra NPU. |
| Workspace | File modello supportati | Inserire i file in | Note |
|---|---|---|---|
| Chat testuale | Modelli .gguf llama.cpp |
app/llm-models/ |
Usa modelli chat/instruct GGUF a file singolo. I modelli vision possono richiedere anche un file mmproj corrispondente. |
| Speech-to-Text | Modelli whisper.cpp .bin |
app/speech-models/ |
Usa file modello Whisper GGML/whisper.cpp. |
| Text-to-Speech | Manifest .json Kokoro e asset modello |
app/tts-models/ / app/tts-runtime/ |
Usa la configurazione Kokoro integrata e le voci del Model Manager. |
Note
I binari della release Linux sono compilati per sistemi dell’era Ubuntu 24.04 e richiedono glibc 2.38+ più GLIBCXX_3.4.32+. Su VM Ubuntu/Debian più vecchie, un modello come CyberRealistic può essere valido, ma il backend può comunque fallire prima di caricarlo. Aggiorna il sistema operativo della VM oppure compila il backend da sorgente.
Uncensored-AI-Studio/
├── windows.bat # Launcher Windows (punto di ingresso con doppio clic)
├── linux.sh # Launcher Linux (punto di ingresso da terminale)
├── mac.sh # Launcher macOS (punto di ingresso da terminale)
├── LICENSE # Licenza open source MIT
├── .gitignore # Esclude modelli e immagini di output dal controllo versione
├── README.md # Documentazione dettagliata del sistema
├── scripts/
│ ├── setup/ # Configurazione piattaforma e installer backend
│ ├── reset/ # Installazione pulita e riparazione ambiente
│ ├── server/ # Web server UI e gestore ciclo di vita backend
│ ├── workers/ # Processi worker locali
│ ├── build/ # Helper opzionali per build da sorgente
│ └── config/ # Cataloghi configurazione runtime
└── app/
├── frontend/ # Codice sorgente UI (Vite + React)
├── models/ # Inserisci qui i pesi immagine (.safetensors, .gguf, .ckpt)
├── llm-models/ # Inserisci qui i pesi testuali GGUF
└── outputs/ # Immagini salvate e metadati parametri
Assicurati di avere installato un browser web moderno. Segui la guida rapida qui sotto per la tua piattaforma:
- Avvio: fai doppio clic su
windows.bat.[!NOTE] Al primo avvio, lo script scaricherà automaticamente un runtime Node.js portatile e configurerà binari backend GPU/CPU precompilati.
- Aggiungi modelli: trascina file
.safetensors,.ggufo.ckptdentroapp/models/oppure scaricali tramite la scheda Model Manager nella UI. - Genera: apri
http://localhost:1420nel browser, seleziona il modello e scrivi un prompt.
- Rendi eseguibile: apri un terminale nella cartella del progetto e rendi eseguibile lo script:
chmod +x linux.sh
- Avvio: esegui
./linux.sh.- Utenti GPU NVIDIA: ti verrà chiesto di configurare il backend CUDA ad alte prestazioni (scarica precompilato o compila automaticamente da sorgente come fallback).
- Prestazioni AMD Radeon: esegui con
./linux.sh --max-perfper aggiungere il backend ROCm (~1,3 GB di download). - Intel Core Ultra NPU: esegui con
./linux.sh --setup-openvinoper configurare il supporto Intel NPU (richiede driver Intel Linux NPU).
- Aggiungi modelli: trascina i pesi dentro
app/models/oppure scaricali tramite la scheda Model Manager. - Genera: apri
http://localhost:1420nel browser.
- Rendi eseguibile: apri un terminale nella cartella del progetto e rendi eseguibile lo script:
chmod +x mac.sh
- Avvio: esegui
./mac.sh.[!IMPORTANT] Il backend macOS precompilato è ottimizzato per Apple Silicon (M1 o più recente) e usa accelerazione GPU Metal. (L’hardware macOS Intel non è supportato in alcun modo).
- Aggiungi modelli: trascina i pesi dentro
app/models/oppure scaricali tramite la scheda Model Manager. - Genera: apri
http://localhost:1420nel browser.
| Produttore GPU | Tecnologia | Stato | Note |
|---|---|---|---|
| Nvidia | CUDA | ✅ Nativo | Mappa sd-cuda.exe con ottimizzazioni Nvidia SDK 12. |
| AMD Radeon | Vulkan | ✅ Nativo | Mappa sd-vulkan.exe con accelerazione API Vulkan. |
| Intel Arc | Vulkan | ✅ Nativo | Mappa sd-vulkan.exe per hardware Intel. |
| Integrata / Nessuna | CPU | Esegue sui thread logici della CPU (lento). |
| Produttore GPU | Primario | Fallback | Note |
|---|---|---|---|
| NVIDIA | CUDA / Vulkan | Vulkan / CPU | Rileva automaticamente NVIDIA. La configurazione CUDA guidata scarica il precompilato o compila da sorgente. Ripiega su Vulkan per GTX. |
| AMD Radeon | ROCm | Vulkan | ROCm fornisce le migliori prestazioni AMD quando sono disponibili i driver ROCm dell’host. |
| Intel Arc / integrata | Vulkan | CPU | Supporto Vulkan cross-vendor. |
| Intel Core Ultra NPU | OpenVINO NPU | CPU | Richiede driver Intel Linux NPU, kernel 6.6+, Python 3 e ./linux.sh --setup-openvino. |
| Integrata / Nessuna | CPU | — | Esegue sui thread logici della CPU (lento). |
| Hardware | Primario | Fallback | Note |
|---|---|---|---|
| Apple Silicon (M1 o più recente) | Metal | CPU | Usa il backend ufficiale Darwin arm64 stable-diffusion.cpp. |
Important
Requisiti di sistema e note:
- È richiesto Windows 10 o Windows 11 a 64 bit per il runtime Node.js 22 portatile usato dal launcher Windows.
- È richiesto glibc 2.38 o più recente per i backend Linux precompilati (Ubuntu 24.04, Fedora 40+, ecc.). Lo script di configurazione ti avviserà se la tua glibc è più vecchia.
- Linux OpenVINO NPU: sono richiesti Intel Core Ultra, Linux x86_64, kernel 6.6+, un dispositivo
/dev/accel/accel0funzionante, Python 3 convenve il driver Intel Linux NPU.
Reset ambiente: se una build fallisce o vuoi cancellare le dipendenze
Esegui scripts/reset/reset.ps1 (Windows) oppure scripts/reset/reset.sh (Linux/macOS). Questo cancellerà cache temporanee di compilazione e pacchetti per riparare il tuo ambiente. (Nota: conserva i pesi dei modelli e le immagini generate).
I backend Linux non si avviano con GLIBC_2.38 not found
I binari precompilati richiedono glibc 2.38+ (es. Ubuntu 24.04). Se la tua distribuzione usa una versione più vecchia di glibc, puoi aggiornare il sistema operativo oppure compilare il backend da sorgente (vedi la guida Compilazione da sorgente qui sotto).
Conflitti porta: indirizzo porta predefinito già occupato
L’interfaccia web utente funziona sulla porta 1420 per impostazione predefinita. Il gestore backend GPU prova prima ad agganciarsi alla porta 8080, poi rileva automaticamente e passa a una porta libera se 8080 è già occupata.
Linux ROCm non si carica per GPU AMD Radeon
Assicurati che l’hardware della tua GPU AMD e il kernel host siano pienamente compatibili con ROCm 7.13. Se ROCm non riesce a inizializzarsi correttamente, l’applicazione passerà automaticamente all’accelerazione Vulkan.
Linux usa la GPU integrata invece della GPU dedicata
Su sistemi Linux dual-GPU, l’ordine dei dispositivi Vulkan può mettere la GPU Intel integrata su vulkan0 e la GPU AMD/NVIDIA dedicata su vulkan1. Il launcher ora prova a preferire un dispositivo Vulkan dedicato quando vulkaninfo --summary è disponibile. Per forzare manualmente un dispositivo, avvia l’app con SD_VULKAN_DEVICE=vulkan1 ./linux.sh oppure usa un altro indice come vulkan0/vulkan2.
Windows esce con codice 3221225781 (0xC0000135)
Questo codice significa che Windows non è riuscito a trovare una DLL backend richiesta:
- Per AMD/Intel Vulkan: aggiorna il driver GPU a una versione con supporto completo al runtime Vulkan, poi riesegui lo script di configurazione per ripristinare
app/backend/win/vulkan/. - Per NVIDIA CUDA: installa o aggiorna il driver grafico NVIDIA, poi riesegui lo script di configurazione per ripristinare le DLL runtime CUDA.
La generazione mostra "server is not responding or crashed"
Questo indica che il processo del motore backend locale è terminato. Controlla il terminale di avvio (quello in cui hai eseguito windows.bat, ./linux.sh o ./mac.sh) per l’errore console esatto. Le cause comuni includono incompatibilità della versione glibc, driver Vulkan mancanti o problemi di memoria insufficiente del sistema (OOM).
Lo script di configurazione (scripts/setup/setup.sh) ora automatizza la compilazione e la configurazione del backend CUDA da sorgente quando selezionato. Se vuoi compilare manualmente tutti i backend (CPU, Vulkan e CUDA) in una volta sola, puoi eseguire lo script incluso scripts/build/build_from_source.sh.
Per macOS, lo script incluso scripts/build/build_from_source.sh compila il backend Metal e lo copia in app/backend/mac/sd.
git,cmake,make(oninja) e un compilatore C++17 (g++/clang++).- Per CUDA: il toolkit NVIDIA CUDA (
nvcc) deve essere nel tuoPATH. - Per Vulkan: Vulkan SDK / loader e un driver compatibile.
- Per ROCm: librerie di sviluppo AMD ROCm.
- Per macOS Metal: Apple Command Line Tools o Xcode.
# 1. Clona upstream
git clone https://github.com/leejet/stable-diffusion.cpp.git
cd stable-diffusion.cpp
mkdir build && cd build
# 2. Configura per il tuo backend (scegline UNO)
# Solo CPU
cmake .. -DSD_BUILD_SHARED_LIBS=ON -DCMAKE_BUILD_TYPE=Release
# CUDA
cmake .. -DSD_CUDA=ON -DSD_BUILD_SHARED_LIBS=ON -DCMAKE_BUILD_TYPE=Release
# Vulkan
cmake .. -DSD_VULKAN=ON -DSD_BUILD_SHARED_LIBS=ON -DCMAKE_BUILD_TYPE=Release
# ROCm
cmake .. -DSD_HIPBLAS=ON -DSD_BUILD_SHARED_LIBS=ON -DCMAKE_BUILD_TYPE=Release
# macOS Metal
cmake .. -DSD_METAL=ON -DSD_BUILD_SHARED_LIBS=ON -DCMAKE_BUILD_TYPE=Release
# 3. Compila
cmake --build . --config Release -j$(getconf _NPROCESSORS_ONLN 2>/dev/null || sysctl -n hw.ncpu)
# 4. Copia i binari in questo progetto
cp bin/sd* /path/to/Uncensored-AI-Studio/app/backend/linux/<backend>/Dopo la copia, rinomina il binario server per farlo corrispondere a ciò che scripts/server/serve.cjs si aspetta:
- Vulkan:
sd→sd-vulkan - ROCm:
sd→sd-rocm
Poi riavvia l’app con ./linux.sh (Linux) o ./mac.sh (macOS).
Questo progetto è distribuito con licenza MIT - consulta il file LICENSE. Include stable-diffusion.cpp (licenza MIT). I pesi dei modelli sono soggetti alle licenze dei rispettivi creatori.