Plattform
ScaiWave ScaiGrid ScaiCore ScaiBot ScaiDrive ScaiKey Modelle Tools & Services
Lösungen
Organisationen Entwickler Internet Service Provider Managed Service Provider AI-in-a-Box
Ressourcen
Support Dokumentation Blog Downloads
Unternehmen
Über uns Forschung Karriere Investieren Kontakt
Übersicht

Ihre zentrale KI-Routing-Schicht

Jede KI-gestützte Anwendung muss mit einem Modell kommunizieren. ScaiGrid ist die Schicht zwischen Ihren Anwendungen und diesen Modellen - ob sie auf Ihren eigenen GPUs, auf ScaiLabs-Infrastruktur oder bei externen Anbietern laufen.

Anstatt Ihre Anwendung direkt mit einem Anbieter zu verbinden, verbinden Sie sich mit ScaiGrid. Definieren Sie Frontend-Modelle, die Ihre Anwendungen sehen, und ScaiGrid übernimmt das Backend: Routing, Lastverteilung, Failover, Token-Abrechnung und Kostenoptimierung - alles transparent.

APIs

Kernfunktionen

REST API

Vollständiger Zugriff auf jede Funktion: Managed Chat, Asset-Verwaltung, Personas und Konfiguration.

gRPC API

Hohe Geschwindigkeit, niedrige Latenz für leistungskritische Workloads. Gleiche Funktionen, weniger Overhead.

OpenAI-kompatibel

Drop-in-Ersatz. Ändern Sie Ihre Base-URL und Sie laufen auf ScaiGrid. Keine Code-Änderungen.

WebSocket

Echtzeit-Streaming für Chat Completions, Agenten-Antworten und Live-Daten.

Token-Abrechnung

Per-Nutzer, Per-Tenant, Per-Modell Nutzungsverfolgung. Echtzeit-Dashboards und Abrechnungs-API.

Modellverwaltung

Frontend/Backend Modell-Abstraktion, Versions-Pinning, A/B-Tests und Fallback-Chains.

Erweiterbarkeit

Modulsystem

ScaiMatrix

Vektorspeicher und semantische Suche. Treibt RAG für jede mit ScaiGrid verbundene Anwendung an.

ScaiCore Runtime

Agenten-Deployment und Lifecycle-Management. Stellt Agenten als Modelle über die ScaiGrid-API bereit.

ScaiMind

Training- und Fine-Tuning-Orchestrierung. Jobs starten, Fortschritt überwachen, Ergebnisse automatisch registrieren.

Eigene Module

Bauen Sie eigene Module mit der ScaiGrid-Modul-API. Erweitern Sie Funktionen ohne die Plattform zu forken.

How It Works

Architecture

Clients & Applications REST · gRPC · OpenAI-compat · WebSocket ScaiGrid Central AI Routing & Orchestration Routing Engine Intelligent model selection Load balancing · Fallback Accounting Token metering Cost tracking Modules Extensible plugin architecture API Layer REST · gRPC OpenAI-compatible ScaiInfer Nodes GPU inference backends External APIs OpenAI · Anthropic Module Backends Matrix · Core · Mind Storage & State Vault · Drive · Atlas INGEST PROCESS EXECUTE
Hub & API
Routing & Accounting
Modules
Infrastructure
Anwendungsfälle

ScaiGrid in der Praxis

Enterprise KI-Gateway

Leiten Sie die gesamte KI-Nutzung über einen einzigen Punkt mit konsistenter Authentifizierung, Abrechnung und Modell-Governance.

KI-as-a-Service

Service-Provider nutzen ScaiGrid, um Kunden KI mit Per-Tenant-Isolation und Abrechnung anzubieten.

Multi-Modell-Orchestrierung

Leiten Sie verschiedene Aufgaben an verschiedene Modelle weiter, basierend auf Komplexität, Kosten und Latenzanforderungen.

Souveräne KI

Betreiben Sie auf Ihrer eigenen Infrastruktur mit ScaiInfer-Nodes. Keine Daten verlassen Ihre Umgebung.

Infrastruktur

ScaiInfer - Inferenz-Compute

ScaiInfer liefert das GPU-gestützte Compute-Backbone für Modell-Inferenz. Nodes registrieren sich bei ScaiGrid und übernehmen die tatsächliche Ausführung - Modelle laden, Anfragen verarbeiten, Ergebnisse liefern.

Flexible Bereitstellung: ScaiLabs Cloud, Partner-Rechenzentren oder On-Premises. ScaiGrid routet transparent.

  • GPU-optimierte Inferenz mit automatischer Skalierung
  • Gesundheitsüberwachung und Kapazitätsberichte
  • Mehrere gleichzeitige Modelle pro Node
Modellverwaltung

ScaiAtlas - Modellregister

Der zentrale Katalog für jedes KI-Modell. Vollständige Versionierung, Metadaten, Kompatibilitätsverfolgung und Deployment-Koordination zu ScaiInfer-Nodes.

  • Modellspeicher mit Versionshistorie
  • Umfangreiche Metadaten: Architektur, Fähigkeiten, Hardware-Anforderungen
  • Deployment-Koordination und Entdeckung
Training

ScaiMind - Training & Fine-Tuning

Orchestriert Modelltraining und Fine-Tuning über GPU-Infrastruktur. LoRA, QLoRA und vollständiges Fine-Tuning mit dem gesamten Lebenszyklus verwaltet: Dataset-Vorbereitung, Planung, Monitoring, Evaluation und automatische Registrierung in ScaiAtlas.

Der vollständige Zyklus

Vom Training zur Produktion

01

Trainieren

ScaiMind orchestriert Training auf GPU-Nodes.

02

Registrieren

Modelle in ScaiAtlas mit vollständigen Metadaten katalogisiert.

03

Bereitstellen

ScaiAtlas koordiniert die Bereitstellung auf ScaiInfer-Nodes.

04

Ausliefern

ScaiGrid routet Anfragen an optimale Nodes.

Bereit, Ihre KI-Infrastruktur zu zentralisieren?

Entdecken Sie ScaiGrid oder nehmen Sie Kontakt auf.

Kontakt aufnehmen