Modell-Routing

Wie AllToken Anfragen an den optimalen Anbieter weiterleitet.

Funktionsweise des Routings

Wenn Sie eine Anfrage an AllToken senden, bewertet die Plattform die verfügbaren Anbieter für das angeforderte Modell und wählt die optimale Route anhand folgender Kriterien:

  • Verfügbarkeit — Ist der Anbieter aktiv und reagiert er?
  • Latenz — Welcher Anbieter hat die kürzeste Antwortzeit?
  • Kosten — Welcher Anbieter ist am kostengünstigsten?
  • Priorität — Hat der Nutzer Anbieterpräferenzen konfiguriert?

Dieser Prozess läuft bei jeder Anfrage transparent ab – Sie müssen die Anbieterauswahl nicht selbst verwalten.

Routing-Modi

Konfigurieren Sie das Routing-Verhalten pro Schlüssel unter Einstellungen → API-Schlüssel:

  • Intelligentes Routing — AllToken wählt automatisch den optimalen Anbieter. Für die meisten Anwendungsfälle empfohlen.
  • Standardmodell — Wird verwendet, wenn die Anfrage kein Modell angibt.
  • Erzwungenes Modell — Wird immer verwendet, unabhängig davon, was der Client sendet.

Anbieterpriorität

Jedes Modell kann über mehrere Anbieter bereitgestellt werden. AllToken vergibt jedem Anbieter einen Prioritätswert basierend auf der historischen Performance. Sie können die Prioritätsrangliste auf der Modelldetailseite unter „Verfügbare Anbieter" einsehen.

Priorität 1 ist der bevorzugte Anbieter. Ist dieser nicht verfügbar, weicht AllToken auf Priorität 2 aus, und so weiter.