Routage des modèles

Comment AllToken achemine les requêtes vers le meilleur fournisseur.

Fonctionnement du routage

Lorsque vous envoyez une requête à AllToken, la plateforme évalue les fournisseurs disponibles pour le modèle demandé et sélectionne le meilleur itinéraire en fonction de :

  • Disponibilité — le fournisseur est-il opérationnel et répond-il ?
  • Latence — quel fournisseur offre le temps de réponse le plus bas ?
  • Coût — quel fournisseur propose le meilleur tarif ?
  • Priorité — l'utilisateur a-t-il configuré des préférences de fournisseur ?

Tout cela se fait de manière transparente à chaque requête — vous n'avez pas à gérer vous-même la sélection des fournisseurs.

Modes de routage

Configurez le comportement de routage par clé dans Paramètres → Clés API :

  • Routage intelligent — AllToken sélectionne automatiquement le meilleur fournisseur. Recommandé pour la plupart des cas d'usage.
  • Modèle par défaut — modèle utilisé si la requête n'en spécifie pas.
  • Modèle forcé — toujours utiliser ce modèle, peu importe ce qu'envoie le client.

Priorité des fournisseurs

Chaque modèle peut être disponible via plusieurs fournisseurs. AllToken attribue un score de priorité à chaque fournisseur en fonction de ses performances historiques. Vous pouvez consulter le classement de priorité dans la section « Fournisseurs disponibles » de la page de détail d'un modèle.

La priorité 1 est le fournisseur préféré. S'il n'est pas disponible, AllToken bascule vers la priorité 2, et ainsi de suite.