Routage des modèles
Comment AllToken achemine les requêtes vers le meilleur fournisseur.
Fonctionnement du routage
Lorsque vous envoyez une requête à AllToken, la plateforme évalue les fournisseurs disponibles pour le modèle demandé et sélectionne le meilleur itinéraire en fonction de :
- Disponibilité — le fournisseur est-il opérationnel et répond-il ?
- Latence — quel fournisseur offre le temps de réponse le plus bas ?
- Coût — quel fournisseur propose le meilleur tarif ?
- Priorité — l'utilisateur a-t-il configuré des préférences de fournisseur ?
Tout cela se fait de manière transparente à chaque requête — vous n'avez pas à gérer vous-même la sélection des fournisseurs.
Modes de routage
Configurez le comportement de routage par clé dans Paramètres → Clés API :
- Routage intelligent — AllToken sélectionne automatiquement le meilleur fournisseur. Recommandé pour la plupart des cas d'usage.
- Modèle par défaut — modèle utilisé si la requête n'en spécifie pas.
- Modèle forcé — toujours utiliser ce modèle, peu importe ce qu'envoie le client.
Priorité des fournisseurs
Chaque modèle peut être disponible via plusieurs fournisseurs. AllToken attribue un score de priorité à chaque fournisseur en fonction de ses performances historiques. Vous pouvez consulter le classement de priorité dans la section « Fournisseurs disponibles » de la page de détail d'un modèle.
La priorité 1 est le fournisseur préféré. S'il n'est pas disponible, AllToken bascule vers la priorité 2, et ainsi de suite.