Série d'accélérateurs TrueFoundry : interrogation fluide de données structurées et non structurées avec les outils MCP

Conçu pour la vitesse : latence d'environ 10 ms, même en cas de charge
Une méthode incroyablement rapide pour créer, suivre et déployer vos modèles !
- Gère plus de 350 RPS sur un seul processeur virtuel, aucun réglage n'est nécessaire
- Prêt pour la production avec un support complet pour les entreprises
Dans les entreprises modernes, les données vivent dans des silos. Les dossiers CRM, les chiffres de vente ou les journaux sont structurés et conservés dans des bases de données ; les rapports de recherche, les commentaires des clients et les notes de terrain ne sont pas structurés et se trouvent dans des magasins de documents. Pour comprendre les deux, les équipes passent souvent des heures à créer des connecteurs, des pipelines et des scripts d'analyse.
Et si vous pouviez unifier tout cela en une seule couche : une Plan de contrôle du modèle (MCP) — et tout interroger en langage naturel ?
Bienvenue dans la nouvelle façon de travailler avec les données : interrogation de sources structurées et non structurées à l'aide des outils MCP.
Qu'est-ce qu'un MCP ?
UNE Plan de contrôle du modèle (MCP) agit comme une passerelle entre votre agent d'IA et les outils ou systèmes de données externes avec lesquels il interagit. Vous pouvez considérer le MCP comme le « système d'exploitation » de vos outils d'IA : il définit ce à quoi l'IA peut accéder, comment et dans quel contexte.
Chaque MCP se connecte à une fonctionnalité spécifique, il peut s'agir d'un connecteur de base de données, une récupérateur de documents, ou même un exécuteur de code.
Par exemple : -
- Outil Text-to-SQL → Interroge des bases de données structurées.
- Outil RAG → Récupère à partir de référentiels de documents non structurés.
- Exécuteur de code → Exécute la logique d'analyse (comme Python) de manière dynamique.
Une fois tous ces éléments connectés, vous pouvez littéralement demander : > « Dressez la liste des 5 meilleurs professionnels de la santé par ordre de priorité et résumez leur orientation en oncologie à partir de nos rapports internes. »
Le système :
1. Génère du code SQL pour interroger la base de données pour les meilleurs professionnels de la santé.
2. Récupère les rapports axés sur l'oncologie via RAG.
3. Combine et résume les deux.
Création d'un MCP sur des données structurées et non structurées
Voyons comment cela fonctionne à l'aide du Accélérateur Sales Rep-Co configuration à titre d'exemple.
1. Nous utiliserons un service Sales Rep-Co MCP déjà déployé
Vous commencez par déployer Service commercial et commercial en tant que MCP sur TrueFoundry.
Vous aurez besoin d'accéder au locataire de démonstration de Truefoundry
- Assurez-vous que le service est actif et le pod est en marche.
- Reprenez en cas de pause ou redémarrez via Endpoint/Informations d'identification en cas d'arrêt automatique.
- S'il n'est pas déployé, vous pouvez le faire tourner depuis Interface utilisateur TrueFoundry ou localement en utilisant la configuration fournie.
Une fois déployé, vous disposerez d'un terminal tel que : https://tfy-eo.truefoundry.cloud/deployments/{deployment_id} ? onglet = capsules
2. Connectez-le à la passerelle AI
À l'intérieur de TrueFoundry Passerelle IA, allez dans : > AI Gateway → Serveurs MCP → + (Ajouter un MCP)

Trouvez ou ajoutez votre accélérateur de ventes et de repco-accélérateur MCP.
Une fois connecté : - Basculez-le sur - Cliquez Activer tous les outils .

Votre MCP a désormais accès à des outils structurés (SQL) et non structurés (docs).
3. Interroger les deux mondes à l'aide d'une seule invite
Avec votre MCP actif et connecté, vous pouvez interroger simultanément des données structurées et non structurées, le tout en langage naturel.
Voici quelques exemples :
Requête
Ce qui se passe sous le capot
Quels sont les 5 meilleurs professionnels de la santé par ordre de priorité ?
Text-to-SQL interroge la base de données HCP structurée.
Dressez la liste des médecins spécialisés en oncologie et rédigez un court résumé faisant référence au rapport sur l'organotropisme métastatique.
SQL récupère les informations du médecin → RAG récupère et résume le texte du rapport → Rédige une réponse par e-mail.
Analyser la distribution des évaluations prioritaires des professionnels de la santé dans le service d'oncologie.
L'exécuteur de code SQL + Python génère et visualise des informations.
Vous pouvez même étendre cette configuration en ajoutant d'autres outils MCP pour l'analyse, la visualisation ou des API personnalisées.
Pourquoi c'est important
Les flux de travail traditionnels d'accès aux données d'entreprise nécessitent : - des pipelines ETL, - des tableaux de bord BI, - une coordination manuelle entre les analystes et les utilisateurs professionnels. Avec les requêtes basées sur MCP : - Vous réduire le changement d'outil. - Vous tout interroger via une seule interface. - Vous relier les données structurées et non structurées nativement. C'est bien plus que de la commodité, c'est la façon dont prise de décision basée sur les données devrait fonctionner.
Un aperçu du futur
À mesure que les équipes développent de plus en plus de MCP, pour les analyses, le RAG, le CRM et même des outils SaaS externes, écosystème multi-agents commence à émerger. Chaque agent est spécialisé dans son domaine (par exemple, expert SQL, récapitulateur, rédacteur d'e-mails), et AI Gateway les orchestre via des MCP. Nous évoluons vers un monde où les systèmes de données de votre entreprise ne sont pas des tableaux de bord statiques mais des entités vivantes, interrogeant et raisonnant.
Conclusion
En combinant requêtes structurées (SQL), extraction non structurée (RAG), et logique d'exécution (Python) à l'intérieur d'un MCP, vous permettez à un agent de répondre instantanément à des questions complexes et interdomaines. Que vous soyez un data scientist, un responsable commercial ou un architecte d'entreprise, la création d'une couche MCP au-dessus de vos systèmes de données est la première étape vers accès aux données véritablement intelligent.
TrueFoundry AI Gateway offre une latence d'environ 3 à 4 ms, gère plus de 350 RPS sur 1 processeur virtuel, évolue horizontalement facilement et est prête pour la production, tandis que LiteLM souffre d'une latence élevée, peine à dépasser un RPS modéré, ne dispose pas d'une mise à l'échelle intégrée et convient parfaitement aux charges de travail légères ou aux prototypes.
Le moyen le plus rapide de créer, de gérer et de faire évoluer votre IA















.webp)



.png)


.webp)




.webp)







