Bästa AI-tjänsten på Azure du inte visste fanns

När man byggt och skalar AI-lösningar stöter man sannolikt på ett specifikt problem, nämligen att slå i taket för rate limits och hur många requests man kan göra under en viss tid. Ett sätt att hantera detta är att ha flera instanser av AI-modellerna och växla mellan dom. I det här avsnittet pratar jag med Simon Kurtz om hur GenAI Gateway för API Management kan hjälpa till på riktigt smarta sätt för att lastbalansera och minska antal tokens som behövs. Hosted on Acast. See acast.com/privacy for more information.

Om Podcasten

En teknikstrategisk podcast för dig i IT branschen, vi bjuder in tekniska experter och ställer frågorna som skingrar molnen kring din molnstrategi. Hosted on Acast. See acast.com/privacy for more information.