Bästa AI-tjänsten på Azure du inte visste fanns

När man byggt och skalar AI-lösningar stöter man sannolikt på ett specifikt problem, nämligen att slå i taket för rate limits och hur många requests man kan göra under en viss tid. Ett sätt att hantera detta är att ha flera instanser av AI-modellerna och växla mellan dom. I det här avsnittet pratar jag med Simon Kurtz om hur GenAI Gateway för API Management kan hjälpa till på riktigt smarta sätt för att lastbalansera och minska antal tokens som behövs. Hosted on Acast. See acast.com/privacy for more information.

Om Podcasten

En teknikstrategisk podcast för dig i IT-branschen. Vi bjuder in experter och ställer frågorna som hjälper dig lyfta teknik, affär och karriär.Maila oss på partnerpodden@microsoft.com eller connecta på LinkedIn: Johan Wallquist | Adam Palm Hosted on Acast. See acast.com/privacy for more information.