Azure AI Foundry - Kiintiön nostaminen
Jos tarvitset Azure AI Foundryn kiintiön nostamista, käytä tätä asiakirjaa, joka tiivistää tarvittavat tiedot ja viittaa kiintiön nostopyyntölomakkeeseen sekä mallien ja alueiden dokumentaatioon.
Miksi nostaminen on tarpeen
AI-avustajasi toimivat (tai tulevat toimimaan) suoraan Azure AI Foundry -ympäristössäsi, joten kaikki AI-työkuormat noudattavat Azure-tilisi (TPM/RPM) rajoja.
Oletuskiintiöt on asetettu pääasiassa testaukseen ja PoC:hen. Tuotantokäytössä, erityisesti asiakirjojen sisäänottamisessa ja upotusten tuottamisessa, nämä rajat muodostavat usein pullonkaulan ja hidastavat merkittävästi käsittelyä.
Kiintiön nostaminen mahdollistaa:
- nopeamman asiakirjojen sisäänottamisen ja uudelleenindeksoinnin,
- suuremman läpimenon upotusten tuottamisessa,
- vakaamman suorituskyvyn samanaikaisessa käyttäjäkuormituksessa,
- alhaisemman viiveen ja vähemmän throttlingia,
- tuotantoskaalan ja luotettavuuden.
Tärkeää: Kiintiön nostaminen ei muuta hintaa. Se lisää vain läpimenoa. Laskutus pysyy tiukasti käytettyjen tokenien mukaan — hinta per token on sama.
Kyseessä on standardi Azure-prosessi tuotannon AI-käytöille. Tarjoamme sinulle esitäytetyt parametrit ja perustelupohjan, jotta pyyntö olisi nopea ja helppo.
Kiintiön nostopyynnön tiedot
| # | Kenttä | Arvo / huomautus |
|---|---|---|
| 1 | Nimi (valtuutettu hakijan edustaja) | [CLIENT] |
| 2 | Sukunimi | [CLIENT] |
| 3 | Yrityssähköposti (yrityksen verkkotunnuksessa) | [CLIENT] |
| 4 | Yrityksen nimi | [CLIENT] |
| 5 | Yrityksen osoite | [CLIENT] |
| 6 | Kaupunki | [CLIENT] |
| 7 | Postinumero | [CLIENT] |
| 8 | Maa | [CLIENT] |
| 9 | Subscription ID | [CLIENT] tai [SIESTA.AI], jos meillä on pääsy Azure-tiliisi |
| 10 | Perustelu (ESIMERKKI) | Alla |
| 11 | Mallin tyyppi | Azure OpenAI |
| 12 | Mallin käyttöönotto kiintiö | Mallin käyttöönotto (PTU/RPM/TPM) |
| 13 | (Azure OpenAI) Kiintiopyynnön tyyppi | Global Standard |
| 14 | Global Standard -alue | East US2 tai Sweden Central |
| 15 | (Azure OpenAI) Global Standard -malli | text-embedding-3-large |
| 16 | Kiintiö | 10000 |
Esimerkki perustelusta
Rakennamme ja ylläpidämme tuotannollista AI SaaS -alustaa, joka keskittyy yritysautomaatioon (asiakirjojen analysointi, RAG-avustajat, sähköpostien lajittelu, CRM-integraatiot ja sisäisten prosessien automatisointi B2B-asiakkaille). Tällä hetkellä toimimme pilottihankkeissa ja tuotantokäytöissä eri toimialoilla (valmistus, kiinteistöhallinta, vakuutukset, yrityspalvelut). Tyypilliset työkuormat sisältävät:
- korkean taajuuden keskustelut ja API-inferenssit,
- suuria putkia asiakirjojen sisäänottamiseen ja vektoroimiseen (PDF, DOCX, verkkosivujen indeksointi),
- kontekstuaalisesti vaativia kehotteita monivaiheisella ajattelulla,
- samanaikaista käyttöä useilta yrityskäyttäjiltä ja tiimeiltä.
Nykyiset kiintiöt ovat jo pullonkaulana huipputilanteissa ja testeissä. Uusien asiakkaiden onboardauksen laajentuessa ja uusien avustajien ja integraatioiden (HubSpot, Gmail, Google Drive, Azure Storage, sisäinen CRM) käyttöönoton myötä odotamme merkittävää token-läpimenon kasvua. Tarvitsemme kiintiön nostamista:
- vakauden ylläpitämiseksi viiveessä samanaikaisessa yritystoiminnassa,
- asiakirjojen eräkäytön ja jatkuvien sisäänottoputkien tukemiseksi,
- tuotannon luotettavuuden ja SLA:n varmistamiseksi,
- throttlingin poistamiseksi todellisista liiketoimintatyön kuormahuipuista.
Tämä kiintiön nostaminen on kriittinen tuleville tuotantokäytöille ja kaupallisille lanseerauksille. Ilman suurempaa kapasiteettia kykymme skaalata asiakkaita ja varmistaa palvelun johdonmukainen laatu on rajoitettu. Sitoudumme vastuulliseen käyttöön, kustannusten seurantaan ja kehotteiden sekä tokenien tehokkaaseen optimointiin Azure OpenAI:n parhaiden käytäntöjen mukaisesti.