DigitalOcean Inference Engine – tuotantoluokan AI-inferenssi

DigitalOcean julkaisi Inference Enginen 28.4.2026. Yhdistetty alusta tuotannon AI-inferenssiin, joka tarjoaa serverless-, batch- ja dedikoidut käyttöönottovaihtoehdot sekä älykkään reitityksen mallien valintaa ja kustannuksia varten.

Ominaisuudet

Inference Router politiikkapohjaisella ohjauksella mallien automaattiseen valintaan
Model Evaluations strukturoituun testaukseen oikeilla datajoukoilla
Model Playground mallien rinnakkaiseen kokeiluun eri modaliteeteissa
Tuki yli 70 avoimen lähdekoodin mallille sekä varhaispääsy etulinjan julkaisuihin
Multimodaalisuus: teksti, kuva, video, ääni
Sisäänrakennettu observability tokeneille, latenssille, kustannuksille ja virheille
OpenAI- ja Anthropic-yhteensopivat API-päätepisteet
Batch-inferenssi 24 tunnin SLA:lla, jopa 50 % kustannussäästöä
Dedikoidut GPU-päätepisteet kestäville työkuormille

Hinnoittelu

Pay-as-you-go -malli kulutusrajoilla:

Komponentti	Hinta
Serverless-tokenit	$0,65 / miljoona tokenia
Dedikoitu inferenssi	alkaen $6 / tunti
Batch	alennukset reaaliaikaiseen verrattuna

Lisäksi off-peak-alennusvaihtoehdot.

Kenelle?

AI-insinööreille ja teknisille tiimeille, jotka rakentavat tuotannon AI-sovelluksia. Erityisesti AI-natiiveille yrityksille, modernisoiville enterprise-tiimeille ja kehittäjille, jotka tarvitsevat joustavuutta mallien ja käyttöönottojen välillä ilman hyperscaler-tason monimutkaisuutta.

DigitalOcean Inference Engine

Ominaisuudet