AI Työkalut

Whisper (OpenAI)

OpenAI:n avoimen lähdekoodin puheentunnistusmalli, joka tarjoaa huippuluokan transkription monikielisesti. Saatavilla eri kokoisina malleina Tiny:stä Large:en.

Whisper (OpenAI) pääkuva
HintaIlmainen
KategoriaKehittäjille, Tuottavuus
Päivitetty12.1.2026
Jaa:
Vieraile sivustolla

Ominaisuudet

APIAvoin lähdekoodiIlmainenMonikielinenPuheentunnistus

Mikä on Whisper?

Whisper on OpenAI:n kehittämä avoimen lähdekoodin automaattinen puheentunnistusjärjestelmä (ASR). Se on koulutettu 680 000 tunnilla monikielistä dataa ja tarjoaa poikkeuksellisen tarkkuuden.

Keskeiset ominaisuudet

  • Laaja kielituki - Tukee kymmeniä kieliä mukaan lukien suomi
  • Avoin lähdekoodi - Ilmainen käyttää ja muokata
  • Erikokoiset mallit - Tiny:stä Large:en tarpeen mukaan
  • Kääntäminen - Käännä suoraan englanniksi
  • Aikaleimaus - Sana- ja lausetason aikaleimat

Mallit ja suorituskyky

  • Tiny - 39M parametria, ~1 GB VRAM, nopein
  • Base - 74M parametria, ~1 GB VRAM
  • Small - 244M parametria, ~2 GB VRAM
  • Medium - 769M parametria, ~5 GB VRAM
  • Large-v3 - 1.5B parametria, ~10 GB VRAM, paras tarkkuus
  • Turbo - 809M parametria, ~6 GB VRAM, optimoitu nopeuteen

Englanninkielisille äänille on omat .en-versiot pienemmistä malleista.

Käyttötavat

  • API - OpenAI:n pilvipalvelu ($0.006/min)
  • Paikallinen - Asenna omalle koneelle (GPU suositeltava)
  • Integraatiot - Descript, Otter.ai yms.

Käyttökohteet

  • Videoiden ja podcastien litterointi
  • Reaaliaikainen tekstitys
  • Kokousten dokumentointi
  • Saavutettavuusratkaisut

Samankaltaiset työkalut