メインコンテンツまでスキップ

音声形式と​言語

Shisa ASR は、​いく​つかの​一般的な​形式の​ base64 エンコードされた​音声を​受け付け、​97言語に​わたって​話されている​言語を​自動的に​識別します。​この​ページでは、​サポートされている​形式を​一覧で​示し、​音声を​ base64 に​エンコードする​方​法を​説明し、​言語検出に​ついて​説明します。

サポートされている​音声形式

生の​ base64 エンコードされた​音声データを​ audio フィールドに​渡します。​サーバーは​バイナリヘッダーから​形式を​自動検出する​ため、​形式を​自分で​宣言する​必要は​ありません。

FormatMIME typeDetection
WAVaudio/wavRIFF header
OGGaudio/oggOggS header
MP3audio/mpegID3 tag or MPEG sync bytes
FLACaudio/flacfLaC header

音声を​ base64 に​エンコードする

サポートされている​ファイルを​ base64 に​変換し、​リクエストに​直接埋め込みます:

# Encode any supported format to base64
base64 -w0 audio.ogg # Linux
base64 -i audio.ogg # macOS

# Use in a curl request
curl -s -XPOST 'https://api.shisa.ai/asr/srt/audio_llm' \
-H 'Authorization: Bearer shsk:YOUR_API_KEY' \
-H 'Content-Type: application/json' \
-d '{ "audio": "'$(base64 -w0 audio.ogg)'" }'

言語​検出​(LID)

API は​97言語に​わたる​自動言語識別​(LID)を​サポートしています。language パラメータを​省略すると、​話されている​言語が​自動的に​検出され、​レスポンスの​ language フィールドで​返されます。​特定の​言語を​強制するには、language を​明示的に​設定します​(例: "ja" または​ "en")。

主要​言語

CodeLanguage
jaJapanese
enEnglish
zhChinese
サポートされている​97言語すべて
CodeLanguage
afAfrikaans
amAmharic
arArabic
asAssamese
azAzerbaijani
baBashkir
beBelarusian
bgBulgarian
bnBengali
boTibetan
brBreton
bsBosnian
caCatalan
csCzech
cyWelsh
daDanish
deGerman
elGreek
enEnglish
esSpanish
etEstonian
euBasque
faPersian
fiFinnish
foFaroese
frFrench
glGalician
guGujarati
haHausa
hawHawaiian
heHebrew
hiHindi
hrCroatian
htHaitian Creole
huHungarian
hyArmenian
idIndonesian
isIcelandic
itItalian
jaJapanese
jwJavanese
kaGeorgian
kkKazakh
kmKhmer
knKannada
koKorean
laLatin
lbLuxembourgish
lnLingala
loLao
ltLithuanian
lvLatvian
mgMalagasy
miMaori
mkMacedonian
mlMalayalam
mnMongolian
mrMarathi
msMalay
mtMaltese
myMyanmar
neNepali
nlDutch
nnNorwegian Nynorsk
noNorwegian
ocOccitan
paPunjabi
plPolish
psPashto
ptPortuguese
roRomanian
ruRussian
saSanskrit
sdSindhi
siSinhala
skSlovak
slSlovenian
snShona
soSomali
sqAlbanian
srSerbian
suSundanese
svSwedish
swSwahili
taTamil
teTelugu
tgTajik
thThai
tkTurkmen
tlTagalog
trTurkish
ttTatar
ukUkrainian
urUrdu
uzUzbek
viVietnamese
yiYiddish
yoYoruba
zhChinese

次の​ステップ