音声形式と言語
Shisa ASR は、いくつかの一般的な形式の base64 エンコードされた音声を受け付け、97言語にわたって話されている言語を自動的に識別します。このページでは、サポートされている形式を一覧で示し、音声を base64 にエンコードする方法を説明し、言語検出について説明します。
サポートされている音声形式
生の base64 エンコードされた音声データを audio フィールドに渡します。サーバーはバイナリヘッダーから形式を自動検出するため、形式を自分で宣言する必要はありません。
| Format | MIME type | Detection |
|---|---|---|
| WAV | audio/wav | RIFF header |
| OGG | audio/ogg | OggS header |
| MP3 | audio/mpeg | ID3 tag or MPEG sync bytes |
| FLAC | audio/flac | fLaC header |
音声を base64 にエンコードする
サポートされているファイルを base64 に変換し、リクエストに直接埋め込みます:
# Encode any supported format to base64
base64 -w0 audio.ogg # Linux
base64 -i audio.ogg # macOS
# Use in a curl request
curl -s -XPOST 'https://api.shisa.ai/asr/srt/audio_llm' \
-H 'Authorization: Bearer shsk:YOUR_API_KEY' \
-H 'Content-Type: application/json' \
-d '{ "audio": "'$(base64 -w0 audio.ogg)'" }'
言語検出(LID)
API は97言語にわたる自動言語識別(LID)をサポートしています。language パラメータを省略すると、話されている言語が自動的に検出され、レスポンスの language フィールドで返されます。特定の言語を強制するには、language を明示的に設定します(例: "ja" または "en")。
主要言語
| Code | Language |
|---|---|
ja | Japanese |
en | English |
zh | Chinese |
サポートされている97言語すべて
| Code | Language |
|---|---|
af | Afrikaans |
am | Amharic |
ar | Arabic |
as | Assamese |
az | Azerbaijani |
ba | Bashkir |
be | Belarusian |
bg | Bulgarian |
bn | Bengali |
bo | Tibetan |
br | Breton |
bs | Bosnian |
ca | Catalan |
cs | Czech |
cy | Welsh |
da | Danish |
de | German |
el | Greek |
en | English |
es | Spanish |
et | Estonian |
eu | Basque |
fa | Persian |
fi | Finnish |
fo | Faroese |
fr | French |
gl | Galician |
gu | Gujarati |
ha | Hausa |
haw | Hawaiian |
he | Hebrew |
hi | Hindi |
hr | Croatian |
ht | Haitian Creole |
hu | Hungarian |
hy | Armenian |
id | Indonesian |
is | Icelandic |
it | Italian |
ja | Japanese |
jw | Javanese |
ka | Georgian |
kk | Kazakh |
km | Khmer |
kn | Kannada |
ko | Korean |
la | Latin |
lb | Luxembourgish |
ln | Lingala |
lo | Lao |
lt | Lithuanian |
lv | Latvian |
mg | Malagasy |
mi | Maori |
mk | Macedonian |
ml | Malayalam |
mn | Mongolian |
mr | Marathi |
ms | Malay |
mt | Maltese |
my | Myanmar |
ne | Nepali |
nl | Dutch |
nn | Norwegian Nynorsk |
no | Norwegian |
oc | Occitan |
pa | Punjabi |
pl | Polish |
ps | Pashto |
pt | Portuguese |
ro | Romanian |
ru | Russian |
sa | Sanskrit |
sd | Sindhi |
si | Sinhala |
sk | Slovak |
sl | Slovenian |
sn | Shona |
so | Somali |
sq | Albanian |
sr | Serbian |
su | Sundanese |
sv | Swedish |
sw | Swahili |
ta | Tamil |
te | Telugu |
tg | Tajik |
th | Thai |
tk | Turkmen |
tl | Tagalog |
tr | Turkish |
tt | Tatar |
uk | Ukrainian |
ur | Urdu |
uz | Uzbek |
vi | Vietnamese |
yi | Yiddish |
yo | Yoruba |
zh | Chinese |
次のステップ
- クイックスタートで最初の文字起こしを行います。
- すべてのリクエストパラメータとエラーコードは API リファレンスを参照してください。
- ASR 概要に戻ります。