NeuralBox поддерживает три типа аудио: синтез речи (TTS), распознавание речи (STT) и генерация музыки — все через единый эндпоинт /api/v2/generate.
Синтез речи (TTS)
import requests
response = requests.post(
"https://neuralbox.top/api/v2/generate",
headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
json={
"model": "elevenlabs-v2",
"text": "Добро пожаловать в NeuralBox. Ваша AI-платформа для любых задач.",
"voice_id": "21m00Tcm4TlvDq8ikWAM"
}
)
audio_url = response.json()["output_url"]
Сравнение TTS моделей
| Слаг | Название | Тариф | Стоимость | Для чего |
|---|
minimax-tts | MiniMax TTS | Basic+ | 1 ткн | Китайский/английский, большой объём |
openai-tts | OpenAI TTS | Basic+ | 3 ткн | Стандартные голоса |
openai-tts-hd | OpenAI TTS HD | Basic+ | 6 ткн | Подкасты, нарратив |
gpt-4o-mini-tts | GPT-4o Mini TTS | Basic+ | 3 ткн | Естественный разговор |
elevenlabs-flash | EL Flash | Basic+ | 18 ткн | Реальное время, низкая задержка |
elevenlabs-v2 | EL ML v2 | Basic+ | 35 ткн | Многоязычный, высшее качество |
Для реального времени используйте elevenlabs-flash. Для предзаписанного контента — elevenlabs-v2 или openai-tts-hd.
Распознавание речи (STT)
response = requests.post(
"https://neuralbox.top/api/v2/generate",
headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
json={
"model": "whisper",
"audio_url": "https://example.com/audio.mp3",
"language": "ru"
}
)
print(response.json()["content"])
| Слаг | Название | Тариф | Стоимость |
|---|
whisper | Whisper STT | Starter | 2 ткн |
gpt-4o-transcribe | GPT-4o Transcribe | Basic+ | 2 ткн |
elevenlabs-scribe | EL Scribe | Basic+ | 2 ткн |
Генерация музыки
Две модели для разных задач:
| Слаг | Провайдер | Тариф | Стоимость | Для чего |
|---|
musicgen | Replicate | Starter | 9 ткн | Быстрые наброски, без подписки |
elevenlabs-music | ElevenLabs | Basic+ | 58 ткн | Профессиональное качество, длинные треки |
MusicGen (Replicate)
response = requests.post(
"https://neuralbox.top/api/v2/generate",
headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
json={
"model": "musicgen",
"prompt": "Спокойный lo-fi хип-хоп, треск винила, фортепиано, 80 BPM",
"duration": 30
}
)
ElevenLabs Music
response = requests.post(
"https://neuralbox.top/api/v2/generate",
headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
json={
"model": "elevenlabs-music",
"prompt": "Эпическая оркестровая киномузыка, нарастающее напряжение, полные струнные",
"duration": 60
}
)
Советы по промптам
| Элемент | Примеры |
|---|
| Жанр | lo-fi хип-хоп, киноркестр, электронный хаус, акустик фолк |
| Инструменты | фортепиано, электрогитара, синтезатор, скрипка, барабаны |
| Темп | 80 BPM, быстрый, медленный и мелодичный |
| Настроение | энергичный, меланхоличный, воодушевляющий, напряжённый, расслабляющий |