Перейти к основному содержанию
NeuralBox поддерживает три типа аудио: синтез речи (TTS), распознавание речи (STT) и генерация музыки — все через единый эндпоинт /api/v2/generate.

Синтез речи (TTS)

import requests

response = requests.post(
    "https://neuralbox.top/api/v2/generate",
    headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
    json={
        "model": "elevenlabs-v2",
        "text": "Добро пожаловать в NeuralBox. Ваша AI-платформа для любых задач.",
        "voice_id": "21m00Tcm4TlvDq8ikWAM"
    }
)

audio_url = response.json()["output_url"]

Сравнение TTS моделей

СлагНазваниеТарифСтоимостьДля чего
minimax-ttsMiniMax TTSBasic+1 ткнКитайский/английский, большой объём
openai-ttsOpenAI TTSBasic+3 ткнСтандартные голоса
openai-tts-hdOpenAI TTS HDBasic+6 ткнПодкасты, нарратив
gpt-4o-mini-ttsGPT-4o Mini TTSBasic+3 ткнЕстественный разговор
elevenlabs-flashEL FlashBasic+18 ткнРеальное время, низкая задержка
elevenlabs-v2EL ML v2Basic+35 ткнМногоязычный, высшее качество
Для реального времени используйте elevenlabs-flash. Для предзаписанного контента — elevenlabs-v2 или openai-tts-hd.

Распознавание речи (STT)

response = requests.post(
    "https://neuralbox.top/api/v2/generate",
    headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
    json={
        "model": "whisper",
        "audio_url": "https://example.com/audio.mp3",
        "language": "ru"
    }
)

print(response.json()["content"])
СлагНазваниеТарифСтоимость
whisperWhisper STTStarter2 ткн
gpt-4o-transcribeGPT-4o TranscribeBasic+2 ткн
elevenlabs-scribeEL ScribeBasic+2 ткн

Генерация музыки

Две модели для разных задач:
СлагПровайдерТарифСтоимостьДля чего
musicgenReplicateStarter9 ткнБыстрые наброски, без подписки
elevenlabs-musicElevenLabsBasic+58 ткнПрофессиональное качество, длинные треки

MusicGen (Replicate)

response = requests.post(
    "https://neuralbox.top/api/v2/generate",
    headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
    json={
        "model": "musicgen",
        "prompt": "Спокойный lo-fi хип-хоп, треск винила, фортепиано, 80 BPM",
        "duration": 30
    }
)

ElevenLabs Music

response = requests.post(
    "https://neuralbox.top/api/v2/generate",
    headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
    json={
        "model": "elevenlabs-music",
        "prompt": "Эпическая оркестровая киномузыка, нарастающее напряжение, полные струнные",
        "duration": 60
    }
)

Советы по промптам

ЭлементПримеры
Жанрlo-fi хип-хоп, киноркестр, электронный хаус, акустик фолк
Инструментыфортепиано, электрогитара, синтезатор, скрипка, барабаны
Темп80 BPM, быстрый, медленный и мелодичный
Настроениеэнергичный, меланхоличный, воодушевляющий, напряжённый, расслабляющий