Speech-to-Text

curl --request POST \
  --url https://api.example.com/api/v2/stt

POST

api

stt

Speech-to-Text

curl --request POST \
  --url https://api.example.com/api/v2/stt

Multipart Request

curl -X POST https://neuralbox.top/api/v2/stt \
  -H "Authorization: Bearer nb_YOUR_API_KEY" \
  -F "audio=@recording.mp3" \
  -F "model=whisper" \
  -F "language=en"

Models

Slug	Notes	Cost
`whisper`	Fast, multilingual, 99 languages	2 tokens
`gpt-4o-transcribe`	Highest accuracy	2 tokens
`elevenlabs-scribe`	Best for meetings, supports diarization	2 tokens

Response

{
  "id": 18510,
  "status": "completed",
  "result_text": "Hello and welcome to today's episode...",
  "tokens_spent": 0,
  "processing_ms": 3420
}

Diarization (who said what)

Available with elevenlabs-scribe:

curl -X POST https://neuralbox.top/api/v2/stt \
  -H "Authorization: Bearer nb_YOUR_API_KEY" \
  -F "audio=@meeting.mp3" \
  -F "model=elevenlabs-scribe" \
  -F "diarize=true"

Response includes speaker labels: [Speaker 1]: Hello... [Speaker 2]: Hi there...

Get Generation Status AI Tools

⌘I

Getting Started

Concepts

Guides

Generate

Generations (results)

Models

User

API Keys

Assistants

Payments

Schedules

Auth

Resources

Speech-to-Text

Multipart Request

Models

Response

Diarization (who said what)

Getting Started

Concepts

Guides

Generate

Generations (results)

Models

User

API Keys

Assistants

Payments

Schedules

Auth

Resources

​Multipart Request

​Models

​Response

​Diarization (who said what)

Multipart Request

Models

Response

Diarization (who said what)