未授权
将音频文件转换为文字。支持公网 URL 或 base64 编码。
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| file | string | 是 | 音频文件,支持公网 URL 或 base64 编码 |
{
"text": "识别出的文字内容"
}
将文字转换为语音。服务端内部处理异步轮询,直接返回音频数据。
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| text | string | 是 | 要合成的文字内容 |
| speed | float | 否 | 语速倍率,默认 1.0 |
| format | string | 否 | 返回格式,"json"(默认) 或 "binary" 直接下载音频 |
format=json (默认):
{
"audio": "base64编码的音频数据"
}
format=binary:
直接返回 audio/wav 文件
分析图片内容并返回描述。支持公网 URL、base64 编码,或直接使用 multipart/form-data 上传文件。
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| image | string | 是 | 图片文件,支持公网 URL、base64 编码,或使用 multipart 直接上传 |
| prompt | string | 否 | 提示词,默认"请描述这张图片的内容" |
{
"result": "图片内容描述"
}
请描述这张图片的内容 - 通用描述这张图片里有哪些物体? - 物体识别图片中的人在做什么? - 行为分析提取图片中的文字 - OCR查询当前 API Key 的调用记录。
| 状态码 | 含义 | 说明 |
|---|---|---|
| 200 | 成功 | 请求处理成功 |
| 400 | 参数错误 | 请求参数缺失或格式不正确 |
| 401 | 未认证 | API Key 无效或已过期 |
| 429 | 限流 | 触发 RPM 或总量限制 |
| 502 | 上游错误 | 移动云服务调用失败 |