图像分类与 OCR 服务

图像分类与 OCR 服务接口

部署环境: 测试, 生产

测试环境目录：10.182.17.2：/data1/tlw/image_classification

模型训练目录：10.182.17.2：/data1/tlw/timm

生产环境目录：10.51.0.1：/data/image_classification

测试环境启动命令：

OCR模型启动：

screen -r HunyuanOCR_1

CUDA_VISIBLE_DEVICES=0 vllm serve /data1/models/HunyuanOCR     --host 0.0.0.0     --port 8001     --served-model-name HunyuanOCR     --no-enable-prefix-caching     --mm-processor-cache-gb 0     --gpu-memory-utilization 0.2

Ctrl +a +d

screen -r HunyuanOCR_2

CUDA_VISIBLE_DEVICES=1 vllm serve /data1/models/HunyuanOCR     --host 0.0.0.0     --port 8002     --served-model-name HunyuanOCR     --no-enable-prefix-caching     --mm-processor-cache-gb 0     --gpu-memory-utilization 0.2

Ctrl +a +d

负载均衡端口：8000

图像分类和主入口启动：

nohup uvicorn app:app --host 0.0.0.0 --port 8005 --workers 1 > logs/app.log 2>&1 &

生产环境启动命令：

OCR模型启动：

screen -r HunyuanOCR_1

 CUDA_VISIBLE_DEVICES=2 vllm serve /data/models/HunyuanOCR --host 0.0.0.0 --port 8001 --served-model-name HunyuanOCR --no-enable-prefix-caching  --mm-processor-cache-gb 0 --gpu-memory-utilization 0.45 --enable-log-requests --enable-log-outputs

Ctrl +a +d

screen -r HunyuanOCR_2

 CUDA_VISIBLE_DEVICES=3 vllm serve /data/models/HunyuanOCR --host 0.0.0.0 --port 8002 --served-model-name HunyuanOCR --no-enable-prefix-caching  --mm-processor-cache-gb 0 --gpu-memory-utilization 0.45 --enable-log-requests --enable-log-outputs

Ctrl +a +d

图像分类和主入口启动：

nohup uvicorn app:app --host 0.0.0.0 --port 8005 --workers 1 > logs/app.log 2>&1 &

负载均衡端口：8003

接口：

图片分类：POST /predict
OCR： POST /HunyuanOCR

请求参数

Body 参数application/json必填

示例

图片分类OCR

{
  "image_list": [
    {
      "image_seq": "唯一标识或业务序号",
      "image_url": "https://example.com/image.jpg"
    },
    {
      "image_seq": "另一张",
      "image_base64": "data:image/jpeg;base64,/9j/4AAQ..."
    }
  ]
}

请求示例代码

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

返回响应

🟢200成功

application/json

Body

示例

图像分类OCR

{
    "image_category_list": [
        {
            "image_seq": "唯一标识或业务序号",
            "image_category": "business_license"
        },
        {
            "image_seq": "另一张",
            "image_category": "其他"
        }
    ]
}

图像分类与 OCR 服务