lakala
  1. 相似度模型
lakala
  • 相似度模型
    • 生产向量化模型备用节点
      POST
    • 生产向量化模型备用节点路由转发接口
      POST
    • V100向量化服务
      POST
    • bge-reranker-v2-m3
      POST
    • bge-m3
      POST
    • 文档QA全领域通用相似度模型(已弃用)
      POST
    • 旧 - 支付客服问答相似度模型 - 修
      POST
    • 通用客服问答相似度模型
      POST
    • 新 - 支付客服问答相似度模型
      POST
    • 旧 - 支付客服问答相似度模型
      POST
    • 风控客服问答相似度模型
      POST
    • 微调向量化模型
      POST
  • 分类模型
    • 新 - 意图识别多任务模型
      POST
    • 意图识别多任务模型
      POST
    • 情感分类模型
      POST
    • 新 - 风控投诉分类模型
      POST
    • 旧 - 风控投诉分类模型
      POST
  • 打分模型
    • 新 - 培训机器人打分模型
      POST
    • 新 - 培训机器人更新问答库接口
      POST
    • 旧 - 培训机器人打分模型
      POST
    • 旧 - 培训机器人更新问答库接口
      POST
  • RAG模型
    • 问题重写接口
      POST
    • RAG总接口
      POST
    • PDF文件解析
      POST
    • Redis服务
      POST
  • 质检
    • 敏感词质检
    • 新敏感词质检系统
  • 其他
    • rembg
  • 数据模型
    • 示例数据模型
      • Pet
      • Category
      • Tag
    • 相似度模型
    • 分类模型
    • RAG回调接口模型
  1. 相似度模型

生产向量化模型备用节点

POST
创建命名会话:
screen -S xinference
重新连接和启动:
screen -r xinference XINFERENCE_HOME=/data/xinference xinference-local --host 0.0.0.0 --port 9966
按 Ctrl+A+D 分离会话
注册和启动向量化模型:
xinference register --model-type embedding --file ./bge-large-zh-v1.5/custom-bge-large-zh-v1.5.json --persist --endpoint http://localhost:9966
xinference launch --model-name custom-bge-large-zh-v1.5 --model-type embedding --endpoint http://localhost:9966
查看当前运行的模型:
xinference list --endpoint http://localhost:9966
停止模型:
xinference terminate --model-uid custom-bge-large-zh-v1.5 --endpoint http://localhost:9966
测试命令:
curl -X POST "http://localhost:9966/v1/embeddings"
-H "Content-Type: application/json"
-d '{
"model": "custom-bge-large-zh-v1.5",
"input": "这是一个测试文本。"
}'

请求参数

Query 参数

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '?model= custom-bge-large-zh-v1.5& input=这是一个测试文本。'

返回响应

🟢200成功
application/json
Body

示例
{
    "object": "list",
    "model": "custom-bge-large-zh-v1.5",
    "model_replica": "custom-bge-large-zh-v1.5-0",
    "data": [
        {
            "index": 0,
            "object": "embedding",
            "embedding": [
                0.01566338539123535,
                -0.012559004127979279,
                ...
                -0.01200323086231947,
                -0.0020189371425658464,
                -0.014431706629693508
            ]
        }
    ],
    "usage": {
        "prompt_tokens": 11,
        "total_tokens": 11
    }
}
修改于 2025-10-31 09:36:46
下一页
生产向量化模型备用节点路由转发接口
Built with