文搜图

根据文本描述搜索互联网图片,并让模型基于搜索结果生成推荐与说明

概述

文搜图依赖百炼侧的 web_search_image 工具。Ling.AI 不会自己做图片搜索,而是把该工具原样透传给上游。当前该能力仅支持通过 Responses API 调用

适用场景

适合 PPT 配图推荐、海报灵感搜集、视觉素材问答等场景。模型会先触发 web_search_image,再根据返回的图片列表生成自然语言回复。

Responses API

/v1/responses 中,直接通过 tools 传入 web_search_image 即可。

Python
from openai import OpenAI

client = OpenAI(
    base_url="https://api.vip.lingapi.ai/v1",
    api_key="sk-xxxxxxxx"
)

response = client.responses.create(
    model="qwen3.5-plus",
    input="帮我找一张适合做 PPT 封面的科技感背景图",
    tools=[
        {"type": "web_search_image"}
    ]
)

print(response.output_text)

若需要查看工具执行细节,可遍历 response.output,其中类型可能为 web_search_image_call。如果上游返回工具统计,通常可以从 usage.x_tools.web_search_image.count 中读取调用次数。

流式输出

文搜图耗时相对较长,建议开启流式输出。流式事件中,常见的开始事件为 response.output_item.added,完成事件为 response.output_item.done,对应项类型通常是 web_search_image_call

计费说明

  • 文搜图结果会进入模型上下文,因此会增加输入 Token 成本。
  • 工具调用价格按系统内置官方默认值处理:每 1000 次 24 元
  • 当前工具计费链路已支持识别 web_search_image_call 并映射到 web_search_image 工具名称。