maxframe.learn.contrib.llm.multi_modal.embed#

maxframe.learn.contrib.llm.multi_modal.embed(data, model: MultiModalEmbeddingModel, input, simple_output: bool = False, params: Dict[str, Any] | None = None, **kw)[源代码]#

使用多模态 embedding 模型对多模态输入生成 embedding。

参数:
  • data (DataFrame or Series) -- 用于按行渲染 embedding 请求的输入数据。

  • model (MultiModalEmbeddingModel) -- 多模态 embedding 模型实例。

  • input (list or ContentPart) -- 多模态输入模板。值可以包含引用 data 中列的占位符。模板会逐行渲染,并作为该行的一条多模态 embedding 输入发送。

  • simple_output (bool, default False) -- 当模型 executor 支持时,是否直接返回 embedding 向量,而不是原始 provider 响应。

  • params (dict, optional) -- 额外 embedding 参数。

返回:

包含 responsesuccess 列的 DataFrame。失败请求会将错误信息写入 response

返回类型:

DataFrame

示例

>>> from maxframe.learn.contrib.llm import ContentPart, ImageContentType
>>> input = [
...     ContentPart.text("Represent this product image."),
...     ContentPart.image(
...         data=df.image_url,
...         type=ImageContentType.IMAGE_URL,
...     ),
... ]
>>> result = model.embed(df, input=input, simple_output=True)