maxframe.learn.contrib.llm.multi_modal.embed#
- maxframe.learn.contrib.llm.multi_modal.embed(data, model: MultiModalEmbeddingModel, input, simple_output: bool = False, params: Dict[str, Any] | None = None, **kw)[源代码]#
使用多模态 embedding 模型对多模态输入生成 embedding。
- 参数:
model (MultiModalEmbeddingModel) -- 多模态 embedding 模型实例。
input (list or ContentPart) -- 多模态输入模板。值可以包含引用
data中列的占位符。模板会逐行渲染,并作为该行的一条多模态 embedding 输入发送。simple_output (bool, default False) -- 当模型 executor 支持时,是否直接返回 embedding 向量,而不是原始 provider 响应。
params (dict, optional) -- 额外 embedding 参数。
- 返回:
包含
response和success列的 DataFrame。失败请求会将错误信息写入response。- 返回类型:
示例
>>> from maxframe.learn.contrib.llm import ContentPart, ImageContentType >>> input = [ ... ContentPart.text("Represent this product image."), ... ContentPart.image( ... data=df.image_url, ... type=ImageContentType.IMAGE_URL, ... ), ... ] >>> result = model.embed(df, input=input, simple_output=True)