微立顶科技

新闻资讯

创新 服务 价值

  通义千问VL模型 qwen2-vl-2b-instruct 识别传入的图片代码

发布日期:2025/5/17 0:22:52      浏览量:

通义千问VL模型 qwen2-vl-2b-instruct 识别传入的图片


import os
import requests
from dotenv import load_dotenv

load_dotenv()  # 加载 .env 文件

API_KEY = "sk-********************"
IMAGE_URL = "https://www.ffner.com/*******/uploadfile/image/20250516/20250516075712741274.png"

response = requests.post(
    "https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json",
    },
    json={
        "model": "qwen-vl-max",
        "input": {
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {"image": IMAGE_URL},
                        {"text": "这是什么?"}
                    ]
                }
            ]
        }
    }
)

print(response.json())


执行结果如下:


D:\Git\LiveTalking>python getImageContent.py
{’output’: {’choices’: [{’finish_reason’: ’stop’, ’message’: {’role’: ’assistant’, ’content’: [{’text’: ’这是一张显示在 中国社交媒体或视频平台上个人资料页面的截图。图片中的人物是刘佳,她是一位中国内地女演员,也是一级演员,并且是中国广播艺术团的成员。’}]}}]}, ’usage’: {’input_tokens_details’: {’text_tokens’: 22, ’image_tokens’: 394}, ’total_tokens’: 459, ’output_tokens’: 43, ’input_tokens’: 416, ’output_tokens_details’: {’text_tokens’: 43}, ’image_tokens’: 394, ’prompt_tokens_details’: {’cached_tokens’: 0}}, ’request_id’: ’4b0d84f6-e208-90b3-872a-73d356ecb27a’}




  业务实施流程

需求调研 →

团队组建和动员 →

数据初始化 →

调试完善 →

解决方案和选型 →

硬件网络部署 →

系统部署试运行 →

系统正式上线 →

合作协议

系统开发/整合

制作文档和员工培训

售后服务

马上咨询: 如果您有业务方面的问题或者需求,欢迎您咨询!我们带来的不仅仅是技术,还有行业经验积累。
QQ: 39764417/308460098     Phone: 13 9800 1 9844 / 135 6887 9550     联系人:石先生/雷先生