<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 設計應用 > 如何利用 OpenVINO? 在本地運行 Qwen 2.5-VL 系列模型

如何利用 OpenVINO? 在本地運行 Qwen 2.5-VL 系列模型

作者：楊亦誠時(shí)間：2025-03-11 來(lái)源：OpenVINO 中文社區

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

近期阿里通義實(shí)驗室在 Hugging Face 和 ModelScope 上開(kāi)源了 Qwen2.5-VL 的 Base 和 Instruct 模型，包含 3B、7B 和 72B 在內的 3 個(gè)模型尺寸。其中，Qwen2.5-VL-7B-Instruct 在多個(gè)任務(wù)中超越了 GPT-4o-mini，而 Qwen2.5-VL-3B 作為端側 AI 的潛力股，甚至超越了之前版本的Qwen2-VL 7B 模型。Qwen2.5-VL 增強了模型對時(shí)間和空間尺度的感知能力，在空間維度上，Qwen2.5-VL 不僅能夠動(dòng)態(tài)地將不同尺寸的圖像轉換為不同長(cháng)度的 token，使用圖像的實(shí)際尺寸來(lái)表示檢測框和點(diǎn)等坐標，這也使得Qwen2.5-VL模型可以直接作為一個(gè)視覺(jué) Agent，推理并動(dòng)態(tài)地使用工具，具備了使用電腦和使用手機的能力。

本文引用地址：http://dyxdggzs.com/article/202503/467901.htm

本文將分享如何利用英特爾 OpenVINO? 工具套件在本地加速Qwen2.5-VL系列模型的推理任務(wù)。

內容列表

1.環(huán)境準備

2.模型下載和轉換

3.加載模型

4.準備模型輸入

5.運行圖像理解任務(wù)

1 環(huán)境準備

該示例基于Jupyter Notebook編寫(xiě)，因此我們需要準備好相對應的Python環(huán)境?；A環(huán)境可以參考以下鏈接安裝，并根據自己的操作系統進(jìn)行選擇具體步驟。

https://github.com/openvinotoolkit/openvino_notebooks?tab=readme-ov-file#-getting-started

圖：基礎環(huán)境安裝導航頁(yè)面

此外本示例將依賴(lài)qwen-vl-utils以及optimum-intel組件，其中安裝optimum-intel過(guò)程中將自動(dòng)安裝OpenVINO? runtime, NNCF及Transformers等相關(guān)依賴(lài)庫。

2 模型下載和轉換

這一步中，我們需要完成將Qwen2.5-VL .safetensor格式模型轉化為OpenVINO? IR格式，并對其進(jìn)行INT4權重量化，實(shí)現對模型體積的壓縮。為了達到這一目的，optimum-intel提供了命令行工具：optimum-cli，基于該工具，我們只需一行命令便可實(shí)現上述步驟：

 optimum-cli export openvino --model Qwen/Qwen2.5-VL-3B-Instruct Qwen2.5-VL-3B-Instruct/INT4 --weight-format int4

其中“—model”參數后的“Qwen/Qwen2.5-VL-3B-Instruct”為模型在HuggingFace上的model id，這里我們也提前下載原始模型，并將model id替換為原始模型的本地路徑，針對國內開(kāi)發(fā)者，推薦使用ModelScope魔搭社區作為原始模型的下載渠道，具體加載方式可以參考ModelScope官方指南：https://www.modelscope.cn/docs/models/download

3 加載模型

接下來(lái)需要完成對模型推理任務(wù)的初始化，并將模型載入到指定硬件的內存中，同樣的，我們可以利用optimum-intel封裝好的OpenVINO? 視覺(jué)多模態(tài)任務(wù)對象 OVModelForVisualCausalLM 對象完成該操作。

from optimum.intel.openvino import OVModelForVisualCausalLM
model = OVModelForVisualCausalLM.from_pretrained(model_dir, device.value)

如示例代碼所示，通過(guò)OVModelForVisualCausalLM的from_pretrained函數接口，可以很方便地根據用戶(hù)提供的模型路徑，將模型載入到指定的硬件平臺，完成視覺(jué)多模態(tài)任務(wù)的初始化。

4 準備模型輸入

第四步需要根據Qwen2.5-VL模型要求的prompt template準備模型的輸入數據。數據格式如下：

messages = [
    {
        "role": "user",
        "content": [
            {
                "type": "image",
                "image": f"file://{example_image_path}",
            },
            {"type": "text", "text": question},
        ],
    }
]

其中:

■ “role“字段用于指定對話(huà)角色，包括system, user以及assistant三種類(lèi)型；

■ "content"字段表示對話(huà)角色輸出的內容，其中”type”為內容類(lèi)別，包含image，video，text三種類(lèi)型，支持多張image輸入。

接下來(lái)可以通過(guò)Qwen官方提供的方法將用戶(hù)輸入的text和image編碼為模型的輸入tensor。

text = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
image_inputs, video_inputs = process_vision_info(messages)
inputs = processor(
    text=[text],
    images=image_inputs,
    videos=video_inputs,
    padding=True,
    return_tensors="pt",
)

5 運行圖像理解任務(wù)

最后一步需要調用模型對象的generation函數，進(jìn)行答案生成，這里可以通過(guò)添加TextStreamer迭代器的方式，在命令行中流式輸出文本內容。

from transformers import TextStreamer
generated_ids = model.generate(**inputs, max_new_tokens=100, streamer=TextStreamer(processor.tokenizer, skip_prompt=True, skip_special_tokens=True))

根據示例圖片生成生成對話(huà)內容如下所示：

Question:

Describe this image.

Answer:

The image depicts a serene beach scene at sunset. A person is sitting on the sandy beach, facing a light-colored dog, likely a Labrador Retriever, which is also sitting and facing the person. The dog appears to be wearing a harness with a leash attached, suggesting that it might be a pet. The person is dressed in a plaid shirt and shorts, and they are smiling, indicating a happy and relaxed moment. The background shows the ocean with gentle waves and the sun setting, casting

圖：Gradio示例界面

6 總結

Qwen2.5-VL 系列模型的發(fā)布帶來(lái)了更精準的視覺(jué)定位，文字理解以及Agent智能體能力。OpenVINO? 則可以以更低的資源占用，高效地在本地運行Qwen2.5-VL視覺(jué)多模態(tài)模型，激發(fā)AIPC異構處理器的潛能。相信構建面向桌面操作系統的本地智能體應用已不再遙遠。

參考示例

https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/qwen2.5-vl

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： Qwen openvino 模型

評論

相關(guān)推薦

手電筒控制模型電動(dòng)機電路

設計方案手電筒控制模型電動(dòng)機 | 2009-07-06

OpenAI新模型GPT-5或將無(wú)緣明年發(fā)布

OpenAI 模型 GPT-5 | 2024-12-24

實(shí)驗24洗衣機模型

資源下載洗衣機模型 | 2007-04-20

PWM放大器模型和波形

設計方案放大器模型波形 | 2009-07-06

ARM發(fā)布全新快速虛擬原型模型，加快軟件開(kāi)發(fā)

yongzhe | 2005-10-19

不僅僅是我們：AI 模型也在與過(guò)度思考作斗爭

智能計算推理模型計算成本 AI 模型 | 2025-03-07

IGBT的VCR(壓控電阻)等效電路模型

設計方案壓控電阻等效電路模型 | 2009-07-06

[原創(chuàng )]使用UML工具創(chuàng )建計數器的例子(2)模型仿真

newcore | 2004-03-16

谷歌DeepMind發(fā)布Genie 2模型可一鍵生成超逼真3D互動(dòng)世界

智能計算谷歌 DeepMind Genie 2 模型 3D 互動(dòng)世界 | 2024-12-05

BodeCAD(Linear)

資源下載 BodeCAD 放大器仿真 Spice 模型 | 2007-02-09

讓AI用視覺(jué)認識世界，豆包發(fā)布并開(kāi)源VideoWorld視頻生成模型

智能計算 VideoWorld 模型機器視覺(jué) | 2025-02-11

研華AIR-030部署DeepSeek R1，開(kāi)啟邊緣智能新探索！

嵌入式系統邊緣計算 DeepSeek 模型 | 2025-02-11

跨多個(gè)數據中心和 GPU 架構訓練生成式 AI 模型

智能計算數據中心 GPU 生成式AI 模型 | 2024-09-30

李彥宏迪拜最新講話(huà)：創(chuàng )新的本質(zhì)就是更低的成本（附實(shí)錄）

汽車(chē)電子自動(dòng)駕駛蘿卜快跑模型 | 2025-02-12

H.264的碼率控制策略

Naiqa | 2005-10-10

第五部分：OPENVINO如何配合DevCloud開(kāi)發(fā)

視頻 Intel OPENVINO | 2020-08-04

研華正式發(fā)布國產(chǎn)化昇騰AI Box與Deepseek R1模型部署全流程！

嵌入式系統昇騰邊緣AI 模型 | 2025-02-20

第三部分：基于VPU和FPG應用OPENVINO

視頻 Intel OPENVINO | 2020-08-04

功率變換器建模技術(shù)綜述+

資源下載模型等效電路傳輸線(xiàn) 功率因素校正離散 | 2007-02-16

管理科學(xué)-運籌學(xué)：戰略角度的審視.rar

資源下載管理科學(xué) 運籌學(xué) 戰略管理科學(xué) 模型序貫決策分析同步思考模擬未來(lái) 決策者競爭 | 2009-03-18

[轉帖]I-Logix: 模型驅動(dòng)開(kāi)發(fā)理應有測試的一席之地

newcore | 2004-03-14

第四部分：深度學(xué)習的Workbench 和Streamer

視頻 Intel OPENVINO | 2020-08-04

Apple智能與阿里達成合作，4月上線(xiàn)！

智能計算阿里蘋(píng)果 iPhone AI 大模型 Qwen | 2025-02-25

基于模型的設計迎接當今嵌入式系統設計面臨的不斷增加的挑戰

資源下載嵌入式系統設計模型 | 2007-09-15

第一部分：OPENVINO的安裝和MO

視頻 Intel OpenVINO^TM | 2020-08-03

如何利用 OpenVINO? 在本地運行 Qwen 2.5-VL 系列模型

智能計算 Qwen openvino 模型 | 2025-03-11

手電筒控制模型電動(dòng)機電路

設計方案手電筒控制模型電動(dòng)機 | 2009-07-06

ARM發(fā)布全新快速虛擬原型模型，加快軟件開(kāi)發(fā)(zz)

twentyone | 2005-06-20

第二部分：OPENVINO中的IE和 Multi Models

視頻 Intel OPENVINO | 2020-08-04

手電筒控制模型電動(dòng)機電路

設計方案手電筒控制模型電動(dòng)機 | 2009-07-06

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>