FindSkills

Ms Qwen Vl

调用魔搭社区(ModelScope)Qwen3-VL 多模态 API 进行视觉解析。使用 OpenAI SDK 兼容方式调用,支持图片内容描述、OCR 文字提取、视觉问答、对象检测等功能。用户提到"魔搭"、"ModelScope"、"Qwen-VL"、"多模态视觉"、"解析图片"等关键词时应触发。

作者 clawhub 社区 来源: clawhub
质量: 中等 安全: 社区 分类: 媒体 更新时间: 2026-02-15
在 ClawHub 上查看 JSON API

媒体分类的相关技能

bilibili-cli
A CLI for Bilibili — browse videos, users, favorites from the terminal 📺
ppt-svg-generator
ppt-svg-generator 是一个 Skill,帮助你将 Markdown 文稿快速转化PPT 或 PDF,并支持多种预设风格选择,效果美观且可控。 使...
video-podcast-maker
Automated video podcast creation skill
translate-book
Claude Code skill that translates entire books (PDF/DOCX/EPUB) into any language...
call
Skill to talk to Claude about your projects over the phone
bilibili-cli
A CLI for Bilibili — browse videos, users, search, and feeds from the terminal

查看全部媒体技能