Search Results: vision-language-model

Found 5 Skills

AI & Machine Learningdavila7/claude-code-templ...

blip-2-vision-language

Vision-language pre-training framework bridging frozen image encoders and LLMs. Use when you need image captioning, visual question answering, image-text retrieval, or multimodal chat with state-of-the-art zero-shot performance.

🇺🇸|EnglishTranslated

AI & Machine Learningsickn33/antigravity-aweso...

computer-vision-expert

SOTA Computer Vision Expert (2026). Specialized in YOLO26, Segment Anything 3 (SAM 3), Vision Language Models, and real-time spatial analysis.

🇺🇸|EnglishTranslated

AI & Machine Learningaradotso/trending-skills

open-autoglm-phone-agent

Expert skill for Open-AutoGLM, an AI phone agent framework that controls Android/HarmonyOS/iOS devices via natural language using the AutoGLM vision-language model

🇺🇸|EnglishTranslated

AI & Machine Learningsundial-org/skills

tinker

Fine-tune LLMs using the Tinker API. Covers supervised fine-tuning, reinforcement learning, LoRA training, vision-language models, and both high-level Cookbook patterns and low-level API usage.

🇺🇸|EnglishTranslated

AI & Machine Learningtdimino/claude-code-minoa...

smolvlm

Local vision-language model for image analysis using SmolVLM-2B

🇺🇸|EnglishTranslated

1 scripts/Checked