Search Results: eval-design

Found 2 Skills

AI & Machine Learningrefoundai/lenny-skills

ai-evals

Help users create and run AI evaluations. Use when someone is building evals for LLM products, measuring model quality, creating test cases, designing rubrics, or trying to systematically measure AI output quality.

🇺🇸|EnglishTranslated

AI & Machine Learningterminaluse/optimizespec

optimizespec-new

Start a repo-local OptimizeSpec self-improvement change. Use when the user wants to create evals, optimize an agent with GEPA, define an agent self-improvement loop, or begin an ASI-first evaluation workflow.

🇺🇸|EnglishTranslated