Search Results: ai-red-teaming

Found 5 Skills

Security & Compliancepluginagentmarketplace/cu...

red-team-frameworks

Tools and frameworks for AI red teaming including PyRIT, garak, Counterfit, and custom attack automation

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learningpluginagentmarketplace/cu...

continuous-monitoring

Real-time monitoring and detection of adversarial attacks and model drift in production

🇺🇸|EnglishTranslated

1 scripts/Checked

Security & Compliancepluginagentmarketplace/cu...

safety-filter-bypass

Techniques to test and bypass AI safety filters, content moderation systems, and guardrails for security assessment

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learningpluginagentmarketplace/cu...

input-output-guardrails

Implementing safety filters, content moderation, and guardrails for AI system inputs and outputs

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learninglebsral/dspy-programming-...

ai-testing-safety

Find every way users can break your AI before they do. Use when you need to red-team your AI, test for jailbreaks, find prompt injection vulnerabilities, run adversarial testing, do a safety audit before launch, prove your AI is safe for compliance, stress-test guardrails, or verify your AI holds up against adversarial users. Covers automated attack generation, iterative red-teaming with DSPy, and MIPROv2-optimized adversarial testing.

🇺🇸|EnglishTranslated