Search Results: golden-dataset

Found 6 Skills

AI & Machine Learningyonatangross/orchestkit

golden-dataset-validation

Use when validating golden dataset quality. Runs schema checks, duplicate detection, and coverage analysis to ensure dataset integrity for AI evaluation.

🇺🇸|EnglishTranslated

AI & Machine Learningyonatangross/orchestkit

golden-dataset

Golden dataset lifecycle patterns for curation, versioning, quality validation, and CI integration. Use when building evaluation datasets, managing dataset versions, validating quality scores, or integrating golden tests into pipelines.

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learningyonatangross/orchestkit

golden-dataset-management

Use when backing up, restoring, or validating golden datasets. Prevents data loss and ensures test data integrity for AI/ML evaluation systems.

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learningyonatangross/orchestkit

golden-dataset-curation

Use when creating or improving golden datasets for AI evaluation. Defines quality criteria, curation workflows, and multi-agent analysis patterns for test data.

🇺🇸|EnglishTranslated

Data Processingyonatangross/orchestkit

add-golden

Adds documents to golden dataset with validation. Use when curating test data or saving examples.

🇺🇸|EnglishTranslated

1 scripts/Checked

AI & Machine Learningbagelhole/devops-security...

agent-evals

Build automated evaluation suites for AI agents using golden datasets, rubrics, and regression gates.

🇺🇸|EnglishTranslated