Search Results: data-quality

Found 72 Skills

geofeed-tuner

Use this skill whenever the user mentions IP geolocation feeds, RFC 8805, geofeeds, or wants help creating, tuning, validating, or publishing a self-published IP geolocation feed in CSV format. Intended user audience is a network operator, ISP, mobile carrier, cloud provider, hosting company, IXP, or satellite provider asking about IP geolocation accuracy, or geofeed authoring best practices. Helps create, refine, and improve CSV-format IP geolocation feeds with opinionated recommendations beyond RFC 8805 compliance. Do NOT use for private or internal IP address management — applies only to publicly routable IP addresses.

🇺🇸|EnglishTranslated

Data Processingmajesticlabs-dev/majestic...

great-expectations

Data validation using Great Expectations. Expectation suites, checkpoints, and data docs for pipeline monitoring.

🇺🇸|EnglishTranslated

1 scripts/Checked

Data Processingdatahub-project/datahub-s...

datahub-quality

Use this skill when the user wants to manage data quality in DataHub: create or run assertions, check assertion outcomes, raise or resolve incidents, create notification subscriptions, or diagnose health problems across their estate. Triggers on: "create assertion", "run assertion", "check quality", "data quality", "health check", "raise incident", "resolve incident", "subscribe to", "failing assertions", "active incidents", or any request involving data quality, assertions, incidents, or quality notifications.

🇺🇸|EnglishTranslated

Data Processingjackspace/claudeskillz

exploratory-data-analysis

Analyze datasets to discover patterns, anomalies, and relationships. Use when exploring data files, generating statistical summaries, checking data quality, or creating visualizations. Supports CSV, Excel, JSON, Parquet, and more.

🇺🇸|EnglishTranslated

Data Processingonewave-ai/claude-skills

data-pipeline-builder

Designs and builds ETL/ELT data pipelines. Takes data sources, destination, transformation requirements. Generates pipeline code (Python/SQL), scheduling config, error handling, monitoring setup, and data quality checks. Outputs data-pipeline-spec.md + implementation files.

🇺🇸|EnglishTranslated

Tools & Utilitiesdatadrivenconstruction/dd...

bim-consistency-checker

Check BIM model consistency: naming conventions, parameter completeness, spatial relationships, and data integrity across model elements.

🇺🇸|EnglishTranslated

Data Processinggemini-cli-extensions/dat...

data-autocleaning

Automated data quality and transformation capabilities for Dataform/dbt/BigQuery pipelines. Processes data sourced from BigQuery or Cloud Storage (GCS), applying best practices for data ingestion, movement, schema mapping, and comprehensive data cleaning.

🇺🇸|EnglishTranslated

1 scripts/Checked

Data Processingsisodiabhumca/agent-skill...

kpi-definition-consistency-checker

Vendor-neutral skill to check a KPI dictionary for conflicting definitions, grain mismatches, and missing ownership.

🇺🇸|EnglishTranslated

1 scripts/Checked

Data Processingerichowens/some_claude_sk...

data-pipeline-engineer

Expert data engineer for ETL/ELT pipelines, streaming, data warehousing. Activate on: data pipeline, ETL, ELT, data warehouse, Spark, Kafka, Airflow, dbt, data modeling, star schema, streaming data, batch processing, data quality. NOT for: API design (use api-architect), ML training (use ML skills), dashboards (use design skills).

🇺🇸|EnglishTranslated

3 scripts/Attention

Data Processingsachacoldiq/coldiq-s-gtm-...

clay-enrichment-9step

Complete 9-step Clay enrichment workflow for 90%+ data coverage plus 58 Clay templates across 8 categories. Use when building enrichment workflows, setting up Clay tables, or maximizing data quality.

🇺🇸|EnglishTranslated

Data Processingrohitg00/awesome-claude-c...

data-engineering

Data engineering patterns for ETL pipelines, data warehousing, Apache Spark, and data quality validation

🇺🇸|EnglishTranslated

AI & Machine Learningawslabs/agent-plugins

dataset-evaluation

Validates dataset formatting and quality for SageMaker model fine-tuning (SFT, DPO, or RLVR). Use when the user says "is my dataset okay", "evaluate my data", "check my training data", "I have my own data", or before starting any fine-tuning job. Detects file format, checks schema compliance against the selected model and technique, and reports whether the data is ready for training or evaluation.

🇺🇸|EnglishTranslated

1 scripts/Checked