kaggle-learner

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

Kaggle Learner

Kaggle学习助手

Extract and apply knowledge from Kaggle competition winning solutions. This skill provides access to a continuously updated knowledge base of techniques, code patterns, and best practices from top Kaggle competitors.
提取并应用Kaggle竞赛获奖方案中的知识。该技能支持访问持续更新的知识库,涵盖来自Kaggle顶尖参赛者的技术、代码模式和最佳实践。

Overview

概述

Kaggle competitions are at the forefront of practical machine learning. Winning solutions often innovate with novel techniques, clever feature engineering, and optimized pipelines. This skill captures that knowledge and makes it accessible for your projects.
Kaggle竞赛处于实用机器学习的前沿。获奖方案通常包含创新技术、巧妙的特征工程和优化的工作流。该技能收集了这些知识,方便你在项目中使用。

When to Use

使用场景

Use this skill when:
  • Studying for a Kaggle competition
  • Looking for proven techniques in a specific domain (NLP, CV, etc.)
  • Need code templates for common ML tasks
  • Want to learn from competition winners
符合以下场景时可使用该技能:
  • 为参加Kaggle竞赛学习备考
  • 寻找特定领域(NLP、CV等)经过验证的技术方案
  • 需要通用ML任务的代码模板
  • 想要向竞赛获奖者学习

Knowledge Categories

知识分类

CategoryFocusDirectory
NLPText classification, NER, translation, LLM applications
references/knowledge/nlp/
CVImage classification, detection, segmentation, generation
references/knowledge/cv/
Time SeriesForecasting, anomaly detection, sequence modeling
references/knowledge/time-series/
TabularFeature engineering, traditional ML, structured data
references/knowledge/tabular/
MultimodalCross-modal tasks, vision-language models
references/knowledge/multimodal/
文件组织结构:每个竞赛一个独立的 markdown 文件,按 domain 分类到对应目录。
示例:
  • time-series/birdclef-plus-2025.md
  • nlp/aimo-2-2025.md
分类聚焦领域目录路径
NLP文本分类、命名实体识别、翻译、LLM应用
references/knowledge/nlp/
CV图像分类、检测、分割、生成
references/knowledge/cv/
时间序列预测、异常检测、序列建模
references/knowledge/time-series/
表格数据特征工程、传统ML、结构化数据
references/knowledge/tabular/
多模态跨模态任务、视觉-语言模型
references/knowledge/multimodal/
文件组织结构:每个竞赛一个独立的 markdown 文件,按 domain 分类到对应目录。
示例:
  • time-series/birdclef-plus-2025.md
  • nlp/aimo-2-2025.md

Quick Reference

快速参考

To learn from a competition:
  1. Provide the Kaggle competition URL
  2. The kaggle-miner agent will extract the winning solution
  3. Knowledge is automatically added to the relevant category
  4. 前排方案详细技术分析 (Front-runner Detailed Technical Analysis) is automatically included
To browse existing knowledge:
  • 浏览相关 domain 目录:
    references/knowledge/[domain]/
  • 每个竞赛一个独立文件,包含:
    • Competition Brief (竞赛简介)
    • 前排方案详细技术分析 (前排方案详细技术分析) ⭐
    • Code Templates (代码模板)
    • Best Practices (最佳实践)
学习某场竞赛的操作步骤:
  1. 提供Kaggle竞赛URL
  2. kaggle-miner Agent会提取获奖方案内容
  3. 知识会自动添加到对应分类下
  4. 自动包含前排方案详细技术分析内容
浏览现有知识的方式:
  • 浏览相关 domain 目录:
    references/knowledge/[domain]/
  • 每个竞赛一个独立文件,包含:
    • Competition Brief (竞赛简介)
    • 前排方案详细技术分析
    • Code Templates (代码模板)
    • Best Practices (最佳实践)

Self-Evolving

自我进化

This skill automatically updates its knowledge base when the kaggle-miner agent processes new competitions. The more you use it, the smarter it becomes.
当kaggle-miner Agent处理新竞赛时,该技能会自动更新其知识库。你使用的次数越多,它就越智能。

Knowledge Extraction Standard

知识提取标准

每次从 Kaggle 竞赛提取知识时,必须包含以下标准部分:
每次从 Kaggle 竞赛提取知识时,必须包含以下标准部分:

必需内容清单

必需内容清单

部分说明必需性
Competition Brief竞赛背景、任务描述、数据规模、评估指标✅ 必需
Original Summaries前排方案的简要概述✅ 必需
前排方案详细技术分析Top 20 方案的核心技巧和实现细节必需
Code Templates可复用的代码模板✅ 必需
Best Practices最佳实践和常见陷阱✅ 必需
Metadata数据源标签和日期✅ 必需
部分说明必需性
Competition Brief竞赛背景、任务描述、数据规模、评估指标✅ 必需
Original Summaries前排方案的简要概述✅ 必需
前排方案详细技术分析Top 20 方案的核心技巧和实现细节必需
Code Templates可复用的代码模板✅ 必需
Best Practices最佳实践和常见陷阱✅ 必需
Metadata数据源标签和日期✅ 必需

前排方案详细技术分析格式

前排方案详细技术分析格式

每个前排方案应包含:
  • 排名和团队/作者
  • 核心技巧列表 (3-6 个关键技术点)
  • 实现细节 (具体的参数、配置、数据)
示例格式:
markdown
**排名 Place - 核心技术名称 (作者)**

核心技巧:
- **技巧1**: 简短说明
- **技巧2**: 简短说明

实现细节:
- 具体参数、模型、配置
- 数据和实验结果
建议覆盖 Top 20 方案,获取更多前排选手的创新技巧
每个前排方案应包含:
  • 排名和团队/作者
  • 核心技巧列表 (3-6 个关键技术点)
  • 实现细节 (具体的参数、配置、数据)
示例格式:
markdown
**排名 Place - 核心技术名称 (作者)**

核心技巧:
- **技巧1**: 简短说明
- **技巧2**: 简短说明

实现细节:
- 具体参数、模型、配置
- 数据和实验结果
建议覆盖 Top 20 方案,获取更多前排选手的创新技巧

Additional Resources

额外资源

Knowledge Directories

知识目录

  • references/knowledge/nlp/
    - NLP competition techniques
  • references/knowledge/cv/
    - Computer vision techniques
  • references/knowledge/time-series/
    - Time series methods
  • references/knowledge/tabular/
    - Tabular data approaches
  • references/knowledge/multimodal/
    - Multimodal solutions
  • references/knowledge/nlp/
    - NLP竞赛技术
  • references/knowledge/cv/
    - 计算机视觉技术
  • references/knowledge/time-series/
    - 时间序列方法
  • references/knowledge/tabular/
    - 表格数据处理方案
  • references/knowledge/multimodal/
    - 多模态解决方案

Competition Examples

竞赛示例

  • BirdCLEF+ 2025 (
    time-series/birdclef-plus-2025.md
    ) - 包含完整的 Top 14 前排方案详细技术分析
  • BirdCLEF 2024 (
    time-series/birdclef-2024.md
    ) - 包含 Top 3 方案详细技术分析
  • AIMO-2 (
    nlp/aimo-2-2025.md
    ) - 包含 Top 12+ 前排方案技术总结
  • BirdCLEF+ 2025 (
    time-series/birdclef-plus-2025.md
    ) - 包含完整的 Top 14 前排方案详细技术分析
  • BirdCLEF 2024 (
    time-series/birdclef-2024.md
    ) - 包含 Top 3 方案详细技术分析
  • AIMO-2 (
    nlp/aimo-2-2025.md
    ) - 包含 Top 12+ 前排方案技术总结