apify-ultimate-scraper

Compare original and translation side by side

🇺🇸

Original

English

🇨🇳

Translation

Chinese

Universal Web Scraper

通用网页爬虫

AI-driven data extraction from 55+ Actors across all major platforms. This skill automatically selects the best Actor for your task.

基于AI驱动，可通过55+个Actor从所有主流平台提取数据，该工具会自动为你的任务选择最合适的Actor。

Prerequisites

前置条件

(No need to check it upfront)

```
.env
```
file with
```
APIFY_TOKEN
```
Node.js 20.6+ (for native
```
--env-file
```
support)
```
mcpc
```
CLI tool:
```
npm install -g @apify/mcpc
```

（无需提前检查）

包含
```
APIFY_TOKEN
```
的
```
.env
```
文件
Node.js 20.6+（用于支持原生
```
--env-file
```
参数）
```
mcpc
```
CLI工具：
```
npm install -g @apify/mcpc
```

Workflow

工作流程

Copy this checklist and track progress:

Task Progress:
- [ ] Step 1: Understand user goal and select Actor
- [ ] Step 2: Fetch Actor schema via mcpc
- [ ] Step 3: Ask user preferences (format, filename)
- [ ] Step 4: Run the scraper script
- [ ] Step 5: Summarize results and offer follow-ups

复制以下检查清单跟踪进度：

任务进度:
- [ ] 步骤1：理解用户需求并选择Actor
- [ ] 步骤2：通过mcpc获取Actor schema
- [ ] 步骤3：询问用户偏好（格式、文件名）
- [ ] 步骤4：运行爬虫脚本
- [ ] 步骤5：总结结果并提供后续建议

Step 1: Understand User Goal and Select Actor

步骤1：理解用户需求并选择Actor

First, understand what the user wants to achieve. Then select the best Actor from the options below.

首先明确用户想要实现的目标，然后从以下选项中选择最合适的Actor。

Instagram Actors (12)

Instagram Actors（12个）

Actor ID	Best For
`apify/instagram-profile-scraper`	Profile data, follower counts, bio info
`apify/instagram-post-scraper`	Individual post details, engagement metrics
`apify/instagram-comment-scraper`	Comment extraction, sentiment analysis
`apify/instagram-hashtag-scraper`	Hashtag content, trending topics
`apify/instagram-hashtag-stats`	Hashtag performance metrics
`apify/instagram-reel-scraper`	Reels content and metrics
`apify/instagram-search-scraper`	Search users, places, hashtags
`apify/instagram-tagged-scraper`	Posts tagged with specific accounts
`apify/instagram-followers-count-scraper`	Follower count tracking
`apify/instagram-scraper`	Comprehensive Instagram data
`apify/instagram-api-scraper`	API-based Instagram access
`apify/export-instagram-comments-posts`	Bulk comment/post export

Actor ID	适用场景
`apify/instagram-profile-scraper`	账号资料、粉丝数、简介信息
`apify/instagram-post-scraper`	单条帖子详情、互动指标
`apify/instagram-comment-scraper`	评论提取、情感分析
`apify/instagram-hashtag-scraper`	标签内容、热门话题
`apify/instagram-hashtag-stats`	标签表现指标
`apify/instagram-reel-scraper`	Reels内容和指标
`apify/instagram-search-scraper`	搜索用户、地点、标签
`apify/instagram-tagged-scraper`	被特定账号标记的帖子
`apify/instagram-followers-count-scraper`	粉丝数跟踪
`apify/instagram-scraper`	全量Instagram数据
`apify/instagram-api-scraper`	基于API的Instagram访问
`apify/export-instagram-comments-posts`	批量导出评论/帖子

Facebook Actors (14)

Facebook Actors（14个）

Actor ID	Best For
`apify/facebook-pages-scraper`	Page data, metrics, contact info
`apify/facebook-page-contact-information`	Emails, phones, addresses from pages
`apify/facebook-posts-scraper`	Post content and engagement
`apify/facebook-comments-scraper`	Comment extraction
`apify/facebook-likes-scraper`	Reaction analysis
`apify/facebook-reviews-scraper`	Page reviews
`apify/facebook-groups-scraper`	Group content and members
`apify/facebook-events-scraper`	Event data
`apify/facebook-ads-scraper`	Ad creative and targeting
`apify/facebook-search-scraper`	Search results
`apify/facebook-reels-scraper`	Reels content
`apify/facebook-photos-scraper`	Photo extraction
`apify/facebook-marketplace-scraper`	Marketplace listings
`apify/facebook-followers-following-scraper`	Follower/following lists

Actor ID	适用场景
`apify/facebook-pages-scraper`	主页数据、指标、联系方式
`apify/facebook-page-contact-information`	主页关联的邮箱、电话、地址
`apify/facebook-posts-scraper`	帖子内容和互动数据
`apify/facebook-comments-scraper`	评论提取
`apify/facebook-likes-scraper`	反应分析
`apify/facebook-reviews-scraper`	主页评论
`apify/facebook-groups-scraper`	群组内容和成员
`apify/facebook-events-scraper`	活动数据
`apify/facebook-ads-scraper`	广告素材和定向设置
`apify/facebook-search-scraper`	搜索结果
`apify/facebook-reels-scraper`	Reels内容
`apify/facebook-photos-scraper`	图片提取
`apify/facebook-marketplace-scraper`	Marketplace商品列表
`apify/facebook-followers-following-scraper`	粉丝/关注列表

TikTok Actors (14)

TikTok Actors（14个）

Actor ID	Best For
`clockworks/tiktok-scraper`	Comprehensive TikTok data
`clockworks/free-tiktok-scraper`	Free TikTok extraction
`clockworks/tiktok-profile-scraper`	Profile data
`clockworks/tiktok-video-scraper`	Video details and metrics
`clockworks/tiktok-comments-scraper`	Comment extraction
`clockworks/tiktok-followers-scraper`	Follower lists
`clockworks/tiktok-user-search-scraper`	Find users by keywords
`clockworks/tiktok-hashtag-scraper`	Hashtag content
`clockworks/tiktok-sound-scraper`	Trending sounds
`clockworks/tiktok-ads-scraper`	Ad content
`clockworks/tiktok-discover-scraper`	Discover page content
`clockworks/tiktok-explore-scraper`	Explore content
`clockworks/tiktok-trends-scraper`	Trending content
`clockworks/tiktok-live-scraper`	Live stream data

Actor ID	适用场景
`clockworks/tiktok-scraper`	全量TikTok数据
`clockworks/free-tiktok-scraper`	免费TikTok数据提取
`clockworks/tiktok-profile-scraper`	账号资料
`clockworks/tiktok-video-scraper`	视频详情和指标
`clockworks/tiktok-comments-scraper`	评论提取
`clockworks/tiktok-followers-scraper`	粉丝列表
`clockworks/tiktok-user-search-scraper`	按关键词查找用户
`clockworks/tiktok-hashtag-scraper`	标签内容
`clockworks/tiktok-sound-scraper`	热门音频
`clockworks/tiktok-ads-scraper`	广告内容
`clockworks/tiktok-discover-scraper`	Discover页面内容
`clockworks/tiktok-explore-scraper`	探索页内容
`clockworks/tiktok-trends-scraper`	热门内容
`clockworks/tiktok-live-scraper`	直播数据

YouTube Actors (5)

YouTube Actors（5个）

Actor ID	Best For
`streamers/youtube-scraper`	Video data and metrics
`streamers/youtube-channel-scraper`	Channel information
`streamers/youtube-comments-scraper`	Comment extraction
`streamers/youtube-shorts-scraper`	Shorts content
`streamers/youtube-video-scraper-by-hashtag`	Videos by hashtag

Actor ID	适用场景
`streamers/youtube-scraper`	视频数据和指标
`streamers/youtube-channel-scraper`	频道信息
`streamers/youtube-comments-scraper`	评论提取
`streamers/youtube-shorts-scraper`	Shorts内容
`streamers/youtube-video-scraper-by-hashtag`	按标签提取视频

Google Maps Actors (4)

Google Maps Actors（4个）

Actor ID	Best For
`compass/crawler-google-places`	Business listings, ratings, contact info
`compass/google-maps-extractor`	Detailed business data
`compass/Google-Maps-Reviews-Scraper`	Review extraction
`poidata/google-maps-email-extractor`	Email discovery from listings

Actor ID	适用场景
`compass/crawler-google-places`	商家列表、评分、联系方式
`compass/google-maps-extractor`	详细商家数据
`compass/Google-Maps-Reviews-Scraper`	评论提取
`poidata/google-maps-email-extractor`	从列表中挖掘邮箱

Other Actors (6)

其他Actors（6个）

Actor ID	Best For
`apify/google-search-scraper`	Google search results
`apify/google-trends-scraper`	Google Trends data
`voyager/booking-scraper`	Booking.com hotel data
`voyager/booking-reviews-scraper`	Booking.com reviews
`maxcopell/tripadvisor-reviews`	TripAdvisor reviews
`vdrmota/contact-info-scraper`	Contact enrichment from URLs

Actor ID	适用场景
`apify/google-search-scraper`	Google搜索结果
`apify/google-trends-scraper`	Google Trends数据
`voyager/booking-scraper`	Booking.com酒店数据
`voyager/booking-reviews-scraper`	Booking.com评论
`maxcopell/tripadvisor-reviews`	TripAdvisor评论
`vdrmota/contact-info-scraper`	从URL补充联系信息

Actor Selection by Use Case

按使用场景选择Actor

Use Case	Primary Actors
Lead Generation	`compass/crawler-google-places` , `poidata/google-maps-email-extractor` , `vdrmota/contact-info-scraper`
Influencer Discovery	`apify/instagram-profile-scraper` , `clockworks/tiktok-profile-scraper` , `streamers/youtube-channel-scraper`
Brand Monitoring	`apify/instagram-tagged-scraper` , `apify/instagram-hashtag-scraper` , `compass/Google-Maps-Reviews-Scraper`
Competitor Analysis	`apify/facebook-pages-scraper` , `apify/facebook-ads-scraper` , `apify/instagram-profile-scraper`
Content Analytics	`apify/instagram-post-scraper` , `clockworks/tiktok-scraper` , `streamers/youtube-scraper`
Trend Research	`apify/google-trends-scraper` , `clockworks/tiktok-trends-scraper` , `apify/instagram-hashtag-stats`
Review Analysis	`compass/Google-Maps-Reviews-Scraper` , `voyager/booking-reviews-scraper` , `maxcopell/tripadvisor-reviews`
Audience Analysis	`apify/instagram-followers-count-scraper` , `clockworks/tiktok-followers-scraper` , `apify/facebook-followers-following-scraper`

使用场景	首选Actor
线索生成	`compass/crawler-google-places` , `poidata/google-maps-email-extractor` , `vdrmota/contact-info-scraper`
红人挖掘	`apify/instagram-profile-scraper` , `clockworks/tiktok-profile-scraper` , `streamers/youtube-channel-scraper`
品牌监控	`apify/instagram-tagged-scraper` , `apify/instagram-hashtag-scraper` , `compass/Google-Maps-Reviews-Scraper`
竞品分析	`apify/facebook-pages-scraper` , `apify/facebook-ads-scraper` , `apify/instagram-profile-scraper`
内容分析	`apify/instagram-post-scraper` , `clockworks/tiktok-scraper` , `streamers/youtube-scraper`
趋势研究	`apify/google-trends-scraper` , `clockworks/tiktok-trends-scraper` , `apify/instagram-hashtag-stats`
评论分析	`compass/Google-Maps-Reviews-Scraper` , `voyager/booking-reviews-scraper` , `maxcopell/tripadvisor-reviews`
受众分析	`apify/instagram-followers-count-scraper` , `clockworks/tiktok-followers-scraper` , `apify/facebook-followers-following-scraper`

Multi-Actor Workflows

多Actor工作流

For complex tasks, chain multiple Actors:

Workflow	Step 1	Step 2
Lead enrichment	`compass/crawler-google-places` →	`vdrmota/contact-info-scraper`
Influencer vetting	`apify/instagram-profile-scraper` →	`apify/instagram-comment-scraper`
Competitor deep-dive	`apify/facebook-pages-scraper` →	`apify/facebook-posts-scraper`
Local business analysis	`compass/crawler-google-places` →	`compass/Google-Maps-Reviews-Scraper`

针对复杂任务，可以串联多个Actor使用：

工作流	步骤1	步骤2
线索信息补充	`compass/crawler-google-places` →	`vdrmota/contact-info-scraper`
红人资质审核	`apify/instagram-profile-scraper` →	`apify/instagram-comment-scraper`
竞品深度分析	`apify/facebook-pages-scraper` →	`apify/facebook-posts-scraper`
本地商家分析	`compass/crawler-google-places` →	`compass/Google-Maps-Reviews-Scraper`

Can't Find a Suitable Actor?

找不到合适的Actor？

If none of the Actors above match the user's request, search the Apify Store directly:

bash

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com --header "Authorization: Bearer $APIFY_TOKEN" tools-call search-actors keywords:="SEARCH_KEYWORDS" limit:=10 offset:=0 category:="" | jq -r '.content[0].text'

Replace

SEARCH_KEYWORDS

with 1-3 simple terms (e.g., "LinkedIn profiles", "Amazon products", "Twitter").

如果以上Actor都不符合用户需求，可以直接在Apify商店搜索：

bash

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com --header "Authorization: Bearer $APIFY_TOKEN" tools-call search-actors keywords:="SEARCH_KEYWORDS" limit:=10 offset:=0 category:="" | jq -r '.content[0].text'

将

SEARCH_KEYWORDS

替换为1-3个简单关键词（例如"LinkedIn profiles"、"Amazon products"、"Twitter"）。

Step 2: Fetch Actor Schema

步骤2：获取Actor Schema

Fetch the Actor's input schema and details dynamically using mcpc:

bash

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com --header "Authorization: Bearer $APIFY_TOKEN" tools-call fetch-actor-details actor:="ACTOR_ID" | jq -r ".content"

Replace

ACTOR_ID

with the selected Actor (e.g.,

compass/crawler-google-places

This returns:

Actor description and README
Required and optional input parameters
Output fields (if available)

使用mcpc动态获取Actor的输入schema和详情：

bash

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com --header "Authorization: Bearer $APIFY_TOKEN" tools-call fetch-actor-details actor:="ACTOR_ID" | jq -r ".content"

将

ACTOR_ID

替换为选中的Actor（例如

compass/crawler-google-places

）。

该命令会返回：

Actor描述和README
必填和可选输入参数
输出字段（如果有）

Step 3: Ask User Preferences

步骤3：询问用户偏好

Before running, ask:

Output format:
- Quick answer - Display top few results in chat (no file saved)
- CSV - Full export with all fields
- JSON - Full export in JSON format
Number of results: Based on character of use case

运行前请确认：

输出格式：
- 快速答复 - 在聊天中展示前几条结果（不保存文件）
- CSV - 全量导出所有字段
- JSON - JSON格式全量导出
结果数量：根据使用场景的特点确定

Step 4: Run the Script

步骤4：运行脚本

Quick answer (display in chat, no file):

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT'

CSV:

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT' \
  --output YYYY-MM-DD_OUTPUT_FILE.csv \
  --format csv

JSON:

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT' \
  --output YYYY-MM-DD_OUTPUT_FILE.json \
  --format json

快速答复（聊天展示，不保存文件）：

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT'

CSV格式：

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT' \
  --output YYYY-MM-DD_OUTPUT_FILE.csv \
  --format csv

JSON格式：

bash

node --env-file=.env ${CLAUDE_PLUGIN_ROOT}/reference/scripts/run_actor.js \
  --actor "ACTOR_ID" \
  --input 'JSON_INPUT' \
  --output YYYY-MM-DD_OUTPUT_FILE.json \
  --format json

Step 5: Summarize Results and Offer Follow-ups

步骤5：总结结果并提供后续建议

After completion, report:

Number of results found
File location and name
Key fields available
Suggested follow-up workflows based on results:

If User Got	Suggest Next
Business listings	Enrich with `vdrmota/contact-info-scraper` or get reviews
Influencer profiles	Analyze engagement with comment scrapers
Competitor pages	Deep-dive with post/ad scrapers
Trend data	Validate with platform-specific hashtag scrapers

运行完成后，反馈以下信息：

找到的结果数量
文件路径和名称
可用的核心字段
基于结果的后续工作流建议：

如果用户获取了	下一步建议
商家列表	使用 `vdrmota/contact-info-scraper` 补充信息或获取评论
红人资料	使用评论爬虫分析互动情况
竞品页面	使用帖子/广告爬虫做深度分析
趋势数据	使用平台专属的标签爬虫验证结果

Error Handling

错误处理

APIFY_TOKEN not found

- Ask user to create

.env

with

APIFY_TOKEN=your_token

mcpc not found

- Ask user to install

npm install -g @apify/mcpc

Actor not found

- Check Actor ID spelling

Run FAILED

- Ask user to check Apify console link in error output

Timeout

- Reduce input size or increase

--timeout

APIFY_TOKEN not found

- 请用户创建包含

APIFY_TOKEN=your_token

的

.env

文件

mcpc not found

- 请用户执行安装命令

npm install -g @apify/mcpc

Actor not found

- 检查Actor ID拼写是否正确

Run FAILED

- 请用户查看错误输出中的Apify控制台链接排查问题

Timeout

- 缩小输入范围或增加

--timeout

参数值