corporate_spy
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
ChineseCorporate Spy Skill
企业情报Skill
This skill allows the agent to monitor and analyze official corporate announcements from Indian stock exchanges.
该Skill可让Agent监控并分析印度证券交易所的官方企业公告。
Capabilities
功能特性
- Filing Discovery: Search for latest filings for a given NSE/BSE symbol.
- PDF Extraction: Download and extract text from PDF filings.
- OCR Engine: Convert scanned image-based PDFs into searchable text using and
pytesseract.pdf2image - Smart Summarization: Distill complex legal/financial jargon into a single, punchy sentence (e.g., "BEL won a ₹500Cr order from the Ministry of Defense").
- 备案文件检索:根据指定的NSE/BSE股票代码搜索最新的备案文件。
- PDF提取:下载并提取PDF备案文件中的文本。
- OCR引擎:使用和
pytesseract将扫描版图片PDF转换为可搜索文本。pdf2image - 智能总结:将复杂的法律/金融术语提炼为简洁有力的句子(例如:“BEL获得国防部50亿卢比订单”)。
Tools & Libraries
工具与库
- ,
requestsfor scraping exchange websites.beautifulsoup4 - for OCR.
pytesseract - for converting PDF pages to images for OCR.
pdf2image - for text-based PDF extraction.
PyPDF2
- 、
requests用于爬取交易所网站数据。beautifulsoup4 - 用于OCR识别。
pytesseract - 用于将PDF页面转换为图片以进行OCR识别。
pdf2image - 用于基于文本的PDF提取。
PyPDF2
Workflow
工作流程
- Identify the company symbol.
- Fetch the latest announcements list.
- Download the relevant PDF.
- Attempt direct text extraction; if failed/empty, trigger OCR.
- Analyze the content and generate a summary.
- 确定企业股票代码。
- 获取最新公告列表。
- 下载相关PDF文件。
- 尝试直接提取文本;若失败或无内容,则触发OCR识别。
- 分析内容并生成总结。