从任何医疗机构网站中提取结构化的医疗提供者档案——包括姓名、资质证书、专业领域、联系方式和教育背景。
npx clawhub@latest install healthcare-providers-extract系统要求
Healthcare Providers Extract 从医疗机构网站抓取并结构化从业者数据,返回网站上每位医疗服务提供者的干净数据集。对于每位提供者,它最多捕获五个字段:姓名、资质证书、专业领域、联系信息以及教育/培训经历。它支持以粘贴 URL、CSV 文件或 Google 表格作为输入——还可以通过 Google Maps 根据专业领域和位置自动发现医疗机构网站。基于 Nimble 的网络数据 API 构建,支持从单个网站到 100+ URL 的批量处理,并通过并行子代理执行实现高效运行。
healthcare-providers-enrich。healthcare-providers-verify。market-finder 或 local-places。nimble-web-expert。对于在诊所网站上找到的每位医疗提供者,Healthcare Providers Extract 最多可提取五个字段:全名、资质证书(如 MD、FACS、OD)、专业方向、联系信息(电话、预约链接、电子邮件)以及教育/培训相关内容。confidence(置信度)评分(高 / 中 / 低)用于标注每条记录的完整程度。
支持直接粘贴诊所网址、以 CSV 文件上传,或通过 Google Sheet 链接提供。如果您没有现成的网址,只需提供专科类型和地理位置,Healthcare Providers Extract 将自动通过 Google Maps 发现匹配的诊所,然后进行信息提取。
对于涵盖六个或更多诊所的任务,Healthcare Providers Extract 技能会生成并行的 nimble-researcher 子代理——每个诊所或每三个诊所一个——以确保大规模提取任务无阻塞地完成。单一诊所的运行则直接在主上下文中执行,以提高速度。
在提取之前,该技能会对每个诊疗机构的域名进行映射,使用专为医疗行业定制的关键词权重表,找到合适的页面(团队、医疗服务提供者、医生、员工),每个站点最多处理 15 个页面。这样可以避免在无关页面上浪费提取调用次数。
提供者记录会跨页面和诊所进行重复数据删除,然后根据五个字段中已填写的数量进行置信度评分。输出结果按诊所对提供者进行分组,并按置信度排序,同时附有数据质量摘要,重点标注常见的信息缺失情况。
该技能会追踪历史运行记录,并应用智能日期窗口机制:首次运行或距上次运行超过 14 天时执行完整提取,14 天内重新运行时仅进行快速刷新(仅获取新增或变更页面),若在同一天内重复运行则会显示确认提示。运行结果将保存至记忆中,以便后续执行 CSV 导出、数据丰富或分发等操作。
一支医疗器械销售团队提供了一份包含三个州80家眼科诊所URL的CSV文件。Healthcare Providers Extract 从中提取每位医疗服务提供者的姓名、资质证书、专科方向和电话号码,并返回一张按置信度排序的表格,可直接导入CRM系统。
一家医疗健康分析公司指定"佛罗里达州迈阿密的皮肤科医生"。Healthcare Providers Extract 技能通过 Google 地图发现相关诊所,解析其网站 URL,并从所有发现的站点中提取结构化的医疗服务提供者档案——无需任何手动收集 URL,即可生成完整的市场概览。
一家健康保险公司需要填充一个新的网络内目录。他们粘贴了120家签约诊所的URL;Healthcare Providers Extract 技能提取所有医疗提供者的教育和资质数据,将低置信度记录标记以供人工审核,并将结果导出为CSV文件。
一家拥有多个分院的牙科集团希望了解竞争对手的人员配置情况。他们提供了十家竞争诊所的网址;Healthcare Providers Extract 技能对每个网站进行抓取,提取医疗服务提供者的个人资料,并按诊所分组呈现资质认证和专科细分信息。
nimble:* 工具访问权限)支持网页提取、站点映射和搜索功能。通过您的 Nimble 账户配置文件获取。npx clawhub@latest install healthcare-providers-extractnpx clawhub@latest install healthcare-providers-extract系统要求
登录后撰写评价
暂无评价。来分享你的使用体验吧!