自主端到端 Research Pipeline:从想法发现、实验执行、AI 审阅循环,到可提交的 PDF 论文。
npx clawhub@latest install research-pipelineResearch Pipeline 是一个自主的多阶段工作流,能够接收一个宽泛的研究方向,并将其一路推进至一篇完善的学术论文。它将三个主要工作流——想法发现、带有自动审稿循环的实验部署,以及可选的论文写作——串联成一个统一的协同流水线。研究人员可以在流水线运行实验、收集结果并迭代审稿人反馈轮次的过程中休息,醒来时便能获得一份经过评分和改进、随时可提交的草稿。
/idea-discovery、/run-experiment、/paper-writing)。按顺序编排工作流 1(/idea-discovery)、工作流 2(/run-experiment + /auto-review-loop)以及可选的工作流 3(/paper-writing)。每个工作流均生成独立的输出文件,方便您在任意阶段进行查看或恢复操作。
AUTO_PROCEED=true 会自动选择排名最高的想法并继续执行,无需等待;AUTO_PROCEED=false 则会在关卡 1 处暂停,等待用户明确确认。HUMAN_CHECKPOINT=true 会在每轮结束后显示审阅评分,让您可以在循环继续之前提供自定义修复指令。
自动审查循环支持三种对抗级别:medium(标准审查)、hard(审查员记忆 + 辩论协议)和 nightmare(GPT 通过 codex exec 直接读取代码仓库 + 记忆 + 辩论)。最多可自主运行 4 轮审查/修复循环,目标得分 ≥ 6/10。
小批量任务(≤5 个作业)通过 /run-experiment 进行调度;大规模多种子扫描任务(≥10 个作业)则路由至 /experiment-queue,并支持 OOM 重试、过期屏幕清理、阶段依赖管理以及崩溃安全状态保护。在部署前会自动检查 GPU 可用性。
当 AUTO_WRITE=true 且 VENUE 已设置时,Research Pipeline 会在第 5 阶段结束后自动调用 /paper-writing,依次执行计划 → 图表 → 写作 → 编译 → 改进循环等阶段,最终生成 paper/main.pdf。
每个阶段均生成带版本控制、记录于清单日志的输出文件:IDEA_REPORT.md、AUTO_REVIEW.md、NARRATIVE_REPORT.md,以及一份完整的 Research Pipeline Report,其中汇总了 GPU 使用时长、审查轮次、评分结果和待办事项。
将 AUTO_PROCEED=true、HUMAN_CHECKPOINT=false 设置好后,在睡前启动。Research Pipeline 会自动发现研究思路、筛选最优方案、实施实验、部署至您的 GPU 服务器,最多执行 4 轮审查与修复,并在早晨生成 NARRATIVE_REPORT.md。
将 AUTO_PROCEED=false 设置为在关卡 1 处暂停,自行审阅排名后的想法,选择或组合方案,然后批准。第 2–4 阶段随后将完全自主运行——你可以掌控研究方向,而无需全程监督实验过程。
设置 AUTO_WRITE=true 和 VENUE=NeurIPS(或 ICLR、ICML、CVPR、ACL 等)。在实验与审阅循环完成后,Research Pipeline 将自动撰写、编译并优化符合目标会议格式的 LaTeX 论文,最终生成可直接投稿的 paper/main.pdf。
将 REVIEWER_DIFFICULTY=nightmare 设置为让 GPT 直接读取代码库,并在审查轮次中应用记忆与辩论协议。当您希望在投稿至竞争激烈的会议或期刊之前获得最严苛的预提交反馈时,请使用此功能。
npx clawhub@latest install research-pipelinenpx clawhub@latest install research-pipeline登录后撰写评价
暂无评价。来分享你的使用体验吧!