近日,斯坦福大學發布關于 Paper2Agent 的論文,探索將學術論文轉換為 AI Agent的自動化框架。
傳統的研究論文需要讀者投入大量精力去理解論文的代碼、數據和方法,并將其應用到自己的工作中,這給論文的傳播和重用帶來了障礙。Paper2Agent 將研究成果從被動的產物轉化為主動的系統,從而加速研究的使用、采用和發現。
斯坦福研究團隊使用多個 Agent 系統地分析論文及其相關代碼庫,構建模型上下文協議 (MCP) 服務器,然后迭代生成并運行測試,以優化和增強生成的 MCP。這些論文 MCP 可以靈活地連接到聊天代理(例如 Claude Code),通過自然語言執行復雜的科學查詢,同時調用原始論文中的工具和工作流程。
Paper2Agent 創建了一個利用 AlphaGenome 解析基因組變異的代理,以及基于 ScanPy 和 TISSUE 進行單細胞和空間轉錄組學分析的 Agent。這些 Agent 能夠重現原始論文的結果,并能正確執行用戶提出的新問題。通過將靜態論文轉化為動態、交互式的 AI 代理,Paper2Agent 為知識傳播引入了一種新的范式,并為 AI 合作科學家的協作生態系統奠定了基礎。
自動化的工作流程
Paper2Agent 將靜態論文轉化成動態的 AI Agent,使每個 Agent 都充當相應論文的互動專家,能夠演示、應用并調整其方法以應用于新項目。
其工作流程如下:
Paper2Agent 通過構建包含工具、資源和提示的遠程 MCP 服務器,將研究論文轉化為交互式 AI 代理。將 AI 代理連接到服務器,即可創建針對不同任務的論文專用代理;
Paper2Agent 通過提取代碼庫,然后設置自動化環境以實現可重復性。核心分析功能被包裝為 MCP 工具,然后通過迭代測試進行驗證。最終生成的 MCP 服務器被遠程部署并與 AI 代理集成,從而實現與論文方法和分析的自然語言交互。
轉換過程包括:
識別論文的關鍵貢獻(數據集、方法、模型或工作流);
通過 MCP 服務器封裝這些貢獻,定義輸入、輸出和使用說明;
將 MCP 服務器連接到基于 LLM 的代理,實現自然語言查詢和自主執行。然后,用戶可以通過提問、請求演示或將方法應用于新數據來與論文進行交互。
與之前的研究相比,Paper2Agent 將研究成果從編碼知識的文檔或代碼庫轉變為可執行和對話的知識實體。
三個研究案例
AlphaGenome 基因組數據解釋 Agent
AlphaGenome 是一個人工智能模型,旨在預測人類 DNA 序列中單核苷酸變異或突變對各種調控過程的影響。Paper2Agent 將 AlphaGenome 論文轉化為一個交互式 AlphaGenome Agent,從而實現基因組數據的自動解讀。
通過自然語言查詢,用戶可以利用該代理對疾病相關變異的致病基因進行優先級排序,闡明單個變異的調控影響,并為具有特定調控功能的合成 DNA 的設計提供參考。
用于不確定性感知單細胞空間轉錄組學分析的 TISSUE Agent
TISSUE 是一篇近期發表的論文,它開發了一種新的不確定性感知單細胞空間轉錄組學分析方法。Paper2Agent 通過為各種論文自動生成即用型代理,并提供問答支持來指導輸入準備并闡明該方法的功能,從而解決了這些挑戰。
用于單細胞數據預處理的 Scanpy Agent
Scanpy 是一個廣泛使用的綜合軟件包,用于分析大規模單細胞轉錄組數據。在實踐中,單細胞數據分析中的許多工作流程可能僅依賴于 Scanpy 的部分功能。為了解決這個問題,Paper2Agent 不僅支持將整個方法轉換為工具,還支持將論文方法的特定部分轉換為工具,從而使 AI 代理能夠僅顯示與給定分析最相關的功能。
限制與展望
并非每篇論文都能無縫地轉化為強大的代理。如果原始代碼庫不完整、文檔記錄不全或包含未解決的錯誤,Paper2Agent 就無法可靠地將其轉化為功能強大的工具。
為了更好地量化這種可重復性和智能體的易用性,斯坦福團隊引入了一種基準測試方法,該方法基于論文中手動評估的示例以及旨在測試泛化能力的新示例。這種方法可以證明 AlphaGenome 智能體能夠以 100% 的準確率執行基于教程的查詢和新查詢。然而,這種方法受限于專家對論文和方法的了解以及手動執行和審查。未來的方向是通過額外的智能體框架(例如 LLM-as-judge 評估)進一步簡化這一流程。
另一個限制因素是代理化的規模。論文并不是 Agent 化的最佳單位,每篇論文都會帶來改進、基準或應用。在這種情況下,最有用的 Agent 可能并非代表一篇論文,而是一系列相關研究成果的集合。這些研究成果被聚合成一個連貫的界面,一個 MCP 可以封裝多篇相關論文。基于這個因素,團隊未來還計劃擴展 Paper2Agent,以靈活地適應更廣泛的應用范圍。
最后,一旦知識被編碼到主動代理而非靜態構件中,其潛力將超越個人用途。代理之間可以相互交互,將方法與數據集關聯,或整合來自不同領域的洞見。Paper2Agent 對未來的洞見是:科學交流不僅在于描述結果,還在于創建能夠體現和擴展研究成果的交互式協作實體。
更多技術細節請查閱論文:https://arxiv.org/pdf/2509.06917