JetBrains x Codex黑客松决赛项目概览

当一个强大的编码模型进入开发者的主要工作空间时，IDE 就不再仅仅是一个编写代码的地方。它变成了一个你可以指挥智能体、观察其推理过程、管理其关注焦点，并决定何时产出成果的地方。这就是首届 JetBrains x Codex 黑客松的核心主题：在短短一个周末的时间里，参赛团队通过约 40 个提交项目，探索了在 IDE 内部原生构建 AI（而非仅仅作为插件外挂）的真正含义。六个决赛入围项目给出了极具说服力的答案。

🥇 第一名：hyperreasoning -- Aditya Mangalampalli

大多数编码智能体在调用模型时往往“孤注一掷”。正如 Aditya 所言：“大语言模型（LLM）花费了大量时间在原地打转。”Hyperreasoning 用一种更接近搜索的方法取代了单次尝试：系统会为任务草拟多种可能的方案，然后由一个经过训练的控制器决定哪些方案需要展开、哪些需要舍弃、哪些需要通过测试验证。编译器错误和失败的测试用例会反馈给控制器，用以调整其权重选择。

在 IDE 中，一个工具窗口会实时渲染搜索过程，你可以观察到控制器在做出最终决定前探索了哪些路径。该项目的核心观点是：通过这种经过验证的搜索循环，一个较小的本地模型在成本显著降低的情况下，完全可以媲美规模更大的前沿模型——而 IDE 则成为了让推理过程变得可视化、可导向的场所，而非一个只会吐出代码的“黑箱”。

🥈 第二名：Scopecreep -- Bhavik Sheoran, Kenneth Ross, Roman Javadyan, Joon Im

硬件调试通常是一项繁琐的工具切换工作：一个窗口看电路图，其他窗口开示波器和电源的厂商软件，终端连接设备，还要用表格收集结果。Scopecreep 将这些全部整合进了一个 JetBrains 工具窗口。只需给它一份电路图，智能体就能自动完成板卡测试——挑选需要测量的信号、捕获读数并生成报告。

值得关注的设计亮点是：当智能体确定需要放置探针时，会话会暂停并准确指示工程师放置的位置。工程师物理放置探针后点击“恢复”。对于真实的实验室环境来说，这是最合理的方案——在计算机可信的领域实现自动化，而在涉及物理世界的环节保持“人在回路”（human-in-the-loop）。

🥉 第三名：mesh-code -- Ayush Ojha, Coco Cao, Kush Ise, AL DRAM

如果在任务进行中更换机器，编码智能体通常会重头开始。mesh-code 通过为智能体提供项目进度共享记忆解决了这一问题——记录已尝试的内容、已决定的事项以及待办事项——这样，在某台笔记本上开始的会话可以在另一台设备上继续，并由当时可用的任何智能体接手。Codex 就是可以接入其中的智能体之一。

潜在信号 -- Periscope

长期的智能体对话会堆积冗余信息：没人需要的工具输出、死胡同、十轮对话前有用但现在无关的上下文。Periscope 基于 Wes McKinney 的开源项目 agentsview 构建，是一个 JetBrains 插件，它能逐轮显示智能体工作内存中实际填入的内容，并建议如何处理——是继续、回退到更好的分支点、压缩、分叉，还是完全移交。它适用于 Codex 和大多数其他编码智能体，且一切都在本地运行。

SecureLoop -- Abhiram Sribhashyam, Rahul Marri, Peyton Li

安全事件响应目前大多仍是“复制粘贴”：将堆栈跟踪粘贴到聊天窗口，手动解释仓库上下文，然后编写并提交一个修复方案，祈祷它没问题。SecureLoop 将其转化为 JetBrains 内部的一个受控循环。当生产环境出现故障时，智能体会收集相关代码、项目的安全规则以及依赖状态，然后要求 Codex 提供结构化的诊断和修复建议。该修复方案在开启 Pull Request 之前会先经过自动化检查。

PR 会自动开启，但合并不会。SecureLoop 会在 IDE 中呈现所有决策依据——差异对比（diff）、触发的策略、验证补丁的测试用例——供开发者批准或拒绝。正如该团队所言：“Codex 为你准备好了一切，但最终仍由人类来把关批准或驳回。”

该团队的更大愿景是引入一个 security-policy.md 文件，它与 README.md 一起存放在仓库中，明确规定项目在处理密钥、错误和风险模式时的具体规则。编码智能体在建议更改前会先读取该文件，从而将问题从“什么是好的修复方案？”转变为“在该代码库规则下，什么是可接受的修复方案？”

Pinpoint -- Het Patel

通过聊天窗口反馈前端问题往往非常模糊。“移动那个元素”或“修改那个颜色”会让智能体猜测你到底指哪个。Pinpoint 解决了这种歧义：开发者直接在实时页面上“打点”（Pin），为每个点附上评论，并将整个批次连同精确的页面上下文发送给智能体。这样智能体就能准确知道你指的是哪个元素，即便它还需要进一步判断你想做何种修改。

该项目包含两个部分：一个用于在浏览器中注释网页，另一个是桌面伴侣，用于标记屏幕上可见的任何内容——这在界面不是网页时非常有用。

决赛项目带来的启示

纵观这六个项目，一个清晰的模式浮现出来：将 Codex 嵌入 IDE 不仅仅是一种更快的代码编写方式，它构建了一个你可以观察其思维过程的推理层、一个你可以直接指挥的结构化输出引擎，并使它成为跨越硬件仪器、生产警报、共享会话状态和上下文窗口的工作流参与者。而 IDE 正是这一切汇聚的地方：可视化、可控且版本可控。

这就是这些团队利用一个周末证明的可能性，而这仅仅是一个开始。

查看完整提交画廊

分类导航