Posts
All the articles I've posted.
-
pi:一个可扩展的极简终端编程助手
Published: at 06:30 AMpi(shittycodingagent.ai)是 Mario Zechner 开发的开源终端编程助手,支持 20 余个 AI 提供商,通过技能、扩展、提示模板和 Pi 包构建高度可定制的工作流,让 AI 编程工具真正适配你的开发习惯而不是反过来。
-
Harness Engineering:2026 年最好的 AI 工程师已经停止写代码了
Published: at 05:00 AM同一个模型、同一套测试,只改了 harness,基准分数从 42% 跳到 78%。本文解释什么是 harness engineering、它的五个调节杠杆,以及如何从今天起用 $0 开始练习这项让你不可替代的技能。
-
慢下来:关于 AI 编程 Agent 的一些清醒思考
Published: at 03:40 AMMario Zechner 观察到,过度依赖 AI coding agent 正在加速软件质量下滑。本文梳理他的核心判断:agent 的错误如何以人类无法察觉的速度复利累积、为什么主动权不能拱手相让,以及在哪些场景下放慢节奏、亲手写代码反而是最高效的选择。
-
Claude Code Auto Mode:用分类器替代人工审批的安全实践
Published: at 03:20 AMAnthropic 工程博客详解 Claude Code auto mode 的设计思路:用双层分类器(输入层提示词注入探针 + 输出层转录分类器)自动审批权限请求,在保留93%通过率的前提下把危险动作拦截率做到实用水平。
-
用 A2A 协议连接 Azure AI Foundry 与 Semantic Kernel,让 Agent 具备 Bing 搜索能力
Published: at 02:00 AMBing Search API 即将停用,本文展示如何通过 A2A(Agent-to-Agent)协议,将 Azure AI Foundry 中的 Bing Grounding Agent 包装成 Semantic Kernel 的插件工具,实现跨框架多 Agent 协作搜索。
-
把 AI 编程工作流设计成状态机:与 Nick Tune 的对话
Published: at 01:40 AMPayFit 高级首席工程师 Nick Tune 分享了他如何把 AI 编程工作流建模成带类型约束的状态机,配合 TDD、依赖检查和 CodeRabbit,让 Claude 从需求到 PR 全程自主交付,同时保持代码质量不失控。
-
TurboQuant:Google 的极致压缩算法如何让大模型跑得更快
Published: at 07:40 PMGoogle Research 发布 TurboQuant,联合 QJL 与 PolarQuant 两项算法,将 KV 缓存压缩到 3 比特仍保持模型精度,4 比特模式在 H100 上最高实现 8 倍加速,且无需训练或微调。本文解读三者的核心原理与实验结果。