Tag: OCR
All the articles with the tag "OCR".
-
AI 用来排版乐谱,现在哪一步最靠谱
Published: at 01:56 AMJohn D. Cook 这篇小实验最有意思的,不是证明 AI 已经能把乐谱图片准确转成 LilyPond 代码,恰恰相反,它展示了一个更值得记住的现实:模型在“看懂这是什么曲子、这是什么风格”上已经有点本事,但在需要逐音符、逐小节忠实还原结构时,还是很容易一本正经地乱编。真正该关注的不是 AI 会不会生成乐谱代码,而是它在哪些层面已经能帮忙,哪些层面还远没到可依赖的时候。
-
Qwen 3.5 做文档 OCR 为什么值得试
Published: at 01:36 AM这篇文章最有价值的,不是又多学会一个把 PDF 转图片再喂模型的套路,而是把一个很现实的判断说清楚了:当你需要处理大量扫描糟糕、又不想把敏感文档全送进大厂云 API 时,Qwen 3.5 这类开源多模态模型已经开始提供一个够便宜、够快、效果也够能打的 OCR 路线。真正值得关注的不是“模型会不会认字”,而是本地部署、批量吞吐、成本和输出稳定性这几件事终于开始同时成立。