我的 8 小时现实检验：使用 DeepSeek-R1-0528 进行编码

太长不看

DeepSeek-R1-0528：最新开源推理模型，采用 MIT 许可证
重大突破：性能较上一版本显著提升（AIME 2025 测试成绩从 70% 提升至 87.5%）
架构：总共 6710 亿个参数，每个代币通过混合专家模型激活约 370 亿个参数。
主要限制：通过 OpenRouter API 的延迟为 15-30 秒，而其他型号的延迟约为 1 秒。
最适合：复杂推理、架构规划、独立于供应商
不适用于：实时编码、快速迭代、交互式开发
总结：推理能力令人印象深刻，但延迟是实际应用的一大挑战。

承诺与我的8小时现实检验

我看到这条推文时：

我的回应：先帮我拿一下咖啡，让我测试一下这项“突破”……

剧透：这很棒……如果你能接受每次回复都要等30秒的话。而且随着上下文内容的增加，等待时间还会延长。

我调试 Rust 异步运行时 47 分钟后，DeepSeek-R1-0528（通过我最喜欢的代码助手）终于给出了完美的解决方案。那时，我已经自己修复了 bug，喝了杯咖啡，开始反思自己的人生选择。

以下是我经过 8 小时测试后对最新“开源突破”的了解。

现实检验：炒作与我的真实体验

DeepSeek 的公告承诺将带来突破性的性能和便捷的使用体验。经过密集测试，以下是这些承诺的验证结果：

DeepSeek 的声明	我的现实	判决
“与 GPT/Claude 的性能相符”	往往在推理方面更胜一筹。	真的
“MIT 许可的开源软件”	完全开放，没有任何限制	真的
“显著改进”	主要基准指数上涨已确认	真的

这项突破是真的。但日常使用起来……很有挑战性。

在深入探讨为什么响应时间如此重要之前，让我们先了解一下是什么让这个模型在技术上如此令人印象深刻，以至于尽管感到沮丧，我仍然不断地回来使用它。

魔法背后的技术（以及它为何如此缓慢）

尽管我抱怨网络延迟，但确实存在等待是值得的情形：

完美应用案例

大型代码库分析（超过 20,000 行）——完美利用了 128K 上下文信息
建筑规划——深思熟虑证明等待时间的合理性
严格按照指示执行——完全满足您的要求
供应商独立性——MIT许可证支持自托管

令人沮丧的使用案例

实时调试——当它做出响应时，你已经修复了它。
快速原型制作——扼杀了迭代流程
学习/探索——等待会打断学习势头。

推理透明度

这种“思考”过程确实令人印象深刻：

问题分析和方法规划
极端情况考虑
解决方案验证
输出抛光

不同的专家针对不同的模式（API 设计 vs 系统编程 vs 不安全代码）采取行动。

我的真实看法：历史性成就，实际挑战

历史性成就

第一个真正具有竞争力的开放式推理模型
MIT许可证 = 完全的供应商独立性
证明开源系统可以媲美封闭系统

每日现实

还记得那场耗时 47 分钟的调试过程吗？它完美地体现了 R1-0528 的体验：技术精湛，实际操作极具挑战性。

问题不在于 R1-0528 是否令人印象深刻——它绝对令人印象深刻。

问题在于，你是否可以围绕等待天才出现来构建你的工作流程。

🚀试试 AI Shell

您的智能编码助手，可无缝集成到您的工作流程中。

登录 Forge →

社区讨论

分享你的经历：

你测试过R1-0528的编码功能吗？你的耐心极限是多少？
找到解决延迟问题的方法了吗？

底线

DeepSeek 的公告在功能方面并没有错——基准测试的改进是真实的，推理质量令人印象深刻，而且 MIT 许可证确实具有变革性意义。

对于建筑规划而言，哪里可以等待？绝对值得。

快速迭代？还没完全实现。

请告诉我您使用 DeepSeek R1 或其他 LLM 的经验……

文章来源：https://dev.to/forgecode/my-8-hour-reality-check-coding-with-deepseek-r1-0528-2nic

菜单

分享

我的 8 小时现实检验：使用 DeepSeek-R1-0528 进行编码

我的 8 小时现实检验：使用 DeepSeek-R1-0528 进行编码

太长不看

承诺与我的8小时现实检验

现实检验：炒作与我的真实体验

魔法背后的技术（以及它为何如此缓慢）

完美应用案例

令人沮丧的使用案例

推理透明度

我的真实看法：历史性成就，实际挑战

历史性成就

每日现实

社区讨论

底线

系统设计面试中的 19 种微服务模式

使用 React 和 AWS Amplify 实现无服务器架构第三部分：跟踪应用使用情况

模型-视图-控制器（MVC）模式到底是什么？DEV 全球项目展示挑战赛，由 Mux 主办：快来展示你的项目吧！

我在两年内从 PHP 开发人员晋升为高级 C#/.NET 开发人员。

了解 Docker：第 12 部分 – 传递构建参数

Yarn 和第三方 NPM 客户端的黑暗未来 DEV 的全球展示与讲述挑战赛，由 Mux 呈现：展示你的项目！

CSS DEV 的全球展示挑战赛“响应式字体”由 Mux 呈现：展示你的项目！

我是如何以学生开发者的身份免费获得 Tabnine Pro 的，你也可以！

五大顶级JS框架

从 Rector PHP 开始：利用自动化改进您的 PHP 代码