Sep 3, 2025

一个小例子看DeepSeek-R1的能力，我们应该用模型干什么？

其实从12月底DeepSeek-V3发布以来，就有不少朋友会问我评价，我们还确实认真的讨论过训练成本的问题，以及对算力的影响。

实事求是讲，虽然国内的公募基金业在广大群众眼中越来越像“男足”了，但是仅就DeepSeek的例子看，毫无疑问，这个行业依然集中了最聪明最勤奋的一批人。相信我们很多行业的从业者都真的是“天赋+勤奋”的集合体，这同样更包含了以DeepSeek、Kimi、豆包、智谱等国内AI团队在内的许许多多疯狂内卷的天才们。

不过，我依然很少公开评价国内模型，两个原因：我不喜欢花哨的错误用法演示；我不喜欢要么捧上天，要么疯狂踩的舆论氛围。

但是，实事求是讲，这段时间，即使那些看起来很专业的评测，我都认为是有极强误导性的，最大的误导来自于：其实，AI是要拿来用的，很难想象用户会为了“写藏头诗”、“论坛键盘侠”风格的模型去付费，但却会为了真正能够提高生产效率，稳定解决实际问题的模型买单。

恰好，我准备拿出干燥箱里待了很长时间的Leica MP，去找回一点过去两年快速消失的拍摄乐趣。因为很长时间没使用胶片相机了，自然需要看一下说明书。Leica官网的说明书120页，德文和英文双语，我快速浏览了一遍英文版本后，突发奇想，希望模型写一个Cheat Sheet。

这个场景其实非常实用，也是大语言模型带来的最重要改变的场景之一。

我同时试了DeepSeek，GPT，Gemini和Claude。相机说明文档的链接是：

Leica MP说明书，PDF格式，大小超过10M

https://leica-camera.com/sites/default/files/pm-73015-Leica-MP_Instructions_de-en.pdf

首先，需要说明的是，在测试的模型中，GPT-o1是不支持pdf格式输入的，所以，我直接使用了GPT-4o替代（在我看来，这个差别很小，最后我会解释为什么所谓的“思考模型”毫无疑问是个重要的研究方向，但是在当下实际上实用价值并不那么高）。

所以，我测试了五个模型，分别是DeepSeek-R1，GPT-4o，Gemini-1.5-Flash，Gemini-2.0-Flash，Claude-3.5-Sonnet。

（如果需要直接看结论的，可以翻到最后）

首先是DeepSeek-R1：我的提示词很简单，都是“请根据文档内容，出书一份用户更友好的介绍相机使用方法的cheat sheet”。

DeepSeek-R1 Response

相信如上图所示的“给出完整思考过程”，已经成为R1一个非常重要的特点广为流传了。

Leica MP 快速操作指南

📷 胶片摄影的经典体验，尽在掌握

基础设置

电池安装

使用2颗1.55V纽扣电池（如SR44）或1颗3V锂电池（DL 1/3N）。
逆时针拧开电池仓盖（2），电池正极朝上装入，顺时针拧紧。
提示：长期不用时取出电池，避免漏液。

胶片安装

开盖：底部锁扣（28）上提 → 左转 → 取下底盖 → 展开后盖。
装片：胶片头插入卷片轴（30），轻压确保卡稳 → 合后盖 → 装回底盖并锁紧。
过片：拨动快速过片杆（19） → 释放快门 → 重复直至计数器显示“1”。

感光度设置

转动感光度转盘（25），对齐ISO值（范围6-6400）。

拍摄操作

镜头安装

装镜头：红点对齐机身红点 → 顺时针旋转至卡入。
卸镜头：按住镜头释放钮（3） → 逆时针旋转至红点对齐 → 取下。
注意：换镜头时避免阳光直射快门帘。

对焦与测距

取景器显示：中央亮框为测距区，LED提示曝光（▶◀需调整，●曝光正确）。电池图标亮起需更换电池。
对焦方法：
- 双像重合（人物）：转动对焦环使重影重合。
- 裂像对齐（建筑）：调整至裂像线条连贯。

曝光设置

快门速度（16）：1s-1/1000s，B门用于长曝光（关闭测光）。
光圈环（13）：转动至与快门速度匹配（LED提示方向）。
测光：轻按快门至压力点激活，14秒后自动关闭。

进阶功能

闪光灯使用

同步速度：1/50s（⚡标志）。
连接：热靴（20）或X触点（22），支持多灯同步。

取景器扩展

画幅切换（9）：拨动选择28+90mm、35+135mm或50+75mm框线。
放大镜（1.25x）：提升对焦精度（需选配）。

深度预览

光圈值影响景深，参考景深标尺（11b）调整。

维护与提示

胶片回卷

过片卡住时 → 拨动回卷钮（5） → 拉出回卷杆（10a/b）顺时针旋转至胶片完全回卷 → 开盖取片。

清洁与保存

镜头：用软毛刷或专用布清洁，避免化学试剂。
存放：干燥环境，定期空拍防止润滑剂固化。

重要警告

勿让阳光直射镜头内部（可能烧毁快门帘）。
高温/潮湿环境慎用，建议搭配防潮剂。

附：快速备忘表

功能	操作位置	关键提示
快门速度	顶部拨盘（16）	B门关闭测光
光圈调节	镜头环（13）	数值越小，进光量越大
感光度设置	后部转盘（25）	对齐白点
回卷胶片	底部回卷杆（10a/b）	先拨动R释放钮（5）

🎞️ 享受每一张胶片的独特魅力，Leica MP 伴您记录时光。

上面的文字看起来格式有点乱，实际上正是使用了Markdown的语法，与公众号兼容的不太好。但是在DeepSeek自身的页面上看起来就是如下的效果。

DeepSeek Markdown Render

评价：这个结果确实不错，没有错误。不过，“思考过程”是让我有点迷惑的，表面看像一个提示词生成的过程，背后应该是独立于基础模型之外的基于强化学习后的Agent。“过度思考”现象确实存在，相对于思考过程的细节而言，反而显得基础模型（V3？）对于提示词的理解能力存在局限了。

第二个模型是GPT-4o。模型直接切换到了Canvas模式，用户体验确实是好一点。输出内容同样是Markdown格式。

GPT-4o Response

Leica MP 快速使用指南（Cheat Sheet）

评价：坦白讲，细节是要更多的。

第三个是Gemini的两个版本模型，分别是1.5Flash和2.0Flash。自从Gemini-1.5发布后，AI Studio一直是我最重要的生产平台。Gemini也是最可靠的生产力工具。

评价：如果仔细看的话，Gemini的输出比R1和GPT-4o都要更好：1、结果中去掉了对部件编号的引用，例如“电池仓盖（2）”这样的表述。这当然是一个见仁见智的问题，如果用户对照着原文档的示意图，有编号会更直观，但是在这个场合下，我们可以认为Gemini是进行过选择的；2、Gemini将顺序调整为“装片-拍摄-倒片”，这确实是按照标准拍摄流程来的，显然对用户更友好。

最后一个是Claude 3.5的。

Claude 3.5 Response

评价：客观讲，这个输出结果信息量足够，准确度也很高，可是就会觉得“不太友好”。Claude 3.5最大的优势一直是在代码生成上，但是在其他领域，如今看来，跟其他模型比，开始有差距了。

总结：

实事求是讲，DeepSeek-R1的输出结果确实很好。它的意义在于作为一个可以跟最优秀模型相比较的模型，API使用成本低很多，同时还是“开源”的；对于所有用户而言，都多了一个“免费”且没有访问限制的模型；对“先锋用户”而言，模型本地部署和调用领先模型的API本身就是相结合的。

最后，是这次简单的尝试，特别是R1清晰展现出的“思考过程”，让我更加怀疑所谓“思考模型”的真正价值了。我坚信，强化学习是确定性更强的道路，但是在缺乏“记忆”和“自我修正”能力的背景下，单纯思考的意义到底有多大？

思考模型的路真的正确吗？

道明，公众号：道明数字游牧生活