其实从12月底DeepSeek-V3发布以来,就有不少朋友会问我评价,我们还确实认真的讨论过训练成本的问题,以及对算力的影响。
实事求是讲,虽然国内的公募基金业在广大群众眼中越来越像“男足”了,但是仅就DeepSeek的例子看,毫无疑问,这个行业依然集中了最聪明最勤奋的一批人。相信我们很多行业的从业者都真的是“天赋+勤奋”的集合体,这同样更包含了以DeepSeek、Kimi、豆包、智谱等国内AI团队在内的许许多多疯狂内卷的天才们。
不过,我依然很少公开评价国内模型,两个原因:我不喜欢花哨的错误用法演示;我不喜欢要么捧上天,要么疯狂踩的舆论氛围。
但是,实事求是讲,这段时间,即使那些看起来很专业的评测,我都认为是有极强误导性的,最大的误导来自于:其实,AI是要拿来用的,很难想象用户会为了“写藏头诗”、“论坛键盘侠”风格的模型去付费,但却会为了真正能够提高生产效率,稳定解决实际问题的模型买单。
恰好,我准备拿出干燥箱里待了很长时间的Leica MP,去找回一点过去两年快速消失的拍摄乐趣。因为很长时间没使用胶片相机了,自然需要看一下说明书。Leica官网的说明书120页,德文和英文双语,我快速浏览了一遍英文版本后,突发奇想,希望模型写一个Cheat Sheet。
这个场景其实非常实用,也是大语言模型带来的最重要改变的场景之一。
我同时试了DeepSeek,GPT,Gemini和Claude。相机说明文档的链接是:
Leica MP说明书,PDF格式,大小超过10M
https://leica-camera.com/sites/default/files/pm-73015-Leica-MP_Instructions_de-en.pdf
首先,需要说明的是,在测试的模型中,GPT-o1是不支持pdf格式输入的,所以,我直接使用了GPT-4o替代(在我看来,这个差别很小,最后我会解释为什么所谓的“思考模型”毫无疑问是个重要的研究方向,但是在当下实际上实用价值并不那么高)。
所以,我测试了五个模型,分别是DeepSeek-R1,GPT-4o,Gemini-1.5-Flash,Gemini-2.0-Flash,Claude-3.5-Sonnet。
(如果需要直接看结论的,可以翻到最后)
首先是DeepSeek-R1:我的提示词很简单,都是“请根据文档内容,出书一份用户更友好的介绍相机使用方法的cheat sheet”。

相信如上图所示的“给出完整思考过程”,已经成为R1一个非常重要的特点广为流传了。
Leica MP 快速操作指南
📷 胶片摄影的经典体验,尽在掌握
基础设置
- 电池安装
- 使用2颗1.55V纽扣电池(如SR44)或1颗3V锂电池(DL 1/3N)。
- 逆时针拧开电池仓盖(2),电池正极朝上装入,顺时针拧紧。
- 提示:长期不用时取出电池,避免漏液。
- 胶片安装
- 开盖:底部锁扣(28)上提 → 左转 → 取下底盖 → 展开后盖。
- 装片:胶片头插入卷片轴(30),轻压确保卡稳 → 合后盖 → 装回底盖并锁紧。
- 过片:拨动快速过片杆(19) → 释放快门 → 重复直至计数器显示“1”。
- 感光度设置
- 转动感光度转盘(25),对齐ISO值(范围6-6400)。
拍摄操作
- 镜头安装
- 装镜头:红点对齐机身红点 → 顺时针旋转至卡入。
- 卸镜头:按住镜头释放钮(3) → 逆时针旋转至红点对齐 → 取下。
- 注意:换镜头时避免阳光直射快门帘。
- 对焦与测距
- 取景器显示:中央亮框为测距区,LED提示曝光(▶◀需调整,●曝光正确)。电池图标亮起需更换电池。
- 对焦方法:
- 双像重合(人物):转动对焦环使重影重合。
- 裂像对齐(建筑):调整至裂像线条连贯。
- 曝光设置
- 快门速度(16):1s-1/1000s,B门用于长曝光(关闭测光)。
- 光圈环(13):转动至与快门速度匹配(LED提示方向)。
- 测光:轻按快门至压力点激活,14秒后自动关闭。
进阶功能
- 闪光灯使用
- 同步速度:1/50s(⚡标志)。
- 连接:热靴(20)或X触点(22),支持多灯同步。
- 取景器扩展
- 画幅切换(9):拨动选择28+90mm、35+135mm或50+75mm框线。
- 放大镜(1.25x):提升对焦精度(需选配)。
- 深度预览
- 光圈值影响景深,参考景深标尺(11b)调整。
维护与提示
- 胶片回卷
- 过片卡住时 → 拨动回卷钮(5) → 拉出回卷杆(10a/b)顺时针旋转至胶片完全回卷 → 开盖取片。
- 清洁与保存
- 镜头:用软毛刷或专用布清洁,避免化学试剂。
- 存放:干燥环境,定期空拍防止润滑剂固化。
- 重要警告
- 勿让阳光直射镜头内部(可能烧毁快门帘)。
- 高温/潮湿环境慎用,建议搭配防潮剂。
附:快速备忘表
| 功能 | 操作位置 | 关键提示 |
|---|---|---|
| 快门速度 | 顶部拨盘(16) | B门关闭测光 |
| 光圈调节 | 镜头环(13) | 数值越小,进光量越大 |
| 感光度设置 | 后部转盘(25) | 对齐白点 |
| 回卷胶片 | 底部回卷杆(10a/b) | 先拨动R释放钮(5) |
🎞️ 享受每一张胶片的独特魅力,Leica MP 伴您记录时光。
上面的文字看起来格式有点乱,实际上正是使用了Markdown的语法,与公众号兼容的不太好。但是在DeepSeek自身的页面上看起来就是如下的效果。

评价:这个结果确实不错,没有错误。不过,“思考过程”是让我有点迷惑的,表面看像一个提示词生成的过程,背后应该是独立于基础模型之外的基于强化学习后的Agent。“过度思考”现象确实存在,相对于思考过程的细节而言,反而显得基础模型(V3?)对于提示词的理解能力存在局限了。
第二个模型是GPT-4o。模型直接切换到了Canvas模式,用户体验确实是好一点。输出内容同样是Markdown格式。

Leica MP 快速使用指南(Cheat Sheet)
评价:坦白讲,细节是要更多的。
第三个是Gemini的两个版本模型,分别是1.5Flash和2.0Flash。自从Gemini-1.5发布后,AI Studio一直是我最重要的生产平台。Gemini也是最可靠的生产力工具。
评价:如果仔细看的话,Gemini的输出比R1和GPT-4o都要更好:1、结果中去掉了对部件编号的引用,例如“电池仓盖(2)”这样的表述。这当然是一个见仁见智的问题,如果用户对照着原文档的示意图,有编号会更直观,但是在这个场合下,我们可以认为Gemini是进行过选择的;2、Gemini将顺序调整为“装片-拍摄-倒片”,这确实是按照标准拍摄流程来的,显然对用户更友好。
最后一个是Claude 3.5的。

评价:客观讲,这个输出结果信息量足够,准确度也很高,可是就会觉得“不太友好”。Claude 3.5最大的优势一直是在代码生成上,但是在其他领域,如今看来,跟其他模型比,开始有差距了。
总结:
实事求是讲,DeepSeek-R1的输出结果确实很好。它的意义在于作为一个可以跟最优秀模型相比较的模型,API使用成本低很多,同时还是“开源”的;对于所有用户而言,都多了一个“免费”且没有访问限制的模型;对“先锋用户”而言,模型本地部署和调用领先模型的API本身就是相结合的。
最后,是这次简单的尝试,特别是R1清晰展现出的“思考过程”,让我更加怀疑所谓“思考模型”的真正价值了。我坚信,强化学习是确定性更强的道路,但是在缺乏“记忆”和“自我修正”能力的背景下,单纯思考的意义到底有多大?
思考模型的路真的正确吗?
道明,公众号:道明数字游牧生活