deepseek的R1模型的推理能力似乎真的强于chatgpt的o3-mini？

前两个我是对deepseek不屑一顾的。但是这几天随着我对Deepseek的不断使用。我发现Deepseek好像真的不是一个炒作出来的产物。它给出的推理结果往往比o3-mini更长更全面，往往也有更多细节。

今天问了他们两个学日语的人都知道的基础知识。但是o3-mini的回答缺完全错误了

https://preview.redd.it/mqlypom9cuoe1.png?width=946&format=png&auto=webp&s=f0c217e5d5a08009096912c37bfa5268ff01b243

https://preview.redd.it/ukzdwf2acuoe1.png?width=772&format=png&auto=webp&s=a0f6c2cb975b4ca924eed3d392631f1aafa8f6a9

不知道有没有开了订阅用上chatgpt o1的老哥。说说o1和R1的对比效果如何？

Author: Cheap-Awareness-3864
Created: 2025-03-15 11:49:34 UTC
Score: 1
ID: mhwnx9j
Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwnx9j/
你gpt为什么不开深度思考

Author: Elegant-Rooster-1476
Created: 2025-03-15 11:51:03 UTC
Score: 6
ID: mhwo3nb
Ups=6 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwo3nb/
仅个人日常使用：我刷英语题的时候用过一篇完型填空20道题chatgpto1，o4和deepseek对比，r1错两个，o4错5个，o1全对。数学也只用来解答题目，一个思路很简单，但是过程很复杂的二阶导数，我懒得算丢给了r1和o3mini，r1求导求错了，o3mini正常

Author: Own-Tadpole4447
Created: 2025-03-15 12:00:24 UTC
Score: 3
ID: mhwp882
Ups=3 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp882/
说明R1虽然没有O1好用，但是已经处于可以用的状态了？

Author: Elegant-Rooster-1476
Created: 2025-03-15 12:06:51 UTC
Score: 2
ID: mhwq0rl
Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwq0rl/
语言学习方面r1没和o3mini对比过，当时我对比的时候o3mini还没出，但是r1总是please try later again ，就好像是固定的我问了几次之后就不让我用了，r1可以用的就是太容易奔溃了不稳定的感觉，而且思考很久

Author: Own-Tadpole4447
Created: 2025-03-15 12:12:32 UTC
Score: 5
ID: mhwqqtq
Ups=5 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwqqtq/
Ｒ１现在也经常会用服务器繁忙为理由强制终止对话。不过R1给我的感觉是它对中文的理解力确实更好一些（对比o3minii）并且回答很详细，有时还会举一反三，o3mini的回答总是感觉有点太简短。

Author: Cheap-Awareness-3864
Created: 2025-03-15 11:51:47 UTC
Score: 16
ID: mhwo6oh
Ups=16 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwo6oh/
你gpt为什么不开深度思考或者search 而且o3mini本身就是个小模型相对于o3mini high还有4o 4.5 你拿才出的R1比优化过的gpt3.5有点抽象了具体对比我等会发

Author: Cheap-Awareness-3864
Created: 2025-03-15 11:52:59 UTC
Score: 1
ID: mhwobq4
Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwobq4/
https://preview.redd.it/9km15a2zduoe1.jpeg?width=1290&format=pjpg&auto=webp&s=235cdea1370e0d868d954a71703ec46974239b67
哥们你用的真的是o3么我search和深度搜索都没开都没有你的结果你是怎么做到的

Author: Own-Tadpole4447
Created: 2025-03-15 11:57:52 UTC
Score: 0
ID: mhwox3a
Ups=0 | Downs=0 | Submitter=true | Controversiality=1 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwox3a/
这主要是因为我没订阅，只能用o3mini。穷哥们

Author: Cheap-Awareness-3864
Created: 2025-03-15 11:58:32 UTC
Score: 2
ID: mhwozz3
Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwozz3/
https://preview.redd.it/hvjar7m0fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=5d2675d770ee86f576d7e7c57840bbfb97764a40
3未开搜索

Author: Cheap-Awareness-3864
Created: 2025-03-15 11:59:33 UTC
Score: 2
ID: mhwp4ef
Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp4ef/
https://preview.redd.it/ry7x62z7fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=b161a5e7814008f6dd5e2394844ee17276148c8b
3开搜索

Author: Cheap-Awareness-3864
Created: 2025-03-15 11:59:44 UTC
Score: 2
ID: mhwp58f
Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp58f/
https://preview.redd.it/ym969ba9fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=c35aca041e003f16d224d84b2b90ff0dd4ee8f1b
4.5

Author: Cheap-Awareness-3864
Created: 2025-03-15 12:00:00 UTC
Score: 3
ID: mhwp6g0
Ups=3 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp6g0/
https://preview.redd.it/mjcpxxxafuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=82036edeb658beb65ea4f5bd1b37680822f758c6
4o

Author: Cheap-Awareness-3864
Created: 2025-03-15 12:06:58 UTC
Score: 5
ID: mhwq1ca
Ups=5 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwq1ca/
同时你可以发现开了搜索的3 标准的4 4.5都能给出正确答案但除了4.5对中文的理解有缺点会认为你的x是错误输入但是4.5能正确理解不过这也是你提问的方法不太好和中文大模型对中文优化是合理的

Author: Own-Tadpole4447
Created: 2025-03-15 11:58:30 UTC
Score: -5
ID: mhwozt4
Ups=-5 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwozt4/
不过R1能打过o3mini让我挺惊讶的，这不是恰好说明R1确实有点东西？

Author: Cheap-Awareness-3864
Created: 2025-03-15 11:59:10 UTC
Score: 6
ID: mhwp2ss
Ups=6 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp2ss/
没啥可惊讶的你拿豆包 kimi来都行体量差太大了

Author: Own-Tadpole4447
Created: 2025-03-15 12:06:21 UTC
Score: 0
ID: mhwpyjt
Ups=0 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwpyjt/
嗯，谢谢你特意发回o1的结果。有り難いでございます！

Author: Cheap-Awareness-3864
Created: 2025-03-15 12:09:55 UTC
Score: 8
ID: mhwqerr
Ups=8 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwqerr/
还有就是尽量使用非中文尤其是用英语和日语进行搜索中文会默认中文信源且对中文的优化不足

Author: Cheap-Awareness-3864
Created: 2025-03-15 12:14:46 UTC
Score: 1
ID: mhwr14q
Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwr14q/
https://preview.redd.it/yw4prdzthuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=beff1983e1c4525f036a4b0bb11570798f1ce19f
同时附上英语搜索的结果 o3mini 未开搜索和深度思考完全正确的结果

Author: Cheap-Awareness-3864
Created: 2025-03-15 12:15:28 UTC
Score: 1
ID: mhwr4ao
Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwr4ao/
使用大模型最好还是使用非中文和比较不易混淆的语言去进行使用避免不必要的信源缺失和幻觉问题

Author: Own-Tadpole4447
Created: 2025-03-15 12:20:19 UTC
Score: 2
ID: mhwrqvp
Ups=2 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwrqvp/
嗯，我也是这么感觉的。感谢你的建议。但是我看了下上图的o3mini回复，仍然是错误的。它还是从“汉字的写法结构”入手来说，但其实“汉字的发音与该汉字与“常用汉字表”的关系”才是正确的回答。。。。

Author: Cheap-Awareness-3864
Created: 2025-03-15 12:24:29 UTC
Score: 1
ID: mhwsahz
Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsahz/
哦我没看三角的解释不好意思那这个只一半

Author: Cheap-Awareness-3864
Created: 2025-03-15 12:25:28 UTC
Score: 1
ID: mhwsf5p
Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsf5p/
不过我发的都没有开深度搜索（我之前用完了）你看看有没有人开深度搜索的实验

Author: Cheap-Awareness-3864
Created: 2025-03-15 12:26:14 UTC
Score: 2
ID: mhwsis2
Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsis2/
https://preview.redd.it/fzl88h5yjuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=f5598e48b5d3ebdf20b9629f809ea526ce48d551
常规搜索的o3mini加上英文是没错的吧

Author: Southern_Dragonfly34
Created: 2025-03-15 12:32:25 UTC
Score: 2
ID: mhwtcc0
Ups=2 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwtcc0/
R1实际上是对标o1, V3是对标4o/o3-mini。deepseek最夸张的就是把本来openai卖20甚至200美元级别的服务直接免费了。所以deepseek R1出来之后，chatgpt和gemini也都把免费服务升级了。至于哪个厉害，这里有一个leaderboard. https://lmarena.ai/
我个人使用的话，有时候ChatGPT, Gemini, Deepseek(我用的腾讯元宝)都会开着，模型上来讲，我感觉还是ChatGPT最好用，回答的可读性更强。但是Gemini的工程做的更好，回复更快网络也不卡。

Author: shinabuta106
Created: 2025-03-15 12:58:58 UTC
Score: 2
ID: mhwx241
Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwx241/
我和你正好相反，二月那阵我确实觉得DS非常强大，反倒是这两个礼拜感觉很明显地降智了。

Author: T0M0R1N
Created: 2025-03-15 13:19:53 UTC
Score: 1
ID: mhx06cn
Ups=1 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhx06cn/
不好意思借帖問一下，請問這裡有先審後發機制嗎，我剛發了文章卻完全找不到

Author: treenewbee_
Created: 2025-03-15 13:55:31 UTC
Score: 1
ID: mhx5rsa
Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhx5rsa/
r1的完整版671b的參數，參數越多，智商越高，推理能力和聯想能力越強

Author: NorthEmployer1505
Created: 2025-03-15 14:32:38 UTC
Score: 1
ID: mhxc363
Ups=1 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxc363/
其他的模型的參數？

Author: Own-Tadpole4447
Created: 2025-03-15 14:46:42 UTC
Score: 1
ID: mhxemsx
Ups=1 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxemsx/
听说r1是通过蒸馏技术来训练的，但是蒸馏技术是15年就已经产生的论文。
按道理这不应该是什么deepseek的独门技术。这次deepseek用这个理论大炒特炒，让我不禁怀疑，难道其他llm模型训练的时候没有用过这个理论吗?

Author: banzai_23
Created: 2025-03-15 15:19:58 UTC
Score: 2
ID: mhxkrqt
Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxkrqt/
有

Author: taiwanGI1998
Created: 2025-03-15 14:29:28 UTC
Score: 3
ID: mhxbizm
Ups=3 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxbizm/
我用deepseek做實驗分析，忘記給一個assumption. 結果他生成的assumptions 跟gpt的o1一樣
誰抄襲誰？

Author: Own-Tadpole4447
Created: 2025-03-15 14:32:24 UTC
Score: 1
ID: mhxc1qm
Ups=1 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxc1qm/
如果真是偷偷调用了chatgpt api(我不知道是不是真的)。呢中国政府算不算在做慈善。。。

Author: 0000ffYakumo
Created: 2025-03-15 19:59:36 UTC
Score: 1
ID: mhz2koa
Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhz2koa/
ds说话太浮夸