前两个我是对deepseek不屑一顾的。但是这几天随着我对Deepseek的不断使用。我发现Deepseek好像真的不是一个炒作出来的产物。它给出的推理结果往往比o3-mini更长更全面,往往也有更多细节。

今天问了他们两个学日语的人都知道的基础知识。但是o3-mini的回答缺完全错误了

https://preview.redd.it/mqlypom9cuoe1.png?width=946&format=png&auto=webp&s=f0c217e5d5a08009096912c37bfa5268ff01b243

https://preview.redd.it/ukzdwf2acuoe1.png?width=772&format=png&auto=webp&s=a0f6c2cb975b4ca924eed3d392631f1aafa8f6a9

不知道有没有开了订阅用上chatgpt o1的老哥。说说o1和R1的对比效果如何?


  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 11:49:34 UTC
  • Score: 1
  • ID: mhwnx9j
  • Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwnx9j/

你gpt为什么不开深度思考

  • Author: Elegant-Rooster-1476
  • Created: 2025-03-15 11:51:03 UTC
  • Score: 6
  • ID: mhwo3nb
  • Ups=6 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwo3nb/

仅个人日常使用:我刷英语题的时候用过一篇完型填空20道题chatgpto1,o4和deepseek对比,r1错两个,o4错5个,o1全对。 数学也只用来解答题目,一个思路很简单,但是过程很复杂的二阶导数,我懒得算丢给了r1和o3mini,r1求导求错了,o3mini正常

  • Author: Own-Tadpole4447
  • Created: 2025-03-15 12:00:24 UTC
  • Score: 3
  • ID: mhwp882
  • Ups=3 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp882/

说明R1虽然没有O1好用,但是已经处于可以用的状态了?

  • Author: Elegant-Rooster-1476
  • Created: 2025-03-15 12:06:51 UTC
  • Score: 2
  • ID: mhwq0rl
  • Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwq0rl/

语言学习方面r1没和o3mini对比过,当时我对比的时候o3mini还没出,但是r1总是please try later again ,就好像是固定的我问了几次之后就不让我用了,r1可以用的就是太容易奔溃了不稳定的感觉,而且思考很久

  • Author: Own-Tadpole4447
  • Created: 2025-03-15 12:12:32 UTC
  • Score: 5
  • ID: mhwqqtq
  • Ups=5 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwqqtq/

R1现在也经常会用 服务器繁忙为理由强制终止对话。不过R1给我的感觉是它对中文的理解力确实更好一些(对比o3minii)并且回答很详细,有时还会举一反三,o3mini的回答总是感觉有点太简短。

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 11:51:47 UTC
  • Score: 16
  • ID: mhwo6oh
  • Ups=16 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwo6oh/

你gpt为什么不开深度思考或者search 而且o3mini本身就是个小模型相对于o3mini high还有4o 4.5 你拿才出的R1比优化过的gpt3.5有点抽象了 具体对比我等会发

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 11:52:59 UTC
  • Score: 1
  • ID: mhwobq4
  • Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwobq4/

https://preview.redd.it/9km15a2zduoe1.jpeg?width=1290&format=pjpg&auto=webp&s=235cdea1370e0d868d954a71703ec46974239b67

哥们你用的真的是o3么 我search和深度搜索都没开都没有你的结果 你是怎么做到的

  • Author: Own-Tadpole4447
  • Created: 2025-03-15 11:57:52 UTC
  • Score: 0
  • ID: mhwox3a
  • Ups=0 | Downs=0 | Submitter=true | Controversiality=1 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwox3a/

这主要是因为我没订阅,只能用o3mini。穷哥们

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 11:58:32 UTC
  • Score: 2
  • ID: mhwozz3
  • Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwozz3/

https://preview.redd.it/hvjar7m0fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=5d2675d770ee86f576d7e7c57840bbfb97764a40

3未开搜索

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 11:59:33 UTC
  • Score: 2
  • ID: mhwp4ef
  • Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp4ef/

https://preview.redd.it/ry7x62z7fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=b161a5e7814008f6dd5e2394844ee17276148c8b

3开搜索

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 11:59:44 UTC
  • Score: 2
  • ID: mhwp58f
  • Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp58f/

https://preview.redd.it/ym969ba9fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=c35aca041e003f16d224d84b2b90ff0dd4ee8f1b

4.5

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 12:00:00 UTC
  • Score: 3
  • ID: mhwp6g0
  • Ups=3 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp6g0/

https://preview.redd.it/mjcpxxxafuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=82036edeb658beb65ea4f5bd1b37680822f758c6

4o

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 12:06:58 UTC
  • Score: 5
  • ID: mhwq1ca
  • Ups=5 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwq1ca/

同时你可以发现开了搜索的3 标准的4 4.5都能给出正确答案 但除了4.5对中文的理解有缺点 会认为你的x是错误输入 但是4.5能正确理解 不过这也是你提问的方法不太好和中文大模型对中文优化是合理的

  • Author: Own-Tadpole4447
  • Created: 2025-03-15 11:58:30 UTC
  • Score: -5
  • ID: mhwozt4
  • Ups=-5 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwozt4/

不过R1能打过o3mini让我挺惊讶的,这不是恰好说明R1确实有点东西?

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 11:59:10 UTC
  • Score: 6
  • ID: mhwp2ss
  • Ups=6 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp2ss/

没啥可惊讶的 你拿豆包 kimi来都行体量差太大了

  • Author: Own-Tadpole4447
  • Created: 2025-03-15 12:06:21 UTC
  • Score: 0
  • ID: mhwpyjt
  • Ups=0 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwpyjt/

嗯,谢谢你特意发回o1的结果。有り難いでございます!

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 12:09:55 UTC
  • Score: 8
  • ID: mhwqerr
  • Ups=8 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwqerr/

还有就是尽量使用非中文 尤其是用英语和日语进行搜索 中文会默认中文信源 且对中文的优化不足

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 12:14:46 UTC
  • Score: 1
  • ID: mhwr14q
  • Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwr14q/

https://preview.redd.it/yw4prdzthuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=beff1983e1c4525f036a4b0bb11570798f1ce19f

同时附上英语搜索的结果 o3mini 未开搜索和深度思考 完全正确的结果

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 12:15:28 UTC
  • Score: 1
  • ID: mhwr4ao
  • Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwr4ao/

使用大模型最好还是使用非中文和比较不易混淆的语言去进行使用 避免不必要的信源缺失和幻觉问题

  • Author: Own-Tadpole4447
  • Created: 2025-03-15 12:20:19 UTC
  • Score: 2
  • ID: mhwrqvp
  • Ups=2 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwrqvp/

嗯,我也是这么感觉的。感谢你的建议。但是我看了下上图的o3mini回复,仍然是错误的。它还是从“汉字的写法结构”入手来说,但其实“汉字的发音与该汉字与“常用汉字表”的关系”才是正确的回答。。。。

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 12:24:29 UTC
  • Score: 1
  • ID: mhwsahz
  • Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsahz/

哦我没看三角的解释不好意思 那这个只一半

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 12:25:28 UTC
  • Score: 1
  • ID: mhwsf5p
  • Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsf5p/

不过我发的都没有开深度搜索(我之前用完了)你看看有没有人开深度搜索的实验

  • Author: Cheap-Awareness-3864
  • Created: 2025-03-15 12:26:14 UTC
  • Score: 2
  • ID: mhwsis2
  • Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsis2/

https://preview.redd.it/fzl88h5yjuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=f5598e48b5d3ebdf20b9629f809ea526ce48d551

常规搜索的o3mini加上英文是没错的吧

  • Author: Southern_Dragonfly34
  • Created: 2025-03-15 12:32:25 UTC
  • Score: 2
  • ID: mhwtcc0
  • Ups=2 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwtcc0/

R1实际上是对标o1, V3是对标4o/o3-mini。deepseek最夸张的就是把本来openai卖20甚至200美元级别的服务直接免费了。所以deepseek R1出来之后,chatgpt和gemini也都把免费服务升级了。至于哪个厉害,这里有一个leaderboard. https://lmarena.ai/

我个人使用的话,有时候ChatGPT, Gemini, Deepseek(我用的腾讯元宝)都会开着,模型上来讲,我感觉还是ChatGPT最好用,回答的可读性更强。但是Gemini的工程做的更好,回复更快网络也不卡。

  • Author: shinabuta106
  • Created: 2025-03-15 12:58:58 UTC
  • Score: 2
  • ID: mhwx241
  • Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwx241/

我和你正好相反,二月那阵我确实觉得DS非常强大,反倒是这两个礼拜感觉很明显地降智了。

  • Author: T0M0R1N
  • Created: 2025-03-15 13:19:53 UTC
  • Score: 1
  • ID: mhx06cn
  • Ups=1 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhx06cn/

不好意思借帖問一下,請問這裡有先審後發機制嗎,我剛發了文章卻完全找不到

  • Author: treenewbee_
  • Created: 2025-03-15 13:55:31 UTC
  • Score: 1
  • ID: mhx5rsa
  • Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhx5rsa/

r1的完整版671b的參數,參數越多,智商越高,推理能力和聯想能力越強

  • Author: NorthEmployer1505
  • Created: 2025-03-15 14:32:38 UTC
  • Score: 1
  • ID: mhxc363
  • Ups=1 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxc363/

其他的模型的參數?

  • Author: Own-Tadpole4447
  • Created: 2025-03-15 14:46:42 UTC
  • Score: 1
  • ID: mhxemsx
  • Ups=1 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxemsx/

听说r1是通过蒸馏技术来训练的,但是蒸馏技术是15年就已经产生的论文。

按道理这不应该是什么deepseek的独门技术。这次deepseek用这个理论大炒特炒,让我不禁怀疑,难道其他llm模型训练的时候没有用过这个理论吗?

  • Author: banzai_23
  • Created: 2025-03-15 15:19:58 UTC
  • Score: 2
  • ID: mhxkrqt
  • Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxkrqt/

  • Author: taiwanGI1998
  • Created: 2025-03-15 14:29:28 UTC
  • Score: 3
  • ID: mhxbizm
  • Ups=3 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxbizm/

我用deepseek做實驗分析,忘記給一個assumption. 結果他生成的assumptions 跟gpt的o1一樣

誰抄襲誰?

  • Author: Own-Tadpole4447
  • Created: 2025-03-15 14:32:24 UTC
  • Score: 1
  • ID: mhxc1qm
  • Ups=1 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxc1qm/

如果真是偷偷调用了chatgpt api(我不知道是不是真的)。呢中国政府算不算在做慈善。。。

  • Author: 0000ffYakumo
  • Created: 2025-03-15 19:59:36 UTC
  • Score: 1
  • ID: mhz2koa
  • Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhz2koa/

ds说话太浮夸