前两个我是对deepseek不屑一顾的。但是这几天随着我对Deepseek的不断使用。我发现Deepseek好像真的不是一个炒作出来的产物。它给出的推理结果往往比o3-mini更长更全面,往往也有更多细节。
今天问了他们两个学日语的人都知道的基础知识。但是o3-mini的回答缺完全错误了
https://preview.redd.it/mqlypom9cuoe1.png?width=946&format=png&auto=webp&s=f0c217e5d5a08009096912c37bfa5268ff01b243
https://preview.redd.it/ukzdwf2acuoe1.png?width=772&format=png&auto=webp&s=a0f6c2cb975b4ca924eed3d392631f1aafa8f6a9
不知道有没有开了订阅用上chatgpt o1的老哥。说说o1和R1的对比效果如何?
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 11:49:34 UTC
- Score: 1
- ID: mhwnx9j
- Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwnx9j/
你gpt为什么不开深度思考
- Author: Elegant-Rooster-1476
- Created: 2025-03-15 11:51:03 UTC
- Score: 6
- ID: mhwo3nb
- Ups=6 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwo3nb/
仅个人日常使用:我刷英语题的时候用过一篇完型填空20道题chatgpto1,o4和deepseek对比,r1错两个,o4错5个,o1全对。 数学也只用来解答题目,一个思路很简单,但是过程很复杂的二阶导数,我懒得算丢给了r1和o3mini,r1求导求错了,o3mini正常
- Author: Own-Tadpole4447
- Created: 2025-03-15 12:00:24 UTC
- Score: 3
- ID: mhwp882
- Ups=3 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp882/
说明R1虽然没有O1好用,但是已经处于可以用的状态了?
- Author: Elegant-Rooster-1476
- Created: 2025-03-15 12:06:51 UTC
- Score: 2
- ID: mhwq0rl
- Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwq0rl/
语言学习方面r1没和o3mini对比过,当时我对比的时候o3mini还没出,但是r1总是please try later again ,就好像是固定的我问了几次之后就不让我用了,r1可以用的就是太容易奔溃了不稳定的感觉,而且思考很久
- Author: Own-Tadpole4447
- Created: 2025-03-15 12:12:32 UTC
- Score: 5
- ID: mhwqqtq
- Ups=5 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwqqtq/
R1现在也经常会用 服务器繁忙为理由强制终止对话。不过R1给我的感觉是它对中文的理解力确实更好一些(对比o3minii)并且回答很详细,有时还会举一反三,o3mini的回答总是感觉有点太简短。
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 11:51:47 UTC
- Score: 16
- ID: mhwo6oh
- Ups=16 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwo6oh/
你gpt为什么不开深度思考或者search 而且o3mini本身就是个小模型相对于o3mini high还有4o 4.5 你拿才出的R1比优化过的gpt3.5有点抽象了 具体对比我等会发
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 11:52:59 UTC
- Score: 1
- ID: mhwobq4
- Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwobq4/
https://preview.redd.it/9km15a2zduoe1.jpeg?width=1290&format=pjpg&auto=webp&s=235cdea1370e0d868d954a71703ec46974239b67
哥们你用的真的是o3么 我search和深度搜索都没开都没有你的结果 你是怎么做到的
- Author: Own-Tadpole4447
- Created: 2025-03-15 11:57:52 UTC
- Score: 0
- ID: mhwox3a
- Ups=0 | Downs=0 | Submitter=true | Controversiality=1 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwox3a/
这主要是因为我没订阅,只能用o3mini。穷哥们
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 11:58:32 UTC
- Score: 2
- ID: mhwozz3
- Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwozz3/
https://preview.redd.it/hvjar7m0fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=5d2675d770ee86f576d7e7c57840bbfb97764a40
3未开搜索
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 11:59:33 UTC
- Score: 2
- ID: mhwp4ef
- Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp4ef/
https://preview.redd.it/ry7x62z7fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=b161a5e7814008f6dd5e2394844ee17276148c8b
3开搜索
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 11:59:44 UTC
- Score: 2
- ID: mhwp58f
- Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp58f/
https://preview.redd.it/ym969ba9fuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=c35aca041e003f16d224d84b2b90ff0dd4ee8f1b
4.5
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 12:00:00 UTC
- Score: 3
- ID: mhwp6g0
- Ups=3 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp6g0/
https://preview.redd.it/mjcpxxxafuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=82036edeb658beb65ea4f5bd1b37680822f758c6
4o
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 12:06:58 UTC
- Score: 5
- ID: mhwq1ca
- Ups=5 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwq1ca/
同时你可以发现开了搜索的3 标准的4 4.5都能给出正确答案 但除了4.5对中文的理解有缺点 会认为你的x是错误输入 但是4.5能正确理解 不过这也是你提问的方法不太好和中文大模型对中文优化是合理的
- Author: Own-Tadpole4447
- Created: 2025-03-15 11:58:30 UTC
- Score: -5
- ID: mhwozt4
- Ups=-5 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwozt4/
不过R1能打过o3mini让我挺惊讶的,这不是恰好说明R1确实有点东西?
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 11:59:10 UTC
- Score: 6
- ID: mhwp2ss
- Ups=6 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwp2ss/
没啥可惊讶的 你拿豆包 kimi来都行体量差太大了
- Author: Own-Tadpole4447
- Created: 2025-03-15 12:06:21 UTC
- Score: 0
- ID: mhwpyjt
- Ups=0 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwpyjt/
嗯,谢谢你特意发回o1的结果。有り難いでございます!
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 12:09:55 UTC
- Score: 8
- ID: mhwqerr
- Ups=8 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwqerr/
还有就是尽量使用非中文 尤其是用英语和日语进行搜索 中文会默认中文信源 且对中文的优化不足
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 12:14:46 UTC
- Score: 1
- ID: mhwr14q
- Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwr14q/
https://preview.redd.it/yw4prdzthuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=beff1983e1c4525f036a4b0bb11570798f1ce19f
同时附上英语搜索的结果 o3mini 未开搜索和深度思考 完全正确的结果
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 12:15:28 UTC
- Score: 1
- ID: mhwr4ao
- Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwr4ao/
使用大模型最好还是使用非中文和比较不易混淆的语言去进行使用 避免不必要的信源缺失和幻觉问题
- Author: Own-Tadpole4447
- Created: 2025-03-15 12:20:19 UTC
- Score: 2
- ID: mhwrqvp
- Ups=2 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwrqvp/
嗯,我也是这么感觉的。感谢你的建议。但是我看了下上图的o3mini回复,仍然是错误的。它还是从“汉字的写法结构”入手来说,但其实“汉字的发音与该汉字与“常用汉字表”的关系”才是正确的回答。。。。
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 12:24:29 UTC
- Score: 1
- ID: mhwsahz
- Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsahz/
哦我没看三角的解释不好意思 那这个只一半
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 12:25:28 UTC
- Score: 1
- ID: mhwsf5p
- Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsf5p/
不过我发的都没有开深度搜索(我之前用完了)你看看有没有人开深度搜索的实验
- Author: Cheap-Awareness-3864
- Created: 2025-03-15 12:26:14 UTC
- Score: 2
- ID: mhwsis2
- Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwsis2/
https://preview.redd.it/fzl88h5yjuoe1.jpeg?width=1290&format=pjpg&auto=webp&s=f5598e48b5d3ebdf20b9629f809ea526ce48d551
常规搜索的o3mini加上英文是没错的吧
- Author: Southern_Dragonfly34
- Created: 2025-03-15 12:32:25 UTC
- Score: 2
- ID: mhwtcc0
- Ups=2 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwtcc0/
R1实际上是对标o1, V3是对标4o/o3-mini。deepseek最夸张的就是把本来openai卖20甚至200美元级别的服务直接免费了。所以deepseek R1出来之后,chatgpt和gemini也都把免费服务升级了。至于哪个厉害,这里有一个leaderboard. https://lmarena.ai/
我个人使用的话,有时候ChatGPT, Gemini, Deepseek(我用的腾讯元宝)都会开着,模型上来讲,我感觉还是ChatGPT最好用,回答的可读性更强。但是Gemini的工程做的更好,回复更快网络也不卡。
- Author: shinabuta106
- Created: 2025-03-15 12:58:58 UTC
- Score: 2
- ID: mhwx241
- Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhwx241/
我和你正好相反,二月那阵我确实觉得DS非常强大,反倒是这两个礼拜感觉很明显地降智了。
- Author: T0M0R1N
- Created: 2025-03-15 13:19:53 UTC
- Score: 1
- ID: mhx06cn
- Ups=1 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhx06cn/
不好意思借帖問一下,請問這裡有先審後發機制嗎,我剛發了文章卻完全找不到
- Author: treenewbee_
- Created: 2025-03-15 13:55:31 UTC
- Score: 1
- ID: mhx5rsa
- Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhx5rsa/
r1的完整版671b的參數,參數越多,智商越高,推理能力和聯想能力越強
- Author: NorthEmployer1505
- Created: 2025-03-15 14:32:38 UTC
- Score: 1
- ID: mhxc363
- Ups=1 | Downs=0 | FlairColor=dark | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxc363/
其他的模型的參數?
- Author: Own-Tadpole4447
- Created: 2025-03-15 14:46:42 UTC
- Score: 1
- ID: mhxemsx
- Ups=1 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxemsx/
听说r1是通过蒸馏技术来训练的,但是蒸馏技术是15年就已经产生的论文。
按道理这不应该是什么deepseek的独门技术。这次deepseek用这个理论大炒特炒,让我不禁怀疑,难道其他llm模型训练的时候没有用过这个理论吗?
- Author: banzai_23
- Created: 2025-03-15 15:19:58 UTC
- Score: 2
- ID: mhxkrqt
- Ups=2 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxkrqt/
有
- Author: taiwanGI1998
- Created: 2025-03-15 14:29:28 UTC
- Score: 3
- ID: mhxbizm
- Ups=3 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxbizm/
我用deepseek做實驗分析,忘記給一個assumption. 結果他生成的assumptions 跟gpt的o1一樣
誰抄襲誰?
- Author: Own-Tadpole4447
- Created: 2025-03-15 14:32:24 UTC
- Score: 1
- ID: mhxc1qm
- Ups=1 | Downs=0 | Submitter=true | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhxc1qm/
如果真是偷偷调用了chatgpt api(我不知道是不是真的)。呢中国政府算不算在做慈善。。。
- Author: 0000ffYakumo
- Created: 2025-03-15 19:59:36 UTC
- Score: 1
- ID: mhz2koa
- Ups=1 | Downs=0 | Permalink=/r/runtoJapan/comments/1jbtamr/deepseek的r1模型的推理能力似乎真的强于chatgpt的o3mini/mhz2koa/
ds说话太浮夸