Mini R1 - 搜索 News

超过o1-mini、逼近o3-mini，DeepSeek-R1在新的贪吃蛇基准上拿下1801分

但 DeepSeek-R1 也有自己的特有优势：成本低。上周六，ARC Prize 又发布了一个新的基准，这一次 DeepSeek-R1 不仅超过了 o1-mini，与 o3-mini 的差距也非常小。这个新基准名为 SnakeBench，是一个 1v1 的对抗性基准。其思路很简单：将两个 LLM 放在一起进行贪吃蛇比赛。

36氪1 个月

超过o1-mini、逼近o3-mini，DeepSeek-R1在新的贪吃蛇基准上拿下1801分

上周六，ARC Prize 又发布了一个新的基准，这一次 DeepSeek-R1 不仅超过了 o1-mini，与 o3-mini 的差距也非常小。这个新基准名为SnakeBench，是一个 1v1 的 ...

腾讯网28 天

混元T1免费开放，实测媲美DeepSeek R1，完爆o3-mini

首先来测试一下它的推理能力，让它和DeepSeek R1和o3-mini打一场PK。注：因为是测试推理能力，不会使用R1和T1的联网功能，要不然跟开了挂一样。

1 天

刚刚，OpenAI史上最贵API上线！o1-pro比DeepSeek-R1溢价千倍

【新智元导读】刚刚，OpenAI正式上线史上最贵API——o1-pro，输入/输出价格贵到离谱，最高可达DeepSeek-R1的千倍。OpenAI研究员戏称，大模型界的劳斯莱斯。

腾讯网14 天

阿里开源推理模型QwQ-32B，实测PK比他大20倍的DeepSeek-R1

作者｜沐风来源｜AI先锋官3月6日凌晨，阿里巴巴发布并开源了全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。在冷启动基础上，阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习，在32B的模型尺寸 ...

IT168云计算·大数据频道 on MSN10 天

人工智能进入巅峰对决时刻，阿里QWQ-32B vs DeepSeek R1 vs O1 Mini

进入2025年，人工智能领域竞争变得更加白热化，其中以阿里QWQ-32B 、DeepSeek R1 和 O1 Mini为代表的三大主力模型表现更加亮眼，这些模型以各自的优势突破了推理、编码和效率的极限，为AI应用开发带来新范式。

15 天

阿里云通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）的 DeepSeek-R1 媲美。

来自MSN1 个月

人类自愧不如：DeepSeek R1、o3-mini和Gemini 2.0 思考过程大横评，AI们比 ...

恰逢Google也发布了Gemini 2.0 Flash Thinking。我们于是亲自上手，对 o3-mini、DeepSeek R1 和 Gemini 2.0 Flash Thinking 这三款当前最具代表性的推理模型进行了实测。

新浪网1 个月

OpenAI紧急上线O3 Mini，网友热评：DeepSeek R1 vs O3 Mini

AI军备竞赛正在加速。OpenAI的o3 - mini 表现出色，但DeepSeek R1 改变了竞争格局 —— 它成本更低、推理过程透明，而且具有重大地缘政治意义。从现在 ...

来自MSN1 个月

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

比如这个帖子宣称 OpenAI o3-mini 碾压了 DeepSeek R1。目前已引发近 400 万网友围观。该开发者用的 prompt 是："write a Python program that shows a ball bouncing inside ...

腾讯网1 个月

目前有哪些主流APP(或平台)接入了DeepSeek-R1？

这是一个海外的AI应用，集成的R1版本未知，部署在美国。用户可在 Perplexity 搜索框选择DeepSeek-R1作为回答模型，也可切换其他模型，比如openai的o3-mini。 R1 的强推理提升了 Perplexity 的深度研答能力，擅长处理复杂问题、执行多轮推理。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果