
om-ai-lab/VLM-R1 - GitHub
5 天之前 · In this project, we propose VLM-R1, a stable and generalizable R1-style Large Vision-Language Model. Specifically, for the task of Referring Expression Comprehension (REC), we …
deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B - Hugging Face
DeepSeek-R1-Zero, a model trained via large-scale reinforcement learning (RL) without supervised fine-tuning (SFT) as a preliminary step, demonstrated remarkable performance on …
DeepSeek-R1模型1.5B/7B/14B/70B/671B区别及硬件配置要求
关于不同尺寸的DeepSeek-R1版本介绍、参数量、特点、使用场景和硬件配置,可以参考下表: 适合高精度专业领域任务,比如多模态任务预处理。 这些任务对硬件要求非常高,需要高端 …
Deepseek R1 - AI 模型完整列表
2025年1月20日 · 了解 Deepseek R1,其特性、参数以及如何使用它。
ATK官网 - VXE
ATK官网-全新独立外设品牌ATK,旗下现有VXE和ATK两大系列,出品极致电竞装备,打造潮流外设产品。
GitHub - PeterGriffinJin/Search-R1: Search-R1: An Efficient, …
Search-R1 is an extension of DeepSeek-R1(-Zero) methods for training reasoning and searching (tool-call) interleaved LLMs. We built upon veRL. Through RL (rule-based outcome reward), …
14G 显存跑动千亿大模型!基于 KTransformers 的 DeepSeek-R1' …
2025年2月24日 · 性能表现:在 24GB 显存环境下,KTransformers 可以运行 DeepSeek-R1 和 V3 的 671B 满血版模型,预处理速度最高可达 286 tokens/s,推理生成速度最高可达 14 tokens/s。
“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生 …
2025年2月7日 · 根据论文,s1 能够达到不错效果的核心有两点: s1K 数据集和预算强制法(budget forcing)。 s1 团队构建的 s1K 数据集包含 1,000 个精心挑选的问题,包括数学竞赛 …
【唐叔学AI】一张图彻底拆解DeepSeek V3和R1双模型-CSDN博客
3 天之前 · 文章浏览阅读1.1k次,点赞33次,收藏11次。唐叔带你读懂DeepSeek家族的技术内幕 ~ 【唐叔学AI】一张图彻底拆解DeepSeek V3和R1双模型 ... 今天咱们来聊聊DeepSeek系列模 …
使用ollama运行deepseek r1 满血版教程 - CSDN博客
2025年2月28日 · 文章浏览阅读1.1k次,点赞7次,收藏4次。1、ollama run deepseek-r1:671b但是只有开始下载的前几分钟快,后续速度变慢,ollama又支持断点下载,所以,直接写个脚本 …
- 一些您可能无法访问的结果已被隐去。显示无法访问的结果