Dclm Sml - 搜索

约 76,000 个结果

在新选项卡中打开链接

时间不限

github.com
https://github.com › mlfoundations › dclm
mlfoundations/dclm: DataComp for Language Models - GitHub
DataComp-LM (DCLM) is a comprehensive framework designed for building and training large language models (LLMs) with diverse datasets. It offers a standardized corpus of over 300T …
huggingface.co
https://huggingface.co › TRI-ML
TRI-ML/DCLM-1B - Hugging Face
DCLM-1B is a 1.4 billion parameter language model trained on the DCLM-Baseline dataset, which was curated as part of the DataComp for Language Models (DCLM) benchmark. This model is …
zhihu.com
https://zhuanlan.zhihu.com
【LLM Pretrain data】DCLM - 知乎 - 知乎专栏
最终的训练集DCLM-BASELINE，使我们能够从零开始训练一个具有7B参数的语言模型，该模型在MMLU上的5-shot准确率达到了64%，使用了2.6T的训练tokens。学、习、总结，不断提高算 …
aihub.cn
https://www.aihub.cn › tools › llm
DCLM-7B：苹果最新推出的开源AI语言模型 - AIHub | AI导航
2024年7月22日 · dclm-7b是苹果与合作伙伴一起推出的开源小型语言模型，全部开源，包括权重、训练代码和数据集。 DCLM-7B性能优异，接近大型模型，采用decoder-only架构，上下文长 …
缺失:
- Sml
必须包含:
- Sml
163.com
https://www.163.com › dy › article
苹果没有发布7B小模型，而是发布了开源数据集测试平台DCLM
2024年7月22日 · 我们介绍了用于语言模型的数据比较（DataComp for Language Models，简称DCLM），这是一个用于控制数据集实验的测试平台，目标是改进语言模型。作为DCLM的一 …
缺失:
- Sml
必须包含:
- Sml
hyper.ai
https://hyper.ai › cn › news
数据集：使用 DCLM 构建高质量的训练数据集 - Hyper.AI
如下图所示，DCLM 的工作流主要由 4 个步骤构成：选择计算规模 (Select a scale) 、建立数据集 (Build a dataset) 、训练模型 (Train a model) 、基于 53 个下游任务上进行模型评估 (Evaluate) 。
缺失:
- Sml
必须包含:
- Sml
51cto.com
https://blog.51cto.com
DCLM-7B PyTorch模型微调入门实战 - 51CTO博客
2024年10月21日 · DCLM-7B是由苹果公司联合研究团队开发的一个开源AI语言模型，它基于PyTorch和OpenLM框架开发，采用decoder-only架构，上下文长度为2048，在53个自然语言 …
缺失:
- Sml
必须包含:
- Sml
atyun.com
https://www.atyun.com
苹果开源发布小模型DCLM-7B，性能优于Mistral-7B - ATYUN
2024年7月22日 · 深入剖析Apple DCLM模型，其背后是苹果携手华盛顿大学、特拉维夫大学及丰田研究所等多方力量共同推进的DataComp项目。该项目聚焦于构建高质量数据集，以优化AI模 …
缺失:
- Sml
必须包含:
- Sml
csdn.net
https://blog.csdn.net › article › details
[论文笔记] DCLM 分长度区间进行长文本抽取 - CSDN博客
2024年8月26日 · 使用DCLM 9.4在64位系统中优化IT资源管理和监控效率，首先需利用其64位架构下的内核参数优化特性，以及双数据库策略来提升性能。以下是针对不同监控场景的具体操 …
缺失:
- Sml
必须包含:
- Sml
36kr.com
https://www.36kr.com
大模型out了，小模型（SLM）爆火，撕开99%企业市场？-36氪
Hugging Face 推出了高性能的小型语言模型 SmoLLM，包括 135M、360M 和 1.7B，能够直接在浏览器中运行； OpenAI 紧随其后发布了GPT-4o mini，直接让GPT-3.5 Turbo成为历史； …

分页
- 1
- 2
- 3
- 4
- 下一页

mlfoundations/dclm: DataComp for Language Models - GitHub

TRI-ML/DCLM-1B - Hugging Face

【LLM Pretrain data】DCLM - 知乎 - 知乎专栏

DCLM-7B：苹果最新推出的开源AI语言模型 - AIHub | AI导航

缺失:

必须包含:

苹果没有发布7B小模型，而是发布了开源数据集测试平台DCLM

缺失:

必须包含:

数据集：使用 DCLM 构建高质量的训练数据集 - Hyper.AI

缺失:

必须包含:

DCLM-7B PyTorch模型微调入门实战 - 51CTO博客

缺失:

必须包含:

苹果开源发布小模型DCLM-7B，性能优于Mistral-7B - ATYUN

缺失:

必须包含:

[论文笔记] DCLM 分长度区间进行长文本抽取 - CSDN博客

缺失:

必须包含:

大模型out了，小模型（SLM）爆火，撕开99%企业市场？-36氪