
wmt/wmt14 · Datasets at Hugging Face
Versions exist for different years using a combination of data sources. The base wmt allows you to create a custom dataset by choosing your own data/language pair. This can be done as …
WMT (Workshop on Machine Translation)|机器翻译数据集
2024年11月2日 · wmt数据集主要用于训练和评估机器翻译模型,研究人员可以通过下载数据集并将其分割为训练集、验证集和测试集。 使用时,建议结合最新的机器学习框架, …
WMT|机器翻译数据集 - selectdataset.com
2024年10月25日 · WMT(Workshop on Machine Translation)数据集主要用于机器翻译任务,包含了多种语言对的翻译文本,如英语-德语、英语-法语等。 数据集包括了平行语料库,即源语 …
WMT Kapulet and Twista : r/DRILLINGAU - Reddit
2024年2月22日 · 6.9K subscribers in the DRILLINGAU community. This reddit covers all aspects of Australian, hip hop, grime, rap and of course drill scene and…
常用数据集 - CSDN博客
2022年5月10日 · The Multitarget TED Talks Task (MTTT):该数据集包含基于TED演讲的多种语言的平行语料,包含中英文等共计20种语言。 ASPEC Chinese-Japanese:该数据集主要研 …
[机器翻译-数据集] 批量获取所有WMT数据(初步解决方案)
2022年5月28日 · 本文旨在总结批量获取所有WMT数据的初步解决方案,通过修改huggingface datasets 库的源码实现。 第一步, pip install datasets安装datasets库。 第三步,创建主程序 …
NLP | WMT数据集说明 - 张Zong在修行 - 博客园
2023年8月7日 · 可以找到并行数据、单语训练数据。 表格中一个语料库表现有哪些语言,还有相应的说明。 点击你想用的数据集进行下载。
WMT 2014 Dataset - Papers With Code
WMT 2014 is a collection of datasets used in shared tasks of the Ninth Workshop on Statistical Machine Translation. The workshop featured four tasks: a news translation task, a quality …
NLP数据集概览-CSDN博客
2020年5月18日 · WMT(Workshop on Machine Translation)数据集:WMT是机器翻译领域的一项国际竞赛,提供了多种语言对的翻译数据集,包括英语、法语、德语、西班牙语、中文等等 …
Fairseq 机器翻译全流程一文速通 (NMT, WMT, translation) - ysngki …
2023年11月7日 · 本文旨在梳理如下流程:1)准备 WMT23 的数据 (其余生成任务皆可类比),2)训练模型,3)用 sacrebleu、COMET-22 评测模型。 不想要 wmt 的数据,想要自己 …