Token Aigc - 搜索

约 232,000 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://zhuanlan.zhihu.com
在机器学习领域“token”到底是什么意思? - 知乎
2024年5月22日 · Token 词元在机器学习领域，NLP、文生图、图像识别与处理等领域，机器无法直接读取词汇、语句、图像、声音等等，而是通过 Token 来进行的。那么“Token”是什么呢？
csdn.net
https://blog.csdn.net › Code_LT › article › details
【AIGC】大语言模型千问、gpt、智谱token计算-tiktoken、get_to…
2024年7月26日 · Token是自然语言处理（NLP）和机器学习中的基本单元，它代表文本中的一个有意义的片段，如单词、短语或子词。在大型语言模型（LLM）中，Token是模型理解和生成文本的基础。Token的定义和使用依赖于模型架构和处理语言的特性。
jindouyun.cn
https://www.jindouyun.cn › document › industry › details
【AIGC】大语言模型千问、gpt、智谱token计算-tiktoken、get_to…
2024年7月29日 · 一、token计算. 编码（encode）是指将文本映射为token的数字列表，解码（decode）是指将token的数字列表转化为文本。给定一个文本字符串（例如"tiktoken is great!"
ithome.com.tw
https://ithelp.ithome.com.tw › articles
生成式A.I.(AIGC)從0開始 - Tokens 介紹 - iT 邦幫忙::一起幫忙解決 …
2023年9月19日 · Token是文本的基本元素，可以是單詞、子詞、字符或者更小的單位，具體取決於模型的Tokenization策略. Token是模型理解和生成文本的基本單位。模型會將文本轉換為token序列，並根據這些tokens進行計算、生成、理解和回應文本。前面我們也有提到滿多次Tokens的概念，中文又叫分詞像是GPT模型會看到GPT-3.5 turbo 16K、gpt-4 32k這裡的16K就是支援的Tokens數量，就是一次可以輸入+輸出 1600...
csdn.net
https://blog.csdn.net › Tyro_java › article › details
AIGC: 关于ChatGPT中token和tiktoken工具 - CSDN博客
2023年12月1日 · 本文介绍了在AIGC中，token作为GPT处理文本的基础单位，用于将文本转化为可处理的数据格式。重点讨论了tiktoken工具，它是OpenAI开源的快速分词工具，用于拆分输入文本成token列表。
github.com
https://github.com › wshzd › Awesome-AIGC
wshzd/Awesome-AIGC: AIGC资料汇总学习，持续更新...... - GitHub
自2022年11月份OpenAI公布ChatGPT以来，ChatGPT在五天之内注册用户数就突破了百万. 由此拉开了AIGC大模型的序幕，也有人称为是AI2.0时代，2023年3月14日又发布了GPT4，性能进一步得到提升，关于ChatGPT和GPT4为代码的文本生成以及Codex的代码生成等博客和论文层出不穷，这里对一些重点资料进行了整理归类，持续更新中...... 欢迎加入AIGC技术交流群，与AI领域专家和各行各业的AIGC爱好者一起交流技术理论与行业信息！不管你是学术界还是工业界实践者 …
sohu.com
https://www.sohu.com
AIGC名词解释：Token 词元_Stable_领域_WebUI - 搜狐
2023年10月7日 · 但是在人工智能 AIGC 领域，通常是指“词元”，它是语言类模型的最小数据单位。在提示词文本发送给神经网络之前，Tokenizer 将组合词、句子、段落、文章这类型的长文本分解为最小单位的 Token 词元，并且用向量来表示数据结构，输入给神经网络，形成神经网络阅读和理解文本的方式。所谓最小单位的“词元”，或者说单词的“片段”，就是不可再拆分的最小语义单位，比如 “waterfall”，会被拆成2个 token：water、fall。另外，标点符号也会被分解为 token， …
cnblogs.com
https://www.cnblogs.com
【AIGC】Embedding与LLM：token长度限制困局下，长文本LLM …
2023年5月10日 · Embedding在AI中的重要性在于，它可以帮助我们解决LLM的tokens长度限制问题。通过使用Embedding，我们可以在与LLM交互时，仅在上下文窗口中包含相关的文本内容，从而不会超过tokens的长度限制。
zhihu.com
https://zhuanlan.zhihu.com
【AIGC】All you need is Embedding？Token长度困境下的泛长文 …
【导读】 LLM 是当下AIGC中最火热的领域。受限于其深度学习模型本身的token最大长度，市面上当前可用的LLM产品接口几乎都无法直接处理长文档（例如，中长篇小说）。
csdn.net
https://blog.csdn.net › article › details
「AIGC」Python实现tokens算法_tokenizer 计算token数量-CSDN …
2024年5月14日 · 本文探讨了如何在Python中实现tokens算法，旨在减少对openai等API的频繁调用，实现资源的有效利用。文章分为设计思路、业务场景和核心代码三个部分，详细介绍了初始化tokenizer、文本到tokens的转换以及tokens数量的计算过程。
某些结果已被删除
分页
- 1
- 2
- 3
- 4
- 下一页

在机器学习领域“token”到底是什么意思? - 知乎

【AIGC】大语言模型千问、gpt、智谱token计算-tiktoken、get_to…

【AIGC】大语言模型千问、gpt、智谱token计算-tiktoken、get_to…

生成式A.I.(AIGC)從0開始 - Tokens 介紹 - iT 邦幫忙::一起幫忙解決 …

AIGC: 关于ChatGPT中token和tiktoken工具 - CSDN博客

wshzd/Awesome-AIGC: AIGC资料汇总学习，持续更新...... - GitHub

AIGC名词解释：Token 词元_Stable_领域_WebUI - 搜狐

【AIGC】Embedding与LLM：token长度限制困局下，长文本LLM …

【AIGC】All you need is Embedding？Token长度困境下的泛长文 …

「AIGC」Python实现tokens算法_tokenizer 计算token数量-CSDN …