GPT Token - 搜索

约 2,190,000 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://www.zhihu.com › question
ChatGPT如何计算token数？ - 知乎
首先 OpenAI token 的计算包含两部分。输入给 GPT 模型的 token 数和 GPT 模型生成文本的 token 数。例如，你提问耗费了 100 token，GPT 根据你的输入，生成文本（也就是回答）了 200 token，那么一共消费的 token 数就是 300 。那么 token 和字符是如何映射的呢，是什么关系呢？
zhihu.com
https://www.zhihu.com › question › answers › updated
为什么大模型输入输出往往只有2K, 4K token? - 知乎
例如，GPT-3模型的上下文窗口大小通常在2048个Token左右。 2. 模型的上下文记忆能力：上下文窗口还决定了模型在生成回答时能够考虑的上下文信息的量。
zhihu.com
https://www.zhihu.com › question › answers › updated
为什么gpt模型输入的token最大数量被限制在几万，是有技术问题 …
GPT模型输入的token数量被限制在较小的范围（几千到几万）有以下技术上的原因： 1. **计算资源限制**：GPT模型是一个非常庞大的神经网络，具有数以亿计的参数。对于处理大量的token输入，需要大量的计算资源和内存来执行模型的前向计算和反向传播。
zhihu.com
https://www.zhihu.com › question
如何在python中计算一个带有中文字符的字符串包含多少token?
在Python中使用GPT模型（如ChatGPT）来计算一个字符串中包含的token数量，可以借助相应的NLP库，例如transformers库。以下是一个示例代码，演示如何计算一个带有中文字符的字符串包含的token数量：首先，确保你已经安装了transformers库，你可以使用以下命令安装它：
zhihu.com
https://www.zhihu.com › question
用transformer做视觉，具体是怎么把图片转成token的？ - 知乎
这些图像的token意义上等价于文本的token，都是原来信息的序列表示。不同的是，文本的token是通过分词算法分到的subword，这些subword会被映射到字典的index；也就是说，文本的token是一个数字。而图像的一个token（patch）是一个 16\times16\times3 的矩阵。那么现在问题 ...
zhihu.com
https://www.zhihu.com › question
为什么gpt模型输入的token最大数量被限制在几万，是有技术问题 …
为什么gpt模型输入的token最大数量被限制在几万，是有技术问题吗？即使是按使用量付费的api也同样有这个限制具体到不同模型可能限制还不一样，少的只有几千显示全部
zhihu.com
https://www.zhihu.com › question
deepSeek，可以用来干啥，用了一下感觉和gpt差不多呀？ - 知乎
本来deepseek与GPT都差不多啊（当然模型内部差异是很大的)，都是LLM（语言类通用大模型）。不过最近deepseek刚升级v3。感觉知识库比GPT要新一些。而且相对一些环境来说，比GPT用起来方便得多。其实日常用感觉不出来太多区别。
zhihu.com
https://www.zhihu.com › question
有没有大佬能推测一下GPT-4o mini的参数规模啊？ - 知乎
23年10月，微软论文声称GPT-3.5-Turbo只有20B参数的时候，就有人感叹：难怪OpenAI对开源模型这么紧张。 24年3月，英伟达确认GPT-4是1.8T MoE，而2000张B200可以在90天内完成训练的时候，大家觉得MoE已经且仍将是大模型架构趋势。
zhihu.com
https://www.zhihu.com › question
使用chatGPT在线对话的时候，比较长的答案每次都说一半就结束 …
response = openai.Completion.create(model="gpt-3.5-turbo", prompt="你的问题", max_tokens=可设置的最大返回token数) 如果所需的答案可能超过4096个token，那么2.1所提供的方法也没辙，这个时候要将问题分段(chunck)，然后每段分别prompt提问给chatgpt api。
zhihu.com
https://www.zhihu.com › question
GPT-4有一个32k版本，会比普通的GPT-4性能提升多少呢？ - 知乎
那么GPT-4-8K，大致可以保持16轮的对话，包括你的输入和GPT的输出。之后它会逐渐忘记之前说过的话，而且错误率会大增，漏洞百出，出现明显的幻觉。 ——现在想起来，在ChatGPT中 GPT-4 model 被设置为3小时25条。这个25条可能就是GPT-4-8K维持性能的极限。
分页
- 1
- 2
- 3
- 4
- 下一页