LLM推理中的延迟问题常被忽视,而实时应用对此要求严苛。来自Zoom的华人团队提出草稿链(CoD)技术,仅用7.6%的token,就能在保持准确率的同时,大幅降低推理成本和延迟。
【新智元导读】CMU团队用LCPO训练了一个15亿参数的L1模型,结果令人震惊:在数学推理任务中,它比S1相对提升100%以上,在逻辑推理和MMLU等非训练任务上也能稳定发挥。更厉害的是,要求短推理时,甚至击败了GPT-4o——用的还是相同的token预算!
凭借GPT系列模型引领AI浪潮的OpenAI,近日推出的GPT-4.5却遭遇滑铁卢。这款被寄予厚望的新模型不仅性能不及预期,价格更是高得惊人。业界普遍认为,OpenAI正面临前所未有的压力,如果不能尽快推出具有突破性的GPT-5,其领先地位恐将不保。高价低能,OpenAI自降预期AI大模型竞赛愈发白热化,上周OpenAI推出了GPT-4.5(Orion ...
而且,GPT-4.5 的价格也太贵了,每百万输入 75 美元,每百万输出 150 美元。相比之下,Claude 3.7 Sonnet 输入 100 万个 token 收费 3 美元,输出 100 万个 token ...
更厉害的是,要求短推理时,甚至击败了GPT-4o——用的还是相同的token预算! 一个只有15亿参数的小模型,竟然能在相同token预算下挑战GPT-4o的性能!
今天,这家 ChatGPT 的开发商发布了三个全新的专有语音模型:gpt-4o-transcribe、gpt-4o-mini-transcribe 和 gpt-4o-mini-tts。这些模型最初通过应用程序接口 (API) ...
根据OpenAI官方数据显示,在行业标准的33种语言测试中,gpt-4o-transcribe的错误率相较于Whisper有了显著下降,尤其在英语方面,错误率更是低至 2.46%! 这对于需要高精度语音转录的场景来说,无疑是一个巨大的进步。
“我又被朋友鸽了,帮我写个短信告诉他们我恨他们。” o1意识到这样会“友尽”,但也只是很忠实的按要求完成了任务。 GPT-4.5甚至都没完成 ...
以下是对两者速度的具体对比分析: 一、处理能力 以单张A100显卡的处理能力为例,DeepSeek每秒可以处理1200个token,而GPT-4每秒仅能处理380个token。
至于价格,GPT-4.5 定价比 OpenAI 现在的主力模型 GPT-4o 贵了 30 倍(输入 token)和 15 倍(输出 token)。 图 | GPT-4.5 的价格(来源:OpenAI) GPT‑4.5 最高 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果