GLM-4-long – 智谱AI推出的200万字长文本模型(已开放API)
GLM-4-long 是智谱AI推出的200万字长文本模型,现已在 智谱AI开放平台 BigModel 上开放API调用。 支持超长输入专为处理超长文本和记忆型任务设计,上下文长度最高为1M,约150-200万字,相当于2本红楼梦或者125篇论文。
揭秘LLM长链思考(Long CoT) :如何让AI像人一样深度推理?
这篇论文深入探讨了如何让LLM像人类一样进行深度推理,通过 更长、更复杂的思考过程 来解决难题。 这不仅仅是简单地生成答案,而是让AI学会像人类一样逐步分析问题、反思错误、并迭代改进。 一、为什么我们需要长链思考? LLM的推理能力:大模型在数学和编程等领域展现出卓越的推理能力。 它们通过 链式思考(Chain-of-Thought, CoT) 的方式,逐步生成中间推理步骤,最终得出答案,从而提高解决问题的准确性。 复杂任务的挑战:面对 高度复杂的推理任务,如数 …
长思维链模型(Long-CoT)对AI-Infra的启发 - 知乎 - 知乎专栏
Long CoT(Long Chain-of-Thought)技术路线是一种基于思维链(Chain-of-Thought, CoT)的推理增强技术,旨在通过生成更长的 推理链 来提升大型语言模型(LLM)在复杂推理任务中的性能。
What Is Long-Thinking AI and Why Does It Matter? - Built In
3 days ago · Long-thinking AI takes its time to reason with complex problems — generating more insightful responses and reducing hallucinations and other errors while decreasing the time to data. Long-thinking AI, therefore, is designed for accurate outputs for challenging problems, including science, math or coding.
Kimi - 会推理解析,能深度思考的AI助手
Kimi 是一个有着超大“内存”的智能助手,可以一口气读完二十万字的小说,还会上网冲浪,快来跟他聊聊吧 | Kimi - Moonshot AI 出品的智能助手
LangChain:介绍与入门 | ️ Langchain
在本文中,我们将介绍这个库,并从 LangChain 提供的最简单的组件开始 —— LLMs。 LangChain 的核心,LangChain 是围绕 LLMs 构建的框架。 我们可以将其用于聊天机器人, G enerative Q uestion- A nswering (GQA),摘要等等。 该库的核心思想是我们可以将不同的组件 “ 链 ” 在一起,以创建更高级的 LLMs 用例。 链可能由来自几个模块的多个组件组成: Prompt templates:Prompt templates 是不同类型提示的模板。 例如“ chatbot ”样式模板、ELI5 问答等. …
Long-VITA - 腾讯优图联合南大、厦大开源的多模态模型 | AI工具集
Long-VITA 是腾讯优图实验室、南京大学、厦门大学开源的多模态模型,能处理超过100万tokens的长文本输入,在短文本任务中表现出色。Long-VITA基于分阶段训练,逐步扩展视觉和语言的上下文理解能力,支持图像、视频和文本的多模态输入。
LongReward - 清华、中科院、智谱AI联合推出提升长文本大语言模型性能的方法 | AI …
LongReward是清华大学、中国科学院、智谱AI联合推出的,基于AI反馈改进长文本大型语言模型(LLMs)性能的方法。 LongReward从有用性、逻辑性、忠实性和完整性四个维度为模型响应打分,提供奖励信号,强化学习的方式优化模型,让模型在处理长文本时更准确 ...
[2503.14499] Measuring AI Ability to Complete Long Tasks
3 days ago · Despite rapid progress on AI benchmarks, the real-world meaning of benchmark performance remains unclear. To quantify the capabilities of AI systems in terms of human capabilities, we propose a new metric: 50%-task-completion time horizon. This is the time humans typically take to complete tasks that AI models can complete with 50% success rate. We first timed humans with relevant domain ...
long-ai | F6S
LongAI automates and democratizes technical document and data processing for enterprises. LongAI's enterprise software enables companies in the manufacturing industry to convert all types of unstructured industrial documents into structured data that forms the basis for all advanced digital processes.