大模型的“幻觉”,正在成为走向生产的最大障碍。
深言科技联合清华大学NLP实验室开源的LingoEDU,通过将信息处理“原子化”,在结构层面显著降低幻觉、提升可控性与可信度,为可信AI提供了全新的技术路径。在这一前沿技术从开发走向落地的全过程中,优刻得为深言科技提供了高性能GPU算力底座,支撑LingoEDU在真实业务场景下进行大规模推理、验证与迭代。

以结构化重构长文本
LingoEDU破解大模型“幻觉”难题
LingoEDU的核心思想,是在大模型进行推理和生成之前,先对长文本进行精细化、可解释的结构化预处理。
与传统“粗暴压缩”的方式不同,LingoEDU将文档拆分为不可再分的基本信息单元(EDU),并进一步构建语义结构树。每一个EDU都对应原文中的明确位置,并通过层级关系组织成完整的知识结构。

LingoEDU示意:将原文拆分成基本语义单元树后,能方便地在多文档问答、文档总结、DeepSearch等应用场景进行高效地上下文处理
在推理阶段,模型不再“自由创作”,而是通过指针机制引用EDU节点完成生成,从物理层面约束幻觉的产生,实现生成内容的精确溯源与高度忠实。
实验结果显示,LingoEDU在语义切分准确性、推理可靠性以及综合成本效率等方面,均显著优于现有主流方案。而且LingoEDU能够零成本适配所有大模型。在被称为“AGI终极试炼”的HLE(Humanity’s Last Exam)评测中,DeepSeek-R1在适配EDU技术后,准确率从9.0%提升至 13.6%,相对提升达51%。

从科研到生产
优刻得算力底座支撑技术落地
LingoEDU的精细切分、结构树构建、受限解码以及多模型协同推理,对算力的稳定性、并发能力与调度效率提出了更高要求。
为此,优刻得为深言科技提供了面向AI推理场景的完整底层支撑:
基于Kubernetes的云原生AI推理架构,支持EDU预处理模型、筛选模型与主推理模型的解耦部署与弹性伸缩
高性能GPU集群,满足长上下文、多文档、高并发推理需求
稳定、低抖动的算力交付能力,保障EDU索引、指针引用等强一致性推理流程可靠运行
在优刻得高性能算力的支撑下,LingoEDU完成大规模实验验证与真实业务场景测试,为技术的工程化落地奠定了坚实基础。
深言科技联合清华大学NLP实验室开发的LingoEDU,是大模型从黑盒生成迈向可解释、可溯源、可控制的重要实践。作为中立、安全的云计算与算力服务提供商,优刻得将持续以高性能GPU、云原生AI平台和完善的算力调度能力,支撑更多前沿技术从研究走向生产,助力客户构建真正可落地、可规模化的AI应用。


VIP复盘网