百川智能发布Baichuan2-53B大模型，全面升级降低幻觉，开放API接口

9月25日，百川智能发布Baichuan2－53B 闭源大模型，标志着其对人工智能技术的持续升级和创新。此次发布的新模型，各项能力比原先的Baichuan1－53B有了更大更全面的提升，不仅数学和逻辑推理能力提升显著，还通过高质量数据体系和搜索增强极大降低了模型幻觉。

百川智能此次还开放了 Baichuan2－53B API 接口，正式进军 To B 领域，开启商业化进程。这是百川智能发布的第 6 款大模型，自 4 月 10 日成立以来，百川智能平均每 28 天推出一个大模型。

全面提升数学和逻辑推理能力

大模型的数学和逻辑推理能力一直是业内的关注焦点，也是评价一款大模型是否领先的重要指标。百川智能于2023年8月8日发布Baichuan－53B搜索增强大模型，该模型在知识问答、文学创作等方面表现非常出色，展现出商业文案创作、文学创作、中文理解等多种任务场景下的强大能力。

在Baichuan－53B的基础上，Baichuan2－53B不仅重点强化了以上两个维度的能力，并且对整体能力进行了全面升级。其中，逻辑推理能力提升100％，数学能力提升31％，语言理解能力提升29％，文本创作提升18％，知识问答提升9％。

什么是大模型幻觉？

当模型生成的内容不遵循原文（与给定的输入或源内容不一致）（Faithfulness）或者和事实不符（Factualness），我们就可以认为模型出现了幻觉的问题。幻觉的定义针对不同场景会有一定的差异。

在传统任务里，幻觉大都是指Faithfulness，就是大模型的输出内容与输入内容不符或者无中生有。例如摘要任务，生成的内容和原文不符。例如大模型生成回复时，输出一些并没有体现在输入中的额外信息。

在通用领域的对话任务中，由于不是局限于特定任务，所以数据源可以看做任意的世界知识，这时的幻觉一般指生成的内容与事实不符。

高质量数据体系和智能搜索的全面升级，降低模型幻觉

幻觉是大模型落地应用必须跨越的鸿沟。通常而言，解决这一问题有两种方式，一种是不断增加模型的数据规模、提升数据质量；另一种是通过调用搜索等外部工具让模型能够获取实时信息。

Baichuan2－53B在两个方面均做了大量优化。高质量数据构建方面，Baichuan2－53B独创了一套数据质量体系。以低质、优质为标准将数据进行分类，确保Baichuan－53B始终使用优质数据进行预训练。

信息获取方面，Baichuan2－53B对多个模块进行了升级，包括指令意图理解、智能搜索和结果增强等关键组件。这一综合体系通过深入理解用户指令，精确驱动查询词的搜索，最终结合大语言模型技术，优化模型结果生成的可靠性，实现更精确、更智能的模型回答结果，减少模型幻觉。

在高质量数据体系和智能搜索的全面升级加持下，Baichuan2－53B有效降低了模型幻觉。由上海交通大学、卡内基梅隆大学、香港城市大学、Meta 等机构学者共同提出的一款通用框架“FacTool”，能够查核大模型生成内容的事实准确性。百川智能使用 FacTool 评测后的结果显示，Baichuan2－53B 的综合得分为140．5，在主流基础大模型中仅排在GPT－4之后，处于国内领先水平。

开放API，全面进军To B领域

除了能力全面升级以及降低模型幻觉外，Baichuan2－53B 还开放了API接口，这意味着企业和开发者可以通过API将Baichuan2－53B集成至他们的应用程序和服务中。Baichuan2－53B融合了最前沿的大模型技术，可以很好的适配不同企业的各种业务需求，无论是智能客服、智能写作还是智能推荐等各个方面。

Baichuan2－53B的API接口便捷易用，客户只需要简单的配置和集成即可接入，同时其对OpenAI的接口高度兼容，客户可以快速迁移，极大降低了模型的部署和转换成本。

API的调用服务费用按时间段分档，白天的费用为每千tokens 0．02元，而晚上则为每千tokens 0．01元，为用户提供更加灵活的选择。

百川智能的Baichuan2－53B的推出标志着中国人工智能领域的不断创新和发展，为更广泛的应用场景提供了强大的智能支持。未来，百川智能将持续探索大模型的能力边界，不断探索大模型技术的前沿创新，更好地赋能千行百业的智能化进程。

百川智能发布Baichuan2-53B大模型，全面升级降低幻觉，开放API接口

相关推荐