开放API进军To B,百川智能发布闭源大模型Baichuan2-53B | 最前线

周 愚·2023年09月25日 14:15
在Baichuan1-53B的基础上,Baichuan2-53B的逻辑推理能力提升了100%,数学能力提升了31%。

作者 | 周愚 

编辑 | 邓咏仪

36氪获悉,9月25日,百川智能正式发布了Baichuan2-53B闭源大模型,同时还一并开放了该模型的API接口,正式进军To B领域,开启商业化进程。

百川依旧保持着“小步快跑”的模型发布速度。这已是自4月10日成立以来,百川智能发布的第6款大模型,平均下来几乎是每28天推出一个大模型。

对比上月初发布的Baichuan1-53B,Baichuan2-53B在数学、逻辑推理等能力上均有显著提升,还在模型幻觉方面表现良好。百川智能称,该模型是“目前国内幻觉问题最低的大模型”。

据百川智能,在Baichuan1-53B的基础上,Baichuan2-53B的逻辑推理能力提升了100%,数学能力提升了31%。此外,Baichuan2-53B在语言理解能力、文本创作能力和知识问答能力上,也分别有29%、18%和9%的提升。

图源:企业供图

在模型幻觉方面,Baichuan2-53B采取了两方面的改进措施。一方面,百川增加了模型的数据规模、提升数据质量,另一方面也通过调用搜索等外部工具让模型能够获取实时信息。

百川智能使用FacTool评测后的结果显示,Baichuan2-53B 的综合得分为140.5,在主流基础大模型中仅排在GPT-4之后,处于国内领先水平。

图源:企业供图

据悉,FacTool是由上海交通大学、卡内基梅隆大学、香港城市大学、Meta 等机构学者共同提出的一款通用框架,能够查核大模型生成内容的事实准确性。

具体而言,Baichuan2-53B独创了一套数据质量体系,以低质、优质为标准将数据进行分类,确保Baichuan2-53B始终使用优质数据进行预训练。信息获取方面,Baichuan2-53B也对指令意图理解、智能搜索和结果增强等多个模块进行了升级。

图源:企业供图

除了能力升级之外,开放API接口也是此次发布的一大亮点。企业和开发者可以通过API将Baichuan2-53B集成至他们的应用程序和服务中,适配用户在智能客服、智能写作、智能推荐等多种不同场景的需求。

在安全合规问题方面,作为首批通过《生成式人工智能服务管理暂行办法》备案的大模型企业,百川智能为Baichuan2-53B打造了覆盖大模型预训练、精调、推理全周期的安全增强。

值得一提的是,Baichuan2-53B的API接口对OpenAI的接口高度兼容,客户可以实现快速迁移,降低模型的部署和转换成本。

+1
30

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

手握现金超3000亿元,上市酒企奏响科创投资“狂想曲”。

2023-09-25

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业