澜舟科技开源Mengzi3-13B模型 助力学术研究与商业应用

   时间:2024-04-01 17:24 来源:数据世界

【数据世界网】4月1日消息,澜舟科技近期宣布了重大进展,将Mengzi3-13B模型进行开源,这一举措不仅为学术研究提供了更为广阔的探索空间,同时也为企业免费商用提供了强有力的支持。

据了解,相较于今年早些时候发布的孟子大模型GPT V2系列,Mengzi3-13B在数据集质量上实现了质的飞跃。该模型依托的Mengzi-3数据集规模庞大,高达3T tokens,涵盖了网页、代码、书籍、论文等多种类型的数据,充分保证了模型的广泛性和深度。

在MMLU、Chinese-MMLU、GSM8K、HUMAN-eval等多项公开数据集测试中,Mengzi3-13B展现出了令人瞩目的性能。特别是在参数量20B以内的轻量化大模型领域,该模型在中英文语言能力方面的表现尤为出色,充分证明了其强大的实用性和高性价比。据数据世界了解,这一特性使得Mengzi3-13B能够更好地满足企业的商业化需求,为行业发展注入了新的活力。

 
 
更多>同类内容
全站最新
热门内容