快科技10月30日音书比特派属于,今天,昆仑万维官方晓喻,开源百亿级大言语模子“天工”Skywork-13B系列,并荒原地配套开源了600GB、150B Tokens的超大高质料开源中语数据集。
凭证官方先容,昆仑万维“天工”Skywork-13B系列包括Skywork-13B-Base、Skywork-13B-Math两大模子及150B Tokens高质料中语数据集。
其中Skywork-13B-Base模子是Skywork-13B的基础模子,其经由3.2万亿个多言语高质料数据考试,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上皆展现了同等限制模子的最好后果。
Skywork-13B-Math模子经过有利的数学才调强化考试,在GSM8K等数据集上赢得了同等限制模子的最好后果。
本次开源的数据集大小约为600GB,总token数目约为150B,是当今开源最大的高质料中语数据集之一。
此外,昆仑万维还公开了模子中使用的评估活动、数据配比研究和考试基础门径调优决议等,助力关于大型模子预考试的贯通,鼓励东谈主工智能通用智能的终了。
当今开源社区中的中语大模子大批并非是透顶可商用,时常需要进行复杂的商用授权肯求历程,以致设定阻挡不给以买卖授权。
这次Skywork-13B系列大模子将全面绽放商用许可,无需再次肯求授权即可将大模子进行买卖用途,匡助更多对中语大模子感意思意思的用户和企业在行业中不休探索和跨越。
附Skywork-13B下载地址:
https://modelscope.cn/organization/skywork
bitpie怎么注册https://github.com/SkyworkAI/Skywork比特派属于
声明:新浪网独家稿件,未经授权拒接转载。 -->