• 比特派唯一官网其经由3.2万亿个多语言高质量数据训练

  • 发布日期:2023-11-30 20:37    点击次数:65

    比特派唯一官网其经由3.2万亿个多语言高质量数据训练

    快科技10月30日消息比特派唯一官网,今天,昆仑万维官方宣布,开源百亿级大语言模型“天工”Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。

    根据官方介绍,昆仑万维“天工”Skywork-13B系列包括Skywork-13B-Base、Skywork-13B-Math两大模型及150B Tokens高质量中文数据集。

    其中Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。

    Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K等数据集上取得了同等规模模型的最佳效果。

    本次开源的数据集大小约为600GB,总token数量约为150B,是目前开源最大的高质量中文数据集之一。

    此外,昆仑万维还公开了模型中使用的评估方法、数据配比研究和训练基础设施调优方案等,助力对于大型模型预训练的认知,推动人工智能通用智能的实现。

    目前开源社区中的中文大模型多数并非是完全可商用,通常需要进行复杂的商用授权申请流程,甚至设定限制不给予商业授权。

    此次Skywork-13B系列大模型将全面开放商用许可,无需再次申请授权即可将大模型进行商业用途,帮助更多对中文大模型感兴趣的用户和企业在行业中不断探索和进步。

    米卢蒂诺维奇的名字对于中国球迷来说可谓再熟悉不过了。他以其独特的训练方法和卓越的指导能力带领中国足球队进军2002年世界杯,成为中国足球历史上的功勋教练。然而,他的影响力远超足球领域,他的智慧、坚韧和乐观精神激励着更多的人去追求梦想。在即将到来的国际象棋友谊赛中,他将展示他多才多艺的另一面。

    鉴于过去三年全国围棋锦标赛(个人)一直未能举行,为给众多职业棋手提供更多比赛机会,中国围棋协会拟于2023年9月举办由于疫情原因延期至今的2022年全国围棋锦标赛(个人),2023年11月举办2023年全国围棋锦标赛(个人)。

    (一)比赛时间:2023年9月30日至2023年10月2日

    过百龄是明末棋坛造诣最深,名声最大的国手。他出生于无锡锡北八士乡,15岁起称霸棋坛40余年。自2017年首届比赛成功举办以来,“过百龄杯”已连续成功举办五届,每年约有近200名业余5段以上的棋手前来参赛。

    近日,幸运购彩者董先生(化姓)到菏泽体彩分中心办理了领奖手续,将心仪的大奖收入囊中。据了解,董先生购彩多年,是体彩的一位“忠实”粉丝,尤其热衷于竞猜游戏玩法,平时偶尔也会打几注数字游戏,如大乐透、排列5等。董先生介绍说,闲暇之余到彩票店聊聊天、买上几注彩票是自己平时主要的娱乐方式,尤其是投注竞猜类游戏,拿着彩票看球赛更是别有一番乐趣。

    附Skywork-13B下载地址:

    https://modelscope.cn/organization/skywork

    https://github.com/SkyworkAI/Skywork比特派唯一官网

      声明:新浪网独家稿件,未经授权禁止转载。 -->