午夜激情电影在线播放_色佬视频在线观看_国产va免费精品高清在线观看_美女视频一区二区三区在线_91免费高清视频_91成人看片_国产18精品乱码免费看_成人av色在线观看_女生裸体视频一区二区三区_国产在线视频你懂的

昆侖萬維開源2千億稀疏大模型天工MoE,全球首創(chuàng)能用4090推理

速途網(wǎng)6月3日消息(報(bào)道:李楠)今日,昆侖萬維宣布開源 2 千億稀疏大模型 Skywork-MoE , 性能強(qiáng)勁, 同時(shí)推理成本更低。Skywork-MoE 基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴(kuò)展而來,是首個(gè)完整將 MoE Upcycling 技術(shù)應(yīng)用并落地的開源千億 MoE大模型,也是首個(gè)支持用單臺 4090 服務(wù)器推理的開源千億 MoE大模型。

開源地址:

Skywork-MoE 的模型權(quán)重、技術(shù)報(bào)告完全開源,免費(fèi)商用,無需申請:

? 模型權(quán)重下載:

https://huggingface.co/Skywork/Skywork-MoE-base

https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

? 模型開源倉庫:https://github.com/SkyworkAI/Skywork-MoE

? 模型技術(shù)報(bào)告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

? 模型推理代碼:(支持 8×4090 服務(wù)器上 8 bit 量化加載推理) https://github.com/SkyworkAI/vllm

模型架構(gòu):

本次開源的 Skywork-MoE 模型隸屬于天工 3.0 的研發(fā)模型系列,是其中的中檔大小模型(Skywork-MoE-Medium),模型的總參數(shù)量為 146B,激活參數(shù)量 22B,共有 16 個(gè) Expert,每個(gè) Expert 大小為 13B,每次激活其中的 2 個(gè) Expert。

天工 3.0 還訓(xùn)練了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)兩檔 MoE 模型,并不在此次開源之列。

模型能力:

我們基于目前各大主流模型評測榜單評測了 Skywork-MoE,在相同的激活參數(shù)量 20B(推理計(jì)算量)下,Skywork-MoE 能力在行業(yè)前列,接近 70B 的 Dense 模型。使得模型的推理成本有近 3 倍的下降。同時(shí) Skywork-MoE 的總參數(shù)大小比 DeepSeekV2 的總參數(shù)大小要小 1/3,用更小的參數(shù)規(guī)模做到了相近的能力。

技術(shù)創(chuàng)新:

為了解決 MoE 模型訓(xùn)練困難,泛化性能差的問題,相較于 Mixtral-MoE, Skywork-MoE 設(shè)計(jì)了兩種訓(xùn)練優(yōu)化算法:

1. Gating Logits 歸一化操作

我們在 Gating Layer 的 token 分發(fā)邏輯處新增了一個(gè) normalization 操作,使得 Gating Layer 的參數(shù)學(xué)習(xí)更加趨向于被選中的 top-2 experts,增加 MoE 模型對于 top-2 的置信度:

2. 自適應(yīng)的 Aux Loss

有別于傳統(tǒng)的固定系數(shù)(固定超參)的 aux loss, 我們在 MoE 訓(xùn)練的不同階段讓模型自適應(yīng)的選擇合適的 aux loss 超參系數(shù),從而讓 Drop Token Rate 保持在合適的區(qū)間內(nèi),既能做到 expert 分發(fā)的平衡,又能讓 expert 學(xué)習(xí)具備差異化,從而提升模型整體的性能和泛化水平。在 MoE 訓(xùn)練的前期,由于參數(shù)學(xué)習(xí)不到位,導(dǎo)致 Drop Token Rate 太高(token 分布差異太大),此時(shí)需要較大的 aux loss 幫助 token load balance;在 MoE 訓(xùn)練的后期,我們希望 Expert 之間仍保證一定的區(qū)分度,避免 Gating 傾向?yàn)殡S機(jī)分發(fā) Token,因此需要較低的 aux loss 降低糾偏。

訓(xùn)練 Infra

如何對 MoE 模型高效的進(jìn)行大規(guī)模分布式訓(xùn)練是一個(gè)有難度的挑戰(zhàn),目前社區(qū)還沒有一個(gè)最佳實(shí)踐。Skywork-MoE 提出了兩個(gè)重要的并行優(yōu)化設(shè)計(jì),從而在千卡集群上實(shí)現(xiàn)了 MFU 38% 的訓(xùn)練吞吐,其中 MFU 以 22B 的激活參數(shù)計(jì)算理論計(jì)算量。

1. Expert Data Parallel

區(qū)別于 Megatron-LM 社區(qū)已有的 EP(Expert Parallel)和 ETP(Expert Tensor Parallel)設(shè)計(jì),我們提出了一種稱之為 Expert Data Parallel 的并行設(shè)計(jì)方案,這種并行方案可以在 Expert 數(shù)量較小時(shí)仍能高效的切分模型,對 Expert 引入的 all2all 通信也可以最大程度的優(yōu)化和掩蓋。相較于 EP 對 GPU 數(shù)量的限制和 ETP 在千卡集群上的低效, EDP 可以較好的解決大規(guī)模分布式訓(xùn)練 MoE 的并行痛點(diǎn),同時(shí) EDP 的設(shè)計(jì)簡單、魯棒、易擴(kuò)展,可以較快的實(shí)現(xiàn)和驗(yàn)證。

一個(gè)最簡單的 EDP 的例子,兩卡情況下 TP = 2, EP = 2, 其中 Attention 部分采用 Tensor Parallel , Expert 部分采用 Expert Parallel

2. 非均勻切分流水并行

由于 first stage 的 Embedding 計(jì)算和 last stage 的 Loss 計(jì)算,以及 Pipeline Buffer 的存在, 流水并行下均勻切分 Layer 時(shí)的各 stage 計(jì)算負(fù)載和顯存負(fù)載均有較明顯的不均衡情況。我們提出了非均勻的流水并行切分和重計(jì)算 Layer 分配方式,使得總體的計(jì)算/顯存負(fù)載更均衡,約有 10% 左右的端到端訓(xùn)練吞吐提升。

比較均勻切分和非均勻切分下的流水并行氣泡:對于一個(gè) 24 層 Layer 的 LLM, (a) 是均勻切分成 4 個(gè) stage,每個(gè) stage  的 layer 數(shù)量是:[6, 6, 6, 6].(b) 是經(jīng)過優(yōu)化后的非均勻切分方式,切成 5 個(gè) stage, 每個(gè) stage 的 layer 數(shù)量是:[5, 5, 5, 5, 4] , 在中間流水打滿的階段,非均勻切分的氣泡更低。

MoE Know-how

此外,Skywork-MoE 還通過一系列基于 Scaling Laws 的實(shí)驗(yàn),探究哪些約束會影響 Upcycling 和 From Scratch 訓(xùn)練 MoE 模型的好壞。

一個(gè)可以遵循的經(jīng)驗(yàn)規(guī)則是:如果訓(xùn)練 MoE 模型的 FLOPs 是訓(xùn)練 Dense 模型的 2 倍以上,那么選擇 from Scratch 訓(xùn)練 MoE 會更好,否則的話,選擇 Upcycling 訓(xùn)練 MoE 可以明顯減少訓(xùn)練成本。

4090 推理

Skywork-MoE 是目前能在 8×4090 服務(wù)器上推理的最大的開源 MoE 模型。8×4090 服務(wù)器一共有 192GB 的 GPU 顯存,在 FP8 量化下(weight 占用 146GB),使用我們首創(chuàng)的非均勻 Tensor Parallel 并行推理方式,Skywork-MoE 可以在合適的 batch size 內(nèi)達(dá)到 2200 tokens/s 的吞吐。天工團(tuán)隊(duì)完整開源了相關(guān)的推理框架代碼和安裝環(huán)境,詳情參見:https://github.com/SkyworkAI/Skywork-MoE

結(jié)語

我們希望本次開源的 Skywork-MoE 模型、技術(shù)報(bào)告和相關(guān)的實(shí)驗(yàn)結(jié)果可以給開源社區(qū)貢獻(xiàn)更多的 MoE 訓(xùn)練經(jīng)驗(yàn)和 Know-how,包括模型結(jié)構(gòu)、超參選擇、訓(xùn)練技巧、訓(xùn)練推理加速等各方面, 探索用更低的訓(xùn)練推理成本訓(xùn)更大更強(qiáng)的模型,在通往 AGI 的道路上貢獻(xiàn)一點(diǎn)力量。

(0)
上一篇 2024年6月3日 19:27
下一篇 2024年6月4日 06:46
99久久综合网| 天天摸天天做天天爽水多| 国产探花一区二区三区| 久久久久久久久久久久久久久久av| 亚洲免费影院| 欧美亚洲黄色| 在线电影av| 欧美老**bbbb毛片| 日日骚av一区二区| 香港三级日本三级| 在线观看免费黄色片| 国产啪精品视频| 中文在线不卡视频| 日韩欧美在线观看| 久久久不卡影院| 视频精品一区二区| 成人三级视频| 免费看日产一区二区三区 | 国产精品19乱码一区二区三区| 高清国语自产拍免费一区二区三区| 精品久久久久久| 成人av综合一区| 一区二区三区四区五区在线| 免费视频亚洲| 亚洲欧洲二区| 中文字幕在线免费观看视频| 国产资源在线观看| h网站在线观看| 欧美另类黑人巨大videos| 91资源在线视频| 精品一区免费观看| 国产真人做爰视频免费| 亚洲图片 自拍偷拍| av在线免费观看国产| 国产亚洲福利社区| 国产精品看片资源| 久久免费少妇高潮久久精品99| 亚洲成av人片| 国产日本欧洲亚洲| 国产精品一区二区三区网站| 欧美激情精品久久久六区热门| av影院在线免费观看| 神马久久久久| 草草久视频在线观看电影资源| 国产理论视频在线观看| 日韩精品在线免费看| 国产精品久久久视频| 日本精品一二三| 中文字幕日韩综合| 在线免费av播放| 91视频 -- 69xx| 亚洲人成影视在线观看| 精品91免费| 亚洲xxxxx| 国产精品青草久久久久福利99| 亚洲成色777777在线观看影院| 久久亚洲精品国产精品紫薇| 九九视频精品免费| 日本三级亚洲精品| 久久一区国产| 日韩中文字幕不卡| 免费亚洲婷婷| 蜜乳av另类精品一区二区| 国内自拍视频一区二区三区| 91精品一区国产高清在线gif| 美女一区网站| 久草在线视频资源| 久久大胆人体| 在线亚洲日本| 国产精品探花视频| 一区二区国产欧美| 在线观看国产成人| 国产精品亚洲欧美在线播放| 中文字幕永久在线观看| 中文字幕1区2区3区| 成人黄色片在线观看| 最新在线中文字幕| 中日精品一色哟哟| 国产成人精品a视频| 精品人妻一区二区三区日产乱码| 女人裸体性做爰全过| 日本一区二区视频在线播放| www.xx日本| 欧美日韩国产精品一区二区三区| 特黄特色免费视频| 97在线国产视频| 国产激情综合五月久久| 最新中文字幕一区| 新天堂中文资源官网在线观看| 欧美激情麻豆| 欧美丝袜美腿| 欧美性感美女一区二区| 91精品一区二区三区综合在线爱| 日韩精品一区二区三区免费视频| 尤物yw193can在线观看| 24小时免费看片在线观看| 羞羞的网站在线观看| 擼擼色在线看观看免费| 日韩欧美专区| 国产精品嫩草影院在线看| 欧美激情电影| 日韩极品在线观看| www.色精品| 自拍视频在线观看一区二区| 天天爽夜夜爽夜夜爽精品视频| 久久色.com| 国产精品你懂的在线| 亚洲一区二区五区| 欧美猛男gaygay网站| 日韩久久精品电影| 欧美另类高清videos| 国产精品一区专区欧美日韩| 欧美成人综合一区| 精品国产一区三区| 大尺度做爰床戏呻吟舒畅| 国产成人免费在线观看视频| 久久久久久久久黄色| 黄色小视频免费观看| 香蕉视频在线观看www| 啦啦啦在线视频免费观看高清中文 | 天天操夜夜操免费视频| 日本桃色视频| 伊人电影在线观看| 国产精品视频首页| 一区二区三区在线电影| 国产成人精品亚洲777人妖| 亚洲欧美成aⅴ人在线观看| 欧美日韩日日骚| 这里只有精品视频| 国产精品丝袜一区二区三区| 亚洲视频sss| 在线看免费毛片| 久久久精品视频免费观看| 亚洲av无码片一区二区三区| 黄视频在线免费| 国产大片在线免费观看| 色妞ww精品视频7777| 亚洲人成高清| 欧美激情一区二区三区四区| 欧美肥胖老妇做爰| 国内精品小视频| 亚洲国产欧美不卡在线观看| 中文字幕 欧美日韩| 精品国产乱码久久久久久鸭王1| 日本成人精品视频| 一区二区精品视频在线观看| 日本肉体xxxx裸体784大胆| 国模吧精品人体gogo| 日本午夜免费一区二区| 激情成人综合| 国产精品国产自产拍在线| 9191成人精品久久| 欧美尤物巨大精品爽| 亚洲AV无码成人精品一区| 97人妻精品一区二区三区免费| yy6080午夜| 亚洲天堂中文在线| 天天操天天舔| 黑人巨大精品| 亚洲欧美综合| 亚洲欧洲精品一区二区三区| 亚洲欧美一区二区精品久久久| 北条麻妃在线一区二区| 黄色91av| 欧美午夜精品一区二区| 在线观看日本网站| 碰草在线视频| 国产免费拔擦拔擦8x在线播放| 国产一区 二区| 日产国产高清一区二区三区| www.狠狠爱| 免费男女羞羞的视频网站中文子暮| 国产美女高潮一区二区三区| 91精彩在线视频| 日韩一级毛片| 国产精品久久一级| 综合136福利视频在线| 欧美一级二级三级| 国产伦精品一区三区精东| 精品国产999久久久免费| 中文字幕国产在线 | 国产欧美日韩一区| mm131国产精品| 国产区精品在线| 一区二区三区高清在线视频| 国产区精品视频在线观看豆花| 99精品视频在线| 亚洲三级免费电影| 久久久久九九九九| 凹凸国产熟女精品视频| 成人毛片在线播放| 黄色一级影院| 欧美成人基地| 久久久午夜电影| 日韩中文在线观看| 久久久亚洲精品无码| 日韩精品在线免费视频| 成人性生交大片免费看视频r| 影音先锋在线视频| 亚洲精品男同| 欧美片网站yy| 久久66热这里只有精品| 欧美一区二区三区观看| 成年人在线免费看片| 亚洲色图偷窥| 草草在线观看| 精品中文av资源站在线观看| 亚洲变态欧美另类捆绑| 先锋影音日韩| 日韩 欧美 综合| 伊人色综合久久| 欧美视频一区| 欧美日产国产精品| 色噜噜一区二区| 男女视频免费看| 香蕉国产在线| 亚洲无线一线二线三线区别av| 久久久亚洲高清| 久久久人成影片一区二区三区| 日韩精品国内| 好吊操这里只有精品| 伊人75在线| 午夜久久tv| 日韩一区二区三区av| 亚洲一卡二卡三卡| 高潮无码精品色欲av午夜福利| 2023av视频| 亚洲婷婷影院| 精品久久久国产| 国产欧美日韩综合精品二区| 亚洲天堂黄色片| 影音先锋另类| 欧美高清不卡| 欧美α欧美αv大片| 黄色污污在线观看| 99热精品在线播放| 涩涩涩视频在线观看| av一区二区不卡| 人妖精品videosex性欧美| 日韩精品卡通动漫网站| 丰满少妇又爽又紧又丰满69| 欧美天天综合| 欧美精品 日韩| av 日韩 人妻 黑人 综合 无码| 欧美大片xxxx| 欧美偷拍视频| 奇米一区二区三区| 久久久精品久久久| 国产视频精品视频| 97看剧电视剧大全| 黄色工厂这里只有精品| 亚洲黄色av女优在线观看| 免费无码国产v片在线观看| 日韩欧美一区二区三区视频| 成人爽a毛片免费啪啪红桃视频| 国产成人午夜精品影院观看视频 | 欧洲精品亚洲精品| 这里只有精品免费视频| 直接在线观看的三级网址| 成人av在线一区二区三区| 2024亚洲男人天堂| 中文字幕资源站| 国产视频精品久久| 狠狠色丁香婷婷综合| 午夜精品久久久久久久99热浪潮| 91看片就是不一样| 国产精品久久久久久久久鸭| 色天天色综合| 欧美一二三区在线观看| 免费在线a视频| 精品成人免费自拍视频| 久久99国产精品视频| 日韩欧美成人午夜| 污污网站在线观看视频| 麻豆视频官网| 日本视频免费一区| 国产精品久久一卡二卡| 国产综合 伊人色| 国产精品免费无遮挡| 四虎国产精品免费久久5151| 性感美女久久精品| 青青草视频在线视频| 国产综合图区| 欧美激情视频一区二区三区免费| 欧美最猛性xxxxx直播| 国产一二三区在线播放| 韩日电影在线观看| 亚洲精品一区二区妖精| 日韩在线小视频| 欧美黄色激情视频| 成人影欧美片| 亚洲三级在线免费观看| 中文字幕制服丝袜在线| 中文先锋资源| 欧美国产偷国产精品三区| 在线日韩日本国产亚洲| 中文字幕 自拍| 黄色在线观看网站| 伊人开心综合网| 蜜桃视频一区二区在线观看| 又黄又免费的视频| 日日摸夜夜添夜夜添亚洲女人| 一区二区欧美激情| 综合 欧美 亚洲日本| 成码无人av片在线观看网站| 国产精品久久久久影院色老大 | 色婷婷亚洲婷婷| 欧美亚洲一二三区| 快色在线观看| 福利电影一区二区| 久久久久久久久四区三区| 在线电影中文字幕| 亚洲看片免费| 国产精品一二区| 丰满少妇一级片| 亚洲天天综合| 7777精品久久久久久| 国产免费a视频| 天海翼精品一区二区三区| 一区二区日韩精品| 欧美交换国产一区内射| 日本免费成人| 亚洲男人天堂网| 久久精品一区二区三| 国产麻豆一区二区三区| 亚洲精品资源在线| 毛片a片免费观看| 亚洲国产一区二区久久| 亚洲第一在线视频| 天天干中文字幕| 精品视频在线一区| 一区国产精品视频| 久久狠狠高潮亚洲精品| 美女视频亚洲色图| 色噜噜亚洲精品中文字幕| 在线观看亚洲欧美| 日韩深夜福利| 久久全国免费视频| 99热精品在线播放| 亚洲午夜一区| 成人3d动漫一区二区三区91| 欧美女人天堂| 国产一区二区精品在线观看| 午夜欧美性电影| 91传媒在线观看| 综合在线观看色| 三日本三级少妇三级99| 日本孕妇大胆孕交无码| 日韩午夜av一区| 九九视频免费看| 一本久久青青| 国产成人综合av| 免费观看四虎精品成人| 国产成人av电影在线播放| 国产人妻互换一区二区| 中文字幕理伦片免费看| 亚洲综合久久久久| 国产精品扒开腿做爽爽爽a片唱戏| 日韩电影在线观看完整版| 婷婷开心久久网| 日本高清www| 视频一区中文字幕精品| 久久香蕉国产线看观看网| 国产美女永久免费| 在线亚洲国产精品网站| 欧美高清视频一区| 免费观看一二区视频网站| 亚洲一区二区视频在线| 噜噜噜在线视频| 韩国三级大全久久网站| 午夜精品免费视频| 亚洲精品精品一区| 豆国产96在线|亚洲| 国产免费黄视频| 91九色在线播放| 亚洲最大中文字幕| 国产日韩一级片| 美女免费视频一区二区| 91视频成人免费| 欧美成人视屏| 亚洲精品成人久久久| 国产一区二区三区四区视频| 乱人伦精品视频在线观看| 国产成年人在线观看| 国产精品无码2021在线观看| 777午夜精品免费视频| 毛片毛片女人毛片毛片| 亚洲国产高清一区二区三区| 日韩偷拍一区二区| 福利在线午夜| 亚洲精品黄网在线观看| 国产精品天天操| 久久99精品国产| 四季av一区二区| 欧美性aaa| 国产精品影片在线观看| 国产a级网站| 欧美亚洲国产一区二区三区| 国产一级视频在线| 六月丁香综合|