午夜激情电影在线播放_色佬视频在线观看_国产va免费精品高清在线观看_美女视频一区二区三区在线_91免费高清视频_91成人看片_国产18精品乱码免费看_成人av色在线观看_女生裸体视频一区二区三区_国产在线视频你懂的

昆侖萬(wàn)維開(kāi)源2千億稀疏大模型天工MoE,全球首創(chuàng)能用4090推理

2024年6月3日,昆侖萬(wàn)維宣布開(kāi)源 2 千億稀疏大模型 Skywork-MoE , 性能強(qiáng)勁, 同時(shí)推理成本更低。Skywork-MoE 基于之前昆侖萬(wàn)維開(kāi)源的 Skywork-13B 模型中間 checkpoint 擴(kuò)展而來(lái),是首個(gè)完整將 MoE Upcycling 技術(shù)應(yīng)用并落地的開(kāi)源千億 MoE大模型,也是首個(gè)支持用單臺(tái) 4090 服務(wù)器推理的開(kāi)源千億 MoE大模型。

模型架構(gòu)

本次開(kāi)源的 Skywork-MoE 模型隸屬于天工 3.0 的研發(fā)模型系列,是其中的中檔大小模型(Skywork-MoE-Medium),模型的總參數(shù)量為 146B,激活參數(shù)量 22B,共有 16 個(gè) Expert,每個(gè) Expert 大小為 13B,每次激活其中的 2 個(gè) Expert。

天工 3.0 還訓(xùn)練了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)兩檔 MoE 模型,并不在此次開(kāi)源之列。

模型能力

我們基于目前各大主流模型評(píng)測(cè)榜單評(píng)測(cè)了 Skywork-MoE,在相同的激活參數(shù)量 20B(推理計(jì)算量)下,Skywork-MoE 能力在行業(yè)前列,接近 70B 的 Dense 模型。使得模型的推理成本有近 3 倍的下降。同時(shí) Skywork-MoE 的總參數(shù)大小比 DeepSeekV2 的總參數(shù)大小要小 1/3,用更小的參數(shù)規(guī)模做到了相近的能力。

技術(shù)創(chuàng)新

為了解決 MoE 模型訓(xùn)練困難,泛化性能差的問(wèn)題,相較于 Mixtral-MoE, Skywork-MoE 設(shè)計(jì)了兩種訓(xùn)練優(yōu)化算法:

1.?Gating Logits 歸一化操作

我們?cè)?Gating Layer 的 token 分發(fā)邏輯處新增了一個(gè) normalization 操作,使得 Gating Layer 的參數(shù)學(xué)習(xí)更加趨向于被選中的 top-2 experts,增加 MoE 模型對(duì)于 top-2 的置信度:

2.?自適應(yīng)的 Aux Loss

有別于傳統(tǒng)的固定系數(shù)(固定超參)的 aux loss, 我們?cè)?MoE 訓(xùn)練的不同階段讓模型自適應(yīng)的選擇合適的 aux loss 超參系數(shù),從而讓 Drop Token Rate 保持在合適的區(qū)間內(nèi),既能做到 expert 分發(fā)的平衡,又能讓 expert 學(xué)習(xí)具備差異化,從而提升模型整體的性能和泛化水平。在 MoE 訓(xùn)練的前期,由于參數(shù)學(xué)習(xí)不到位,導(dǎo)致 Drop Token Rate 太高(token 分布差異太大),此時(shí)需要較大的 aux loss 幫助 token load balance;在 MoE 訓(xùn)練的后期,我們希望 Expert 之間仍保證一定的區(qū)分度,避免 Gating 傾向?yàn)殡S機(jī)分發(fā) Token,因此需要較低的 aux loss 降低糾偏。

訓(xùn)練 Infra

如何對(duì) MoE 模型高效的進(jìn)行大規(guī)模分布式訓(xùn)練是一個(gè)有難度的挑戰(zhàn),目前社區(qū)還沒(méi)有一個(gè)最佳實(shí)踐。Skywork-MoE 提出了兩個(gè)重要的并行優(yōu)化設(shè)計(jì),從而在千卡集群上實(shí)現(xiàn)了 MFU 38% 的訓(xùn)練吞吐,其中 MFU 以 22B 的激活參數(shù)計(jì)算理論計(jì)算量。

1. Expert Data Parallel

區(qū)別于 Megatron-LM 社區(qū)已有的 EP(Expert Parallel)和 ETP(Expert Tensor Parallel)設(shè)計(jì),我們提出了一種稱(chēng)之為 Expert Data Parallel 的并行設(shè)計(jì)方案,這種并行方案可以在 Expert 數(shù)量較小時(shí)仍能高效的切分模型,對(duì) Expert 引入的 all2all 通信也可以最大程度的優(yōu)化和掩蓋。相較于 EP 對(duì) GPU 數(shù)量的限制和 ETP 在千卡集群上的低效, EDP 可以較好的解決大規(guī)模分布式訓(xùn)練 MoE 的并行痛點(diǎn),同時(shí) EDP 的設(shè)計(jì)簡(jiǎn)單、魯棒、易擴(kuò)展,可以較快的實(shí)現(xiàn)和驗(yàn)證。

一個(gè)最簡(jiǎn)單的 EDP 的例子,兩卡情況下 TP = 2, EP = 2, 其中 Attention 部分采用 Tensor Parallel , Expert 部分采用 Expert Parallel

2.?非均勻切分流水并行

由于 first stage 的 Embedding 計(jì)算和 last stage 的 Loss 計(jì)算,以及 Pipeline Buffer 的存在, 流水并行下均勻切分 Layer 時(shí)的各 stage 計(jì)算負(fù)載和顯存負(fù)載均有較明顯的不均衡情況。我們提出了非均勻的流水并行切分和重計(jì)算 Layer 分配方式,使得總體的計(jì)算/顯存負(fù)載更均衡,約有 10% 左右的端到端訓(xùn)練吞吐提升。

比較均勻切分和非均勻切分下的流水并行氣泡:對(duì)于一個(gè) 24 層 Layer 的 LLM, (a) 是均勻切分成 4 個(gè) stage,每個(gè) stage ?的 layer 數(shù)量是:[6, 6, 6, 6].(b) 是經(jīng)過(guò)優(yōu)化后的非均勻切分方式,切成 5 個(gè) stage, 每個(gè) stage 的 layer 數(shù)量是:[5, 5, 5, 5, 4] , 在中間流水打滿(mǎn)的階段,非均勻切分的氣泡更低。

MoE Know-how

此外,Skywork-MoE 還通過(guò)一系列基于 Scaling Laws 的實(shí)驗(yàn),探究哪些約束會(huì)影響 Upcycling 和 From Scratch 訓(xùn)練 MoE 模型的好壞。

一個(gè)可以遵循的經(jīng)驗(yàn)規(guī)則是:如果訓(xùn)練 MoE 模型的 FLOPs 是訓(xùn)練 Dense 模型的 2 倍以上,那么選擇 from Scratch 訓(xùn)練 MoE 會(huì)更好,否則的話(huà),選擇 Upcycling 訓(xùn)練 MoE 可以明顯減少訓(xùn)練成本。

4090 推理

Skywork-MoE 是目前能在 8×4090 服務(wù)器上推理的最大的開(kāi)源 MoE 模型。8×4090 服務(wù)器一共有 192GB 的 GPU 顯存,在 FP8 量化下(weight 占用 146GB),使用我們首創(chuàng)的非均勻 Tensor Parallel 并行推理方式,Skywork-MoE 可以在合適的 batch size 內(nèi)達(dá)到 2200 tokens/s 的吞吐。

結(jié)語(yǔ)

我們希望本次開(kāi)源的 Skywork-MoE 模型、技術(shù)報(bào)告和相關(guān)的實(shí)驗(yàn)結(jié)果可以給開(kāi)源社區(qū)貢獻(xiàn)更多的 MoE 訓(xùn)練經(jīng)驗(yàn)和 Know-how,包括模型結(jié)構(gòu)、超參選擇、訓(xùn)練技巧、訓(xùn)練推理加速等各方面, 探索用更低的訓(xùn)練推理成本訓(xùn)更大更強(qiáng)的模型,在通往 AGI 的道路上貢獻(xiàn)一點(diǎn)力量。?

(0)
上一篇 2024年6月4日 13:05
下一篇 2024年6月4日 16:02
午夜性福利视频| 免费一级大片| 久热这里有精品| 超碰影院在线观看| 精品亚洲第一| 欧美国产亚洲精品久久久8v| 制服丝袜中文字幕一区| 国产精品美女久久久久久| 日韩视频一区| 999久久精品| 精精国产xxxx视频在线中文版| 成人国产视频在线| 在线天堂中文www视软件| 日韩欧美亚洲一区二区三区| 亚洲视频在线播放免费| 看av免费毛片手机播放| 欧美日韩精品一区| 成人a视频在线观看| 欧美精品在线观看| 亚洲大尺度美女在线| 亚洲aⅴ怡春院| 久久综合久久综合九色| 蜜桃视频在线一区| 欧美三级免费| 日韩在线欧美| 午夜免费一级片| xxxxxwwww免费视频| 亚洲国产日韩欧美在线| 欧美色图片你懂的| 国产真实乱子伦| 亚洲免费小视频| 在线观看av一区二区| 日本一区二区成人| 国内久久婷婷综合| 亚洲在线国产日韩欧美| 99国内精品久久久久久久| 精品中文字幕一区二区三区| 白浆在线视频| 秋霞午夜理伦电影在线观看| 黄页网址大全在线播放| av第一福利大全导航| 国产精品白浆流出视频| 一区二区三区激情视频| 国产丰满果冻videossex| 中文字幕在线日本| 日韩精品成人在线| 国产精品老熟女一区二区| 中文字幕一区二区三区乱码不卡| 日韩中文字幕免费看| 精品视频一区 二区 三区| 亚洲一区二区高清| 亚洲视频狠狠干| 中文成人综合网| 久久精品欧美一区二区三区麻豆| 国产乱码精品一区二区三区av| 肉肉av福利一精品导航| 国产日韩欧美一区| 9色精品在线| 狠久久av成人天堂| 艳女tv在线观看国产一区| 欧美大黑bbbbbbbbb在线| 国产成人手机高清在线观看网站| 久久夜色电影| 欧美精品密入口播放| www.久久久.com| 国产成年精品| 国产视频一区二区在线播放| 开心久久婷婷综合中文字幕| 99精品国自产在线| 91精品国产自产观看在线| 日本免费成人| 爱爱精品视频| 日本韩国欧美超级黄在线观看| 久久精品色综合| 亚洲精品国产精品粉嫩| 国产精品亚洲片在线播放| 欧美日韩一二| 午夜精品影院| 亚洲一区一卡| 久久99精品久久只有精品| 国产一区二区剧情av在线| 国产在线乱码一区二区三区| 岛国av在线一区| 久久久精品黄色| 国产精品电影一区二区三区| 亚洲乱码国产乱码精品精可以看 | 69久久99精品久久久久婷婷| 337p亚洲精品色噜噜狠狠| 日韩三级在线观看| 日韩午夜精品视频| 亚洲人成电影在线观看天堂色| 视频直播国产精品| 久久免费国产视频| 国产日韩欧美日韩大片| 九九九九精品| 800av在线免费观看| 免费大片在线观看| 精人妻一区二区三区| 欧美成人短视频| 日本一二三区不卡| 午夜精品久久久久久久第一页按摩| 九九热中文字幕| 青娱乐在线视频观看| 人成网站免费观看| 自拍视频在线网| 成人小电影网站| 国产精品丝袜在线播放| 国产精品久久天天影视| 久久综合伊人| 91片在线免费观看| 岛国精品视频在线播放| 日韩欧美高清一区| 欧美成人一区二区三区电影| 国产美女91呻吟求| 亚洲自拍偷拍二区| 午夜国产一区二区三区| 免费毛片视频网站| 午夜精品久久久久久久蜜桃| 亚州男人的天堂| 黄色三级在线| 99免在线观看免费视频高清| 黑人巨大精品欧美一区二区桃花岛| 视频二区欧美| 国产精品v亚洲精品v日韩精品 | 国产精品视频首页| 97色伦图片97综合影院| 日本aⅴ免费视频一区二区三区| 久久只精品国产| 欧洲亚洲精品在线| 最新中文字幕亚洲| 69堂成人精品视频免费| 欧美高清中文字幕| 一女三黑人理论片在线| www.av88| 美女又爽又黄免费动漫| 麻豆传媒在线免费看| 亚洲91网站| 乱码第一页成人| 国产精品久久久久久久久久免费看| 欧美剧在线免费观看网站 | 性囗交免费视频观看| 亚洲午夜18毛片在线看| 亚洲精品久久久北条麻妃| 在线视频国产福利| 成人全视频免费观看在线看| 欧美国产高潮xxxx1819| 91视频在线观看免费| 欧美高清视频在线高清观看mv色露露十八| 精品国偷自产在线视频99| 国产精品久久精品视| 99久久激情视频| 亚洲一级生活片| 四虎成人免费| 番号在线播放| 色先锋久久影院av| 国产乱人伦精品一区二区在线观看 | 搡老女人一区二区三区视频tv| 川上优av一区二区线观看| 日本www在线视频| 91香蕉视频污在线观看| 少妇av在线播放| 午夜视频在线观看韩国| 国产专区精品| 久久国产精品色| 在线精品视频一区二区| 国产69久久精品成人看| 中文字幕色呦呦| 久久国产高清视频| 日韩欧美一区二区三区视频| 在线免费观看黄色网址| 欧美色图国产精品| 久久久久亚洲蜜桃| 亚洲免费视频一区二区| 欧美人与物videos另类| 久久久久久久久免费看无码| 丰满肉肉bbwwbbww| 毛片免费在线播放| 精品国产1区| 欧美国产日韩亚洲一区| 中文字幕日韩欧美精品在线观看| 蜜桃av色综合| 国产三级黄色片| 欧美精品另类| 黄毛片在线观看| 欧美一级久久| 欧美视频三区在线播放| 国产精品自产拍在线观看| 中文字幕永久有效| 国产a级免费视频| 伪装者免费全集在线观看| 日韩三级毛片| 国产精品久久久久久福利一牛影视| 色一区av在线| 成人免费在线视频播放| 国产第一页在线播放| 99热在线免费观看| 99re91这里只有精品| 久久亚洲春色中文字幕久久久| 国产亚洲欧美aaaa| 男女爱爱视频网站| 中文字幕亚洲精品一区| 国产黄色高清在线| 欧美人与动xxxxz0oz| 国产日韩精品视频一区| 欧美日韩国产成人| 亚洲男人天堂色| 亚洲成人av综合| 黄色视屏免费在线观看| 亚洲天堂男人| 欧美日韩久久不卡| 久久精品国产理论片免费| 手机在线中文字幕| 成全视频在线播放大地| 欧美激情在线免费| 亚洲国产色一区| 国产日韩欧美91| 日本少妇xxxxx| www.精选视频.com| 欧美成人午夜77777| 亚洲六月丁香色婷婷综合久久 | 亚洲国产福利在线| 自拍偷拍视频在线| 中文区中文字幕免费看| av免费在线一区二区三区| 夜夜嗨一区二区三区| 日韩欧美国产电影| 日韩精品福利片午夜免费观看| 亚洲图片欧美日韩| 欧美成年黄网站色视频| 日本不卡不码高清免费观看| 日韩精品视频三区| 日韩国产欧美亚洲| 午夜成人鲁丝片午夜精品| 亚洲深夜视频| 国产亚洲一区字幕| 国产精品午夜国产小视频| 亚洲日本精品视频| 黄网在线播放| 亚洲啪啪91| 亚洲欧美精品一区| 无码人妻精品一区二区三区66| www.男人天堂.com| 96视频在线观看欧美| 亚洲丝袜自拍清纯另类| 91成人在线看| 国产精品a成v人在线播放| 青青草免费观看免费视频在线| 国产欧美日韩一区二区三区在线| 亚洲精品一区二区在线| www.日本一区| 天堂网在线.www天堂在线| 精品av一区二区| 日韩欧美一级精品久久| 18禁免费无码无遮挡不卡网站| 中文字字幕一区二区三区四区五区| 久久av网站| 色悠悠亚洲一区二区| 秋霞在线一区二区| 强开小嫩苞一区二区三区视频| 91精品一久久香蕉国产线看观看| 亚洲欧美韩国综合色| 国内精品视频在线播放| 欧美性受xxx黑人xyx性爽| 日韩伦理精品| 亚洲蜜臀av乱码久久精品| 免费中文日韩| 亚洲精品国产片| 最新精品在线| 678五月天丁香亚洲综合网| 国产黄色激情视频| 一本久久精品| 色777狠狠狠综合伊人| 亚洲精品成人网| 国产亚洲视频一区| 天天干夜夜艹| 久久一日本道色综合久久| 久久精品这里热有精品| 稀缺小u女呦精品呦| 亚洲一本大道| 国产一区999| 国产精品专区一| 337p粉嫩色噜噜噜大肥臀| 亚洲www免费| 欧美日韩在线免费观看| 大伊香蕉精品视频在线| www.91av...| 亚洲国内欧美| 久久久噜噜噜久久久| 青草影院在线观看| 国产va在线视频| 一区二区三区精品| 日韩a级在线观看| 国产成在线观看免费视频| 欧美破处大片在线视频| 久久精品99久久久久久久久| 国产综合精品久久久久成人av| 蜜桃视频在线观看免费视频网站www| 国产日韩欧美高清| 一区二区av| 国产精品最新乱视频二区| 欧美日韩理论| 国精产品一区一区三区有限在线| 久久久国产精品黄毛片| 亚洲综合电影| 欧洲精品一区二区| 国产免费中文字幕| 欧美白人做受xxxx视频| 国产色产综合产在线视频| 日本公妇乱淫免费视频一区三区| 秘密影院久久综合亚洲综合 | 亚洲区自拍偷拍| www在线免费观看视频| 中文字幕一区日韩精品欧美| 美国av在线播放| 嫩草影院入口一二三| 热久久国产精品| 91免费高清视频| 日本熟妇成熟毛茸茸| 素人一区二区三区| 日韩欧美国产一区二区在线播放| 国产精久久久久| 蜜桃视频在线观看免费视频网站www| 一区二区激情视频| 日本精品免费在线观看| 日韩日韩日韩日韩| 久久亚洲精精品中文字幕早川悠里 | 自拍一区在线观看| 欧美日韩在线不卡| aaa黄色大片| 久久香蕉av| 欧美最新大片在线看| www.欧美com| 手机av免费在线| 欧美性猛交xxxx偷拍洗澡| 第四色婷婷基地| 日本在线人成| 日本道色综合久久| 亚洲日本久久久| 久草在线资源福利站| 色av综合在线| 国产精品入口麻豆| 欧美13videosex性极品| 91精品国产91久久综合桃花 | 粉嫩av一区二区三区天美传媒| 成人图片小说| 国产亚洲va综合人人澡精品| 国产乱子伦农村叉叉叉| 国产区高清在线| 色综合天天综合网天天狠天天| 中国特级黄色大片| 日本一区二区三区视频在线| 亚洲精品视频免费在线观看| 日本网站在线免费观看| 狠狠综合久久av一区二区蜜桃 | 久久亚洲人体| 久久久91精品国产| 99精品视频免费看| 香蕉久久国产| 日本一区二区三区视频在线播放 | 欧美videos另类齐全| 国产成人免费在线观看| 国产乱人伦精品一区二区三区| 亚洲成人影院少妇| 色88888久久久久久影院按摩| 欧美人妻一区二区三区| 亚洲国产视频二区| 5566成人精品视频免费| 久久精品国产一区二区三区肥胖| 国产精品主播直播| 欧美亚洲另类色图| 另类视频在线| 日韩在线视频网站| 东京干手机福利视频| 韩国三级中文字幕hd久久精品| 免费人成在线观看视频播放| 麻豆视频在线免费观看| 亚洲精品福利在线| 国产精品玖玖玖| 久久精品国产精品亚洲红杏| 日本精品免费视频| 成人动漫在线播放| 精品少妇一区二区三区| 九九热最新视频| 首页欧美精品中文字幕| 日本道在线视频| 黄网站在线播放| 亚洲色图25p| 视频一区 中文字幕| 国产毛片一区二区| 国产真人无码作爱视频免费| 亚洲一二三四| 69av在线播放| 美女福利网站视频在线观看| 亚洲欧美偷拍卡通变态| 欧美人妻一区二区三区| 91一区二区| 亚洲激情一区二区| 在线āv视频| 色综合久久88色综合天天看泰| 精品国产一区二区三区不卡在线 |