IT之家 7 月 31 日消(xiao)息,字節(jie)跳(tiao)動 Seed 團隊今天宣布推出實驗(yan)(yan)(yan)性(xing)(xing)(xing)擴(kuo)散語(yu)言(yan)模型 Seed Diffusion Preview,目標是(shi)以結構(gou)化(hua)的代(dai)碼生成為實驗(yan)(yan)(yan)領域,系統(tong)性(xing)(xing)(xing)地驗(yan)(yan)(yan)證離散擴(kuo)散技術路(lu)線作為下一代(dai)語(yu)言(yan)模型基礎(chu)框架的可行性(xing)(xing)(xing)。
實驗結果顯示,Seed Diffusion Preview 代碼推理速度可達到 2146 tokens / s,速度相比同等規模的自回歸模型提升 5.4 倍。在多個業界基準上,Seed Diffusion Preview 性能與優秀的自回歸模型相當,并在代碼編輯等任務上實現超越。

IT之家從 Seed 團隊介紹獲悉,在實現高效采樣的同時,模型在多個代碼生成基準測試中,表現出與同規模自回歸模型相當的性能。此(ci)外,在(zai)代碼編(bian)輯(如 CanitEdit 等(deng))這類需要全局視角規劃(hua)的(de)(de)任務中,模(mo)型(xing)展現了擴散模(mo)型(xing)框架的(de)(de)內在(zai)優勢(shi),性能超過基于自(zi)回歸的(de)(de)模(mo)型(xing),為解(jie)決更復雜的(de)(de)結構化推理問題提供了新的(de)(de)可能性。

官方表示,Seed Diffusion Preview 驗(yan)證了離散擴散模型(xing)(xing)(xing)在(zai)大(da)型(xing)(xing)(xing)語言模型(xing)(xing)(xing)上的(de)(de)推理(li)加速潛力。團隊同時認為,推理(li)加速僅是這(zhe)一技術路徑最直接的(de)(de)表層優(you)勢。Seed Diffusion 項目將致力于挖掘(jue)其(qi)更(geng)深遠的(de)(de)價值,持續探索其(qi)規模化定律與在(zai)復雜推理(li)任務中的(de)(de)應(ying)用。
廣告聲明:文內含有的對外跳轉鏈接(jie)(jie)(包(bao)括不限于超鏈接(jie)(jie)、二維碼、口(kou)令等(deng)形式),用于傳(chuan)遞更多信(xin)息,節省甄(zhen)選時(shi)間,結果僅供參考,IT之(zhi)家所有文章均包(bao)含本聲明。