(資料圖片僅供參考)
導(dǎo)讀 【中國大模型語料數(shù)據(jù)聯(lián)盟開源發(fā)布高質(zhì)量多模態(tài)語料“書生·萬卷”】!!!今天受到全網(wǎng)的關(guān)注度非常高,那么具體的是什么情況呢,下面大家可...【中國大模型語料數(shù)據(jù)聯(lián)盟開源發(fā)布高質(zhì)量多模態(tài)語料“書生·萬卷”】!!!今天受到全網(wǎng)的關(guān)注度非常高,那么具體的是什么情況呢,下面大家可以一起來看看具體都是怎么回事吧!
【中國大模型語料數(shù)據(jù)聯(lián)盟開源發(fā)布高質(zhì)量多模態(tài)語料“書生·萬卷”】繼今年7月在2023世界人工智能大會發(fā)起成立“中國大模型語料數(shù)據(jù)聯(lián)盟”,上海人工智能實驗室(上海AI實驗室)于8月14日宣布,聯(lián)合語料數(shù)據(jù)聯(lián)盟成員單位,共同開源發(fā)布“書生·萬卷”1.0多模態(tài)預(yù)訓(xùn)練語料。
“書生·萬卷”1.0目前包含文本數(shù)據(jù)集、圖文數(shù)據(jù)集、視頻數(shù)據(jù)集三部分,本次開源的數(shù)據(jù)總量超過2TB。
該語料數(shù)據(jù)包含超過5億個文本,2200萬個圖文交錯文檔,1000個節(jié)目影像視頻,具備多元融合、精細(xì)處理、價值對齊、易用高效等四大特征。
以上就是中國大模型語料數(shù)據(jù)聯(lián)盟開源發(fā)布高質(zhì)量多模態(tài)語料“書生·萬卷”】的相關(guān)消息了,希望對大家有所幫助!
版權(quán)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!關(guān)鍵詞:
Copyright@ 2015-2022 南非包裝網(wǎng)版權(quán)所有 備案號: 滬ICP備2022005074號-13 聯(lián)系郵箱:58 55 97 3@qq.com