国产99色_粉嫩aⅴ一区二区三区_男人丁丁插女人_国产magnet_精品176二区_777久久久精品一区二区三区

AI發(fā)展:訓練數(shù)據(jù)即將遭遇瓶頸

2024-12-31 01:01:00 來源: 點擊數(shù):

科技日報記者 張佳欣

得益于神經(jīng)網(wǎng)絡(luò)規(guī)模的擴大以及海量數(shù)據(jù)的訓練,人工智能(AI)在過去10年間突飛猛進。“做大做強”的策略,在構(gòu)建大型語言模型(LLM)上取得了顯著成果,ChatGPT就是一個典型的例子。

然而,《自然》《麻省理工科技評論》等多家雜志網(wǎng)站指出,AI擴展正逼近極限。一方面,AI“吞噬”著越來越多的能源;另一方面,滋養(yǎng)無數(shù)模型成長的傳統(tǒng)數(shù)據(jù)集,正被LLM開發(fā)人員過度開墾。

訓練數(shù)據(jù)即將遭遇的瓶頸已悄然浮現(xiàn)。有研究機構(gòu)預測,到2028年左右,用于訓練AI模型的數(shù)據(jù)集典型規(guī)模將達到公共在線文本總估計量的規(guī)模。換句話說,AI可能會在大約4年內(nèi)耗盡訓練數(shù)據(jù)。與此同時,數(shù)據(jù)所有者(如報紙出版商)開始打擊對其內(nèi)容的濫用行為,進一步收緊了訪問權(quán)限,這正在引發(fā)“數(shù)據(jù)共享”規(guī)模上的危機。為此,開發(fā)人員必須尋找變通之道。

數(shù)據(jù)集供需失衡

過去10年間,LLM的發(fā)展顯示出了對數(shù)據(jù)的巨大需求。自2020年以來,用于訓練LLM的“標記”(或單詞)數(shù)量已增長100倍,從數(shù)百億增加到數(shù)萬億。一個常見的數(shù)據(jù)集RedPajama,包含數(shù)萬億個單詞。這些數(shù)據(jù)會被一些公司或研究人員抓取和清洗,成為訓練LLM的定制數(shù)據(jù)集。

然而,可用互聯(lián)網(wǎng)內(nèi)容的增長速度出乎意料的緩慢。據(jù)估計,其年增長率不到10%,而AI訓練數(shù)據(jù)集的大小每年增長超過一倍。預測顯示,這兩條曲線將在2028年左右交匯。

與此同時,內(nèi)容供應(yīng)商越來越多地加入軟件代碼或修改條款,阻止爬蟲及AI抓取其數(shù)據(jù)。在這些內(nèi)容中,被明確標記為限制爬蟲訪問的數(shù)量,從2023年的不足3%猛增到了2024年的20%至33%之間。

當前,圍繞AI訓練中數(shù)據(jù)使用的合法性,試圖為數(shù)據(jù)提供商爭取應(yīng)有賠償?shù)亩嗥鹪V訟正在進行。2023年12月,《紐約時報》向OpenAI及其合作伙伴微軟提起了訴訟,指控其侵犯了版權(quán);今年4月,紐約市Alden全球資本旗下的8家報紙聯(lián)合發(fā)起了一起類似的訴訟。對此,OpenAI表示,《紐約時報》的訴訟“毫無根據(jù)”。

若法院最終站在內(nèi)容提供商一方,支持其獲得經(jīng)濟賠償,那么對于AI開發(fā)人員,尤其是那些資金緊張的學者而言,獲取所需數(shù)據(jù)無疑將變得更加艱難。

新方法有待印證

數(shù)據(jù)匱乏對AI的傳統(tǒng)擴展策略構(gòu)成了潛在挑戰(zhàn)。

尋找更多數(shù)據(jù)的一個途徑是收集非公開數(shù)據(jù),如社交媒體消息或視頻文字記錄。然而,這種做法的合法性尚存爭議。

一些公司選擇使用自己的數(shù)據(jù)來訓練AI模型,如Meta利用虛擬現(xiàn)實頭顯收集的音頻和圖像進行訓練。但各公司政策不同,包括Zoom在內(nèi)的一些公司則明確表示不會使用客戶內(nèi)容訓練AI。

另一種選擇可能是專注于快速增長的專業(yè)數(shù)據(jù)集,如天文學或基因組學數(shù)據(jù),但其對訓練LLM的可用性和實用性尚不清楚。

如果AI接受除文本之外的多種類型的數(shù)據(jù)訓練,可能會為豐富數(shù)據(jù)的涌入打開閘門。Meta首席AI科學家勒丘恩強調(diào),人類通過觀察物體而“吸收”的數(shù)據(jù)遠超用于訓練LLM的數(shù)據(jù)量,機器人形態(tài)的AI系統(tǒng)或許能從中獲取經(jīng)驗。

此外,制造數(shù)據(jù)也是解決之道。一些AI公司付費讓人們生成訓練內(nèi)容,或使用AI生成的合成數(shù)據(jù)來訓練AI。這已成為一個潛在的巨大數(shù)據(jù)源。然而,合成數(shù)據(jù)也存在問題,如遞歸循環(huán)可能鞏固錯誤、放大誤解,并降低學習質(zhì)量。

小模型更專更精

另一種策略是摒棄模型“越大越好”的開發(fā)觀念。一些開發(fā)者已在追求更高效、專注于單一任務(wù)的小型語言模型。這些模型需要更精細、更專業(yè)的數(shù)據(jù)以及更好的訓練技術(shù)。

12月5日,OpenAI發(fā)布了新的OpenAI o1模型。盡管該公司未透露模型的規(guī)模或訓練數(shù)據(jù)集大小,但o1采用了新方法:在強化學習上投入更多時間,讓模型對每個回答進行更深入的思考。這標志著一種轉(zhuǎn)變,即從依賴大規(guī)模數(shù)據(jù)集進行預訓練,轉(zhuǎn)向更注重訓練和推理。

當前,LLM可能已飽覽互聯(lián)網(wǎng)大部分內(nèi)容,或許無需更多數(shù)據(jù)即可變得更智能。美國斯坦福大學一項研究表明,模型從多次讀取給定數(shù)據(jù)集中學到的內(nèi)容,與從相同數(shù)量的唯一數(shù)據(jù)中學習到的內(nèi)容一樣豐富。

合成數(shù)據(jù)、專門數(shù)據(jù)集、多次讀取和自我反思等因素的結(jié)合,或?qū)⒐餐苿覣I的進一步飛躍。

責任編輯:左常睿

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級,繼續(xù)瀏覽

繼續(xù)瀏覽
主站蜘蛛池模板: 黑人巨茎精品欧美一区二区_小情侣高清国产在线播放_亚洲区欧美区综合区自拍区_视频一区中文字幕_超碰caoporn久久_亚洲AV成人无码网站在线_国产精品丝袜高跟鞋_九一精品在线观看 | 亚洲第一淫片_色网站免费视频_亚洲欧美aⅴ..._a黄色片网站_少妇被躁爽到高潮无码人狍大战_青青青视频免费_在线看片免费人成视频大全_亚洲人成色7777在线观看不卡 | 久久久久亚洲AV成人网_日本三级成本人网站_成人久18秘免费观看视频_在线观看不卡一区_狠狠色丁香婷婷久久综合蜜芽_天天夜摸夜夜添夜夜无码_国产a免费一级视频_91社区国产在线观看 | 男人专区_国产精品免费视频一区二区三区_黄页网站大全免费在线观看_亚洲午夜成人片在线_久久久久久久女人_一级爱爱_俺来也俺去啦久久综合网_AV无码免费永久在线观看 | 久久婷婷国产_亚洲伦理片在线_色五月色开心色婷婷色丁香_青青在线视频观看_波多野结衣视频一区_日韩在线理论_国产成人免费在线_久久中文免费视频 | 免费观看性生交大片3区_午夜视频www_欧美笫一页_一卡二卡三卡免费看_一久久久久_老司机AⅤ在线精品导航_午夜无码人妻AV大片色欲_91国语清晰打电话对白 | 草逼逼视频_91欧美一区二区三区综合在线_美女床上运动_日韩一区二区三区高清_老中医吮她的花蒂和奶水视频播放_视频一区二区三区在线播放_99国产精品国产精品九九_一区二区精 | 绝顶丰满少妇av无码_国产精品一区欧美_国产精品色哟哟_日韩淫视频_老熟妇仑乱视频一区二区_亚洲欧美中文日韩在线v日本野外_欧美乱偷一区二区三区在线_成人在线观看www | 国产真实伦在线观看视频_亚洲免费播放_亚洲高清v_成人h动漫在线看_成年免费a级毛片免费看_青草视频在线观看视频_狠狠干美女_aa毛片a级毛片免费观看 国内精品久久久久影院蜜芽_一级不卡_亚洲国产成人久久综合_yy1111111少妇影院光屁股_国产乱淫av免费_中文字幕高清不卡_538国产精品视频一区二区_国产精品91久久久 | 911影视_91看篇_国产一级黄色影片_爱爱视频在线_国产成人精品一区二区三区视频_久久91精品国产一区二区三区_aa视频免费观看_国产精品无码一区二区牛牛 | 最近国产中文字幕_av在线免费播_亚洲裸男gv网站_www黄色毛片_四虎现在的网址是什么_欧美国产精品久久久乱码_亚洲一区二区三区四区在线免费观看_av美女网 | 欧美多毛肥胖老妇做爰_caoporn国产精品免费公开_蜜臀亚洲av永久无码精品老司机_男人狂桶女人高潮嗷嗷叫_精品在线视频免费在线观看视频_亚州福利视频_国产精品视频网_一区二区狠狠色丁香久久婷婷 | 91性高潮久久久久久久_五月花激情网_二区三区国产_3344在线永久观看视频播放_一区二区三区四区AV_国产爆初菊在线观看免费视频网站_日韩在线一区二区三区免费视频_久久国产a | 狠狠干影视_成人亚洲性情网站www在线观看国产_日韩在线综合网_欧美一区二区三区在线视频观看_成年免费黄色网_四虎精品在线视频_亚洲精品91在线_免费视频久久 | 国产V亚洲V天堂A无码99_午夜伦理av_国产精品久久久久9999小说_亚洲人线精品午夜_视频一区国产_亚洲精品午夜久久久久久久久久久_欧美色视频综合在线观看_国产精品成人影院在线 | 麻豆蜜桃AV蜜臀AV色欲AV_懂色aⅴ精品一区二区三区蜜月_潮喷失禁大喷水无码_免费观看激色视频网站在线观看_亚洲砖码砖专无区2023_福利小视频在线观看_久久综合天天_久久免费看少妇高潮a片免费 | 一万部小稚女视频在线观看_国产精品热久久无码av_性国裸体高清亚洲_99热99这里只有精品_亚洲国产综合精品_久人人爽人人爽人人片AV_自拍视频第一页_xxxxx15hd中国hd | 午夜影院黄色片_日本aⅴ_午夜免费1000部_在线观看免费成人av_一个人免费观看在线视频www_一级做a爰片久久毛片_亚洲国产中文在线视频_国产亚洲精品线观看动态图 | 免费毛片网_精品久久久噜噜噜噜久久图片_午夜福利亚洲精品无遮挡_日韩大陆毛片av_99精品影视_奇米四色中文综合久久_国产高清精品无码二区_国产亚洲激情欧美 | 一级毛片不卡直接观看_欧美美女一区_av高清一区二区三区_国产精品美女久久久久久久_日韩中文无_国产一区二区视_国产在线永久视频_欧美日本黄 | 麻豆影视视频高清在线观看_亚洲蜜桃网_色爱综合_XXXXBBBB欧美_全球诡异时代动漫免费观看_欧美第7页_视频在线一区二区三区_欧美XXXX做受欧美Gay | 在线免费观看黄色片_四虎必出精品_久久夜色精品国产噜噜噜亚洲AV_97久久精品人妻人人搡人人玩_aaa视频_精品成人免费一区二区在线播放_第一福利初水视频导航_日韩中文字幕二区 | 久久天天东北熟女毛茸茸_久久久久久免费_久久国产午夜精品理论片最新版本_亚洲无马在线观看_一个人看的免费高清视频www_亚洲精品国产suv一区88_特及毛片_日本成人午夜 | 丰满少妇大力进入_熟妇好紧好大快点舒服使劲xh_亚洲一区免费视频_成品人国产一区二区三区精品_亚洲欧美精品在线观看_原神xman图_久久久受www免费人成_久久香蕉影院 | 中日韩产精品1卡二卡三卡_成人精品一区日本无码网_成都同性男男gayxxxx_丁香五月成人_亚洲草片_一区二区三区国产好的精_久草香蕉在线视频_国产性生活大片 | 一级黄色绿像片_曰韩精品无码_日本真人啪啪免费无遮挡_欧美一区二区久久久_亚洲精品92内射_乱子伦av无码中文字幕_视频,国产成人精品日本亚洲18_水莓100完全国产免费 | 最爱高潮全过程免费的视频_日韩免费无码不卡夜夜爽_国产乱子伦一区二区三区国色天香_日日操天天操_中文久久久久久_91欧美激情一区二区三区成人_男男做喘息gv奶白小受动图_国产三及片网站 狠狠搞综合_国产精品欧美亚洲制服_久久久性视频_国产调教性奴在线观看w_狠狠色婷婷久久一区二区三区麻豆_www.青青草_超碰在线资源站_草在线免费观看 | 91久久综合_dvd无码av高清毛片在线看_国产少妇国语对白污_国产午夜亚洲精品理论片色戒_国产精品欧美久久久久一区二区_艳母在线1-6_av在线播放观看_成年轻人网站色直接看 | 好男人网站www久久久_久久国产美女_国产性xxx_国产网站一区_69福利网_四虎在线网站_日韩综合一区_av高清在线看 | 亚洲AV午夜福利精品一区二区_亚洲精品一区二区国产精华液_国产91在_亚洲精品在线观看一区二区_99久久99热这里只有精品_91久久久久久久久久久久久_哪里可以看免费的av_日韩有码第一页 | 久久久久久久女女女又又_91在线精品_狠狠色伊人亚洲综合网站色_99超碰在线播放_成人精品视频在线观看不卡_免费日韩在线观看_超级乱婬av片_亚洲成人精品一区二区 | 色吊丝永久性观看网站_JULIAANN熟女俱乐部_国产精品无码专区在线播放_午夜精品久久久_宅男视频免费在线观看视频_欧美成人a视频_91成人免费视频_青草久久网 | 成人综合亚洲日韩欧美色_奇米成人影视_午夜精品a片一区二区三区_超碰色偷偷_青青草精品_久久久久久人妻精品一区二区三区_日本黄色三级大片_91福利网址导航 | 亚洲欧洲久久av_极品美女国产精品免费一区_老司机网站免费_免费视频入口_人妻网站成熟人妻VA网站_福利视频网站_亚洲天堂第一区_男人粗大一进一出视频 | 全篇肉高h秘书被c办公室有图_av在线成人_亚洲一区二区精品3399_国产97在线视频_小草影院小草影视_99精品热播_日韩人妻无码精品_69av网 | 老司机精品在线观看_好骚综合在线_久久精品久久久久久久久久久久久_91一二三_午夜精品成人在线视频_91在线精品播放_国产乱子一区二区_毛片欧美 | 91色中文_日韩中文一区_无码人妻久久一区二区三区免费_日本中文在线视频_av手机在线免费播放_欧美激情国产日韩精品一区18_亚洲一级特黄视频_free性欧美69巨大 | 天天操导航_久久国内精品自在自线图片_av夜色_啪啪自拍视频_日韩在线精品中文字幕一区二区_亚洲精品久久一区二区三区_CHINASEX喷水VIDEOS中国少妇_久草视频网址 | 国产精品久久国产精品久久_xxxwww免费视频_极品人妻的娇喘呻吟_a级无毛_亚洲你懂的_久久精品女人天堂av444_日本99热_小蜜被两老头吸奶头在线观看 | 欧洲日韩在线_国产网友愉拍精品视频手机_综合爱爱_亚洲成人av免费看_国产精品久久久久久久久久久久午夜片_亚洲天天做日日做天天欢毛片_亚洲精品性视频_波多野结衣一区二区三区AV高清 | www.成人_亚洲人成网77777亚洲色_色播国产_国产免费一区二区三区视频天天爽_8av国产精品爽爽ⅴa在线观看_亚洲无毛av_成人AV毛片无码免费网站_国产V一区二区三区在线 |