A级成人毛片免费视频高清,国产免费黄色片,a毛片视频一级毛片视频,绿色的电影,久青草大香蕉导航无删减完整在线观看 ,中文字幕无码亚洲字幕成a人

蜜途網(wǎng)
    首頁 > 國內(nèi) > 模型難復(fù)現(xiàn)不一定是作者的錯,研究發(fā)現(xiàn)模型架構(gòu)要背鍋

模型難復(fù)現(xiàn)不一定是作者的錯,研究發(fā)現(xiàn)模型架構(gòu)要背鍋

來源:TechWeb   時間:2022-03-21 22:41:52   閱讀量:11998   

在不同初始化條件下,同一神經(jīng)網(wǎng)絡(luò)經(jīng)過兩次訓(xùn)練可以得到相同的結(jié)果嗎。

模型難復(fù)現(xiàn)不一定是作者的錯,研究發(fā)現(xiàn)模型架構(gòu)要背鍋

CVPR 2022的一篇研究通過將決策邊界可視化的方法,給出了答案mdash,mdash,

有的容易,有的很難。

例如,從下面這張圖來看,研究人員就發(fā)現(xiàn),ViT比ResNet要更難復(fù)現(xiàn):

研究人員還發(fā)現(xiàn),模型的可復(fù)現(xiàn)性和模型本身的寬度也有很大關(guān)聯(lián)。

同樣,他們利用這種方法,對2019年機器學(xué)習(xí)最重要的理論之一mdash,mdash,雙下降現(xiàn)象進行了可視化,最終也發(fā)現(xiàn)了一些很有意思的現(xiàn)象。

來看看他們具體是怎么做的。

更寬的CNN模型,可復(fù)現(xiàn)性更高

深度學(xué)習(xí)中的決策邊界,可以用來最小化誤差。

簡單來說,分類器會通過決策邊界,把線內(nèi)線外的點歸為不同類。

從中我們可以發(fā)現(xiàn):

左邊三個和右邊四個差異很大,也就是說不同架構(gòu)之間的相似性很低。

再進一步觀察,左邊的全連接網(wǎng)絡(luò),ViT和MLP Mixer之間的決策邊界圖又不太一樣,而右邊CNN模型的則很相似。

在CNN模型中,我們還可以觀察到不同隨機數(shù)種子之間明顯的的重復(fù)性趨勢,這說明不同初始化配置的模型可以產(chǎn)生一樣的結(jié)果。

并發(fā)現(xiàn)更寬的CNN模型似乎在其決策區(qū)域具有更高的可復(fù)現(xiàn)性,比如WideRN30。

以及采用殘差連接結(jié)構(gòu)的CNN模型的可復(fù)現(xiàn)性得分比無此連接的模型要略高。

此外,優(yōu)化器的選擇也會帶來影響。

在下表中,我們可以看到SAM比標(biāo)準(zhǔn)優(yōu)化器產(chǎn)生了更多可重復(fù)的決策邊界。

不過對于MLP Mixer和ViT,SAM的使用不能總是保證模型達到最高的測試精度。

有網(wǎng)友表示好奇,如果通過改善模型本身的設(shè)計,能改變這種現(xiàn)象嗎。

可視化ResNet—18的雙下降現(xiàn)象

雙下降是一個有趣的概念,描述是測試/訓(xùn)練誤差與模型大小的關(guān)系。

在此之前,大家普遍認(rèn)為參數(shù)太少的模型泛化能力差mdash,mdash,因為欠擬合,參數(shù)太多的模型泛化能力也差mdash,mdash,因為過擬合。

而它證明,兩者的關(guān)系沒有那么簡單。具體來說:

誤差會先伴隨著模型的增大而減小,然后經(jīng)過模型過擬合,誤差又增大,但伴隨著模型大小或訓(xùn)練時間的進一步增加,誤差又會再次減小。

他們通過寬度參數(shù)的改變來增加模型容量。

訓(xùn)練出的兩組模型,其中一組使用無噪聲標(biāo)簽的訓(xùn)練集,另一組則帶有20%的噪聲標(biāo)簽。

最終,在第二組模型中觀察到了明顯的雙下降現(xiàn)象。

線性模型預(yù)測的模型不穩(wěn)定性也適用于神經(jīng)網(wǎng)絡(luò),不過這種不穩(wěn)定性表現(xiàn)為決策區(qū)域的大量碎片。

也就說,雙下降現(xiàn)象是由噪聲標(biāo)簽情況下決策區(qū)域的過度碎片引起的。

具體來說,當(dāng)k接近/達到10時,由于模型此時擬合了大部分訓(xùn)練數(shù)據(jù),決策區(qū)域被分割成很多小塊,變得混亂和破碎,并不具備可重復(fù)性,此時模型的分類功能存在明顯的不穩(wěn)定性。

而在模型寬度很窄和很寬時,決策區(qū)域碎片較少,有高水平的可重復(fù)性。

模型的可復(fù)現(xiàn)性得分如下:

同樣可以看到,在參數(shù)化不足和過參數(shù)化的情況下,整個訓(xùn)練過程的可復(fù)現(xiàn)性很高,但在插值閾值處會出現(xiàn)故障。

有趣的是,即使沒有噪聲標(biāo)簽,研究人員發(fā)現(xiàn)他們設(shè)計的量化方法也足夠敏感,可以檢測到可復(fù)現(xiàn)性的細(xì)微下降。

目前代碼已經(jīng)開源,要不要來試試你的模型是否容易復(fù)現(xiàn)。

論文地址:

GitHub鏈接:

聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費建議。文章事實如有疑問,請與有關(guān)方核實,文章觀點非本網(wǎng)觀點,僅供讀者參考。

猜你喜歡

游客在進入北京環(huán)球度假區(qū)時須核驗北京健康寶和有效身份證件
游客在進入北京環(huán)球度假區(qū)時須核驗北京健康

具體如下:北京環(huán)球度假區(qū)繼續(xù)按照相關(guān)政府部門的限流要求,以預(yù)約入園的形式加強人流動態(tài)監(jiān)測和...詳情

2022-04-28
杭州湘湖的草坪人氣很高不少人在這里搭帳篷
杭州湘湖的草坪人氣很高不少人在這里搭帳篷

湘湖邊亂搭帳篷,煞了春日風(fēng)景景區(qū)出臺最新政策,將設(shè)置臨時帳篷搭建區(qū),后續(xù)還要增設(shè)露營服務(wù)區(qū)...詳情

2022-04-14
南非徐霞客在云南:從行萬里路到吃百碗米線的文化之旅
南非徐霞客在云南:從行萬里路到吃百碗米線

題:南非徐霞客在云南:從行萬里路到吃百碗米線的文化之旅杜安睿來自南非,是一名國際注冊會計師...詳情

2022-04-10
廣州新增3例本土確診病例雙層觀光巴士全部停運
廣州新增3例本土確診病例雙層觀光巴士全部

廣州新增3例本土確診病例雙層觀光巴士全部停運廣州市政府新聞辦公室21日公布的信息顯示,過去...詳情

2022-03-22