甜甜圈:【我準備這周就約他吃飯,需要注意什麼嗎?】
楊蓁蓁:【注意少說話吧。】
甜甜圈:【?】
楊蓁蓁不回她了,唐念以為她在忙,就放下手機整理了一遍PPT,上午十點組會按時開展。
窗外陽光透過百折窗落在前排會議桌上,陳知禮坐第一排,聽著台上的進度匯報。
李瑜京和大師姐配合不錯,才三天就把驗證工作圓滿完成,報告書寫的漂亮又規整,祝師兄和侯師兄的進展也在計劃之內。
組會結束,陳知禮整理著電腦,說了聲:「唐念留一下。」
這話隨性又自然,旁人自是沒有察覺異常,大師姐合上電腦給她遞過來一個同情的眼色,畢竟開完會被老闆留下一般是沒啥好事的。
唐念原本還沒覺得有什麼,等人走光心裡也不太踏實了,她上周請了假,這次工作量確實不如其他人多。
陳知禮還在處理工作,冷硬的輪廓在陽光下柔和了幾分,手指有規律敲著鍵盤,隔了會像是才記起旁邊有個人,開口喊她:「這部分準備怎麼做?」
唐念彎下腰,看清他電腦上的居然是她剛剛匯報的PPT,還特意用紅線標出來幾行。
唐念解釋:「我準備加入優化器,讓訓練過程可以更快收斂。」
「可以,具體用什麼方法?」
「還不知道,先用自適應學習率的優化器試試,Adam、Adagrad、RMSprop都試一遍,看看哪個好用。」
陳知禮頓了下,眼底划過一抹笑:「煉丹是吧。」
唐念:「……」
深度學習是由大量神經網絡層組成,沒有確切的理論指導,只要數據量夠大不斷trial and error,總能預測出下一條,所以經常被戲稱是煉丹。
唐念小聲嗶嗶:「你們販劍的還瞧不起我們煉丹的嘍。」
「什麼?」
「沒、沒什麼。」唐念慫兮兮地笑了笑:「不管煉丹還是挖礦,解決問題就是好辦法。」
「但你在做事之前要明白這件事的motivation,就像學開車,總得懂操作步驟和汽車,你現在的狀態就是盲目地亂嘗試,明明不會開車的人還要逞能上高速,這樣下去早晚會被反噬,而且你還不知道在哪裡失敗了。」
唐念不以為意,Deep Learning是經驗科學,是工具,本來就是黑盒操作的。
這和開車不一樣,非要比喻應該說是「烤火」,原始人就懂得烤火取暖了,還會鑽木取火併保存火種,但是真正懂得火的原理要很多年以後。
理論學科的研究本來就是滯後經驗學科。
她不服氣地鼓起嘴巴:「神經網絡能解決所有函數,數學家卻要一百年才能證明出一個理論,所以不是Deep learning沒有理論依據,而是你們數學進步速度太慢了。」
陳知禮把電腦合上,往後一仰:「你說的很對,Deep learning缺少一位香農來把工程方向指導清楚,所以……你現在的工作不是拿著神經網絡模型來用大數據暴力預測,而是優化模型,改進算法。」