
搜索網(wǎng)站、位置和人員

走進(jìn)西湖
院系設(shè)置
科學(xué)研究
招生與獎勵
新聞與活動
校園生活
成果轉(zhuǎn)化
人才招聘
師生入口
電話: +86-(0)571-86886861 公共事務(wù)部
美國,新奧爾良,Ernest N. Morial會議中心,為期一周的2023年的NeurIPS大會,從12月10日開始在這里舉行。
NeurIPS,全稱為Neural Information Processing Systems,即神經(jīng)信息處理系統(tǒng)大會,聚焦于深度學(xué)習(xí)、計(jì)算機(jī)視覺、大規(guī)模機(jī)器學(xué)習(xí)、學(xué)習(xí)理論等方面,是人工智能領(lǐng)域的頂級學(xué)術(shù)會議之一,在全球包括Nature、Science在內(nèi)的所有科技文獻(xiàn)中排名第9。
今年舉行的第37屆會議,共收到了 12343 篇有效論文投稿,最終26.1%的文章被錄用;西湖大學(xué)有9篇論文中選,分別來自工學(xué)院人工智能方向的李子青實(shí)驗(yàn)室、王東林實(shí)驗(yàn)室、張?jiān)缹?shí)驗(yàn)室。
這本是學(xué)術(shù)界的常態(tài),但其中一篇題為“理解和克服深度模型在分子屬性預(yù)測任務(wù)上的局限性”的論文,卻引起了我們的關(guān)注。因?yàn)楣餐蛔髦校霈F(xiàn)了一個(gè)叫“張樂程”的名字——這是西湖首屆本科生,來自α?xí)骸0赐陡鍟r(shí)間(今年春天)計(jì)算,他參與這項(xiàng)科研和寫論文的時(shí)候還在讀大一。
大一學(xué)生發(fā)AI頂會,怎么做到的?
張樂程
01
讓我們先來看看,張樂程研究了什么。
當(dāng)前,AI已經(jīng)成為輔助新藥發(fā)現(xiàn)的重要手段,尤其在藥物分子的屬性預(yù)測中(如毒性、溶解度等),起到了至關(guān)重要的作用。但實(shí)際研發(fā)和生產(chǎn)中卻發(fā)現(xiàn),高級的深度神經(jīng)網(wǎng)絡(luò)AI模型反而不如傳統(tǒng)模型有效,這很反常。這篇論文的研究就專注于此。
歷時(shí)三個(gè)多月,他們搜集數(shù)據(jù)、寫代碼、設(shè)計(jì)了一系列實(shí)驗(yàn),終于找到了癥結(jié)所在:因?yàn)榉肿泳哂小盎钚詰已隆钡男?yīng),即分子結(jié)構(gòu)上細(xì)微的變化會導(dǎo)致很大的屬性差異,而先進(jìn)的深度模型對這種細(xì)微的結(jié)構(gòu)變化不敏感。由此,他們提出一種基于分子數(shù)據(jù)特征編碼的方式來解決該問題。

原文鏈接:https://neurips.cc/virtual/2023/poster/71867
02
相對于張樂程的論文而言,我們更感興趣的是他本人。
張樂程成長在一個(gè)雙教師家庭,數(shù)學(xué)和物理一直是他的所長。初中畢業(yè)保送蕭山中學(xué)后,他提前半年去高中學(xué)習(xí),在那里接觸到了編程、算法及其他計(jì)算機(jī)科學(xué)方面的知識,并加入了學(xué)校的信息學(xué)競賽隊(duì)伍,不停地刷題、自學(xué)、搜看各種專業(yè)博客、電子書,沉浸在這個(gè)全新的世界里。
進(jìn)入西湖大學(xué)后,張樂程早早瞄準(zhǔn)了“人工智能”方向。按照西湖的培養(yǎng)模式,所有本科生前兩年不分專業(yè),但學(xué)校會給每一位學(xué)生配備一名博導(dǎo)作為學(xué)術(shù)導(dǎo)師,帶領(lǐng)他們“入門”。導(dǎo)師和學(xué)生有“雙向選擇”的權(quán)利。作為浙江省信息學(xué)競賽一等獎獲得者,張樂程毫不猶豫地選擇了西湖人工智能分支的“頂配”——講席教授李子青。

李子青,IEEE Fellow,曾任微軟亞洲研究院Research Lead,中科院自動化所模式識別國家重點(diǎn)實(shí)驗(yàn)室資深研究員。
張樂程毛遂自薦,給李子青寫了一封自薦信。最終順利入駐實(shí)驗(yàn)室,在一眾博士師兄師姐們的座位當(dāng)中有了“一席之地”。
后面的故事,看起來似乎水到渠成。有導(dǎo)師,有實(shí)驗(yàn)室,就不缺上手的機(jī)會。張樂程用了大半年的時(shí)間,一邊學(xué)習(xí)機(jī)器學(xué)習(xí)的基礎(chǔ)理論,一邊參加小項(xiàng)目,提高深度學(xué)習(xí)的實(shí)踐能力。有一天博士生師兄夏俊和他說,要不要一起來做個(gè)項(xiàng)目?他覺得可以,然后就加入了。
初出茅廬即首戰(zhàn)告捷,而且是西湖首屆本科生中第一個(gè)發(fā)表論文,我們問張樂程,有什么心得可以和大家分享?他認(rèn)真思考了一會兒說:“要學(xué)會積極地去溝通,而不是等著別人上門來找你。西湖大學(xué)是一座‘富礦’,能不能用好,就看你會不會主動去搜尋和獲取。”
03
同樣的故事,在夏俊這里卻有不一樣的解讀。
夏俊是李子青實(shí)驗(yàn)室博士四年級學(xué)生,也是這篇頂會的共同一作,研究方向是“機(jī)器學(xué)習(xí)方法和其在生物醫(yī)藥領(lǐng)域的應(yīng)用”。
在一眾AI分支的學(xué)生中,夏俊也算是個(gè)小小的“傳奇”。先后拿到了國家獎學(xué)金、西湖大學(xué)校長獎?wù)隆⑻K武獎學(xué)金等榮譽(yù),還手握多篇被AI不同頂會收錄的論文。
回到2022年8月11日,夏俊收到導(dǎo)師李子青轉(zhuǎn)發(fā)張樂程寫給他的郵件,“李老師說已經(jīng)決定接收他了,讓我教他一些入門的基礎(chǔ)知識。”
第二天,兩人就在本科生書院見面了。之后的日子,就是老手帶新手,這對“搭子”差不多每周要溝通一次,有線上,也有線下。夏俊住C11號樓,張樂程住C13號樓,多數(shù)時(shí)候兩人喜歡在C13的α?xí)阂娒妫写箅娮悠粒奖闼麄儗憣懏嫯嫛O目o張樂程帶一些專業(yè)書,讓他邊看邊提問,也會給他布置一些小項(xiàng)目上手練練。實(shí)驗(yàn)室每周一次的組會,只要張樂程沒有課,也會來參加,不管能聽懂多少。

本科生α?xí)?/span>
當(dāng)李子青確定啟動研究AI智藥那個(gè)令人費(fèi)解的問題時(shí),夏俊決定推薦實(shí)驗(yàn)室里最年輕的面孔作為自己的合作者,李子青也毫無意外地給予支持。
“從經(jīng)驗(yàn)來講,樂程肯定不如實(shí)驗(yàn)室里其他人,寫代碼的規(guī)范性要差一點(diǎn),畢竟訓(xùn)練少,之前有很多東西還是靠自學(xué)‘野蠻生長’。”
但夏俊發(fā)現(xiàn),張樂程經(jīng)常會提出一些奇奇怪怪的問題。“他在思考,他有自己的想法。”有些問題甚至讓夏俊都感到汗顏,“為什么我沒想到呢?”
而提問,正是西湖最看重的“科研潛質(zhì)”之一。
“這個(gè)課題在別人眼里也許就是一個(gè)必須完成的作業(yè),但在張樂程眼里不是,他會鉆進(jìn)去,認(rèn)真琢磨一些事。”
他相信,這位初生“牛犢”,一定會交出亮眼的成績。
04
李子青人生中改過的論文無數(shù)。他曾任AI頂刊IEEE T-PAMI等刊物副主編,擔(dān)任過100余個(gè)國際學(xué)術(shù)會議大會主席、程序主席或程序委員,迄今他自己發(fā)表的論文就超過500篇。
在學(xué)院里,他對文章以及文字的“挑剔”,眾所周知。可對大一學(xué)生張樂程發(fā)AI頂會這件事,他用了“少見”兩個(gè)字來評價(jià)。
“這是一個(gè)很優(yōu)秀的學(xué)生”,李子青對張樂程寫給他的那封自薦信印象深刻:
“我是高中信息競賽的選手,在高中階段打了100,000+行的代碼,最后獲得了NOIP省一和NOI冬令營全國銀牌成績。”
“我基本掌握算法導(dǎo)論、組合數(shù)學(xué)、離散數(shù)學(xué),也涉獵了斯坦福大學(xué)的具體數(shù)學(xué),也對人工智能有些許了解。”
“至于數(shù)學(xué),我涉獵了高等數(shù)學(xué)、線性代數(shù)、概率論和數(shù)理統(tǒng)計(jì)、數(shù)學(xué)分析等……”
雖然李子青從未帶過本科一年級的學(xué)生,但數(shù)學(xué)好、編程好,是他對學(xué)生的基本要求,況且,這孩子才高中畢業(yè),那一刻他覺得發(fā)現(xiàn)了一塊璞玉。
李子青深知學(xué)校“200博導(dǎo)對應(yīng)60學(xué)生”的投入和對這批年輕學(xué)生的期望。李子青說:“我所做的只不過是發(fā)掘?qū)W生的特點(diǎn)和潛力,鼓勵他們盡早積極參與前沿科研,并創(chuàng)造條件讓他們快速成長、成才。”
所以,張樂程的頂會論文對李子青而言,既是意外之喜,又是期待的達(dá)成。“真為他高興。”
在這樣的規(guī)劃下,才大二的張樂程已經(jīng)忙到飛起:他要去上海參加資助AI領(lǐng)域優(yōu)秀本科生的獎學(xué)金的面試選拔;他去南京和合肥參加美國計(jì)算機(jī)協(xié)會發(fā)起組織的國際大學(xué)生程序設(shè)計(jì)競賽(ICPC)亞洲區(qū)域賽;他還要準(zhǔn)備托福考試,因?yàn)榘凑瘴骱囊?guī)定,下一個(gè)學(xué)年他們將出國交換學(xué)習(xí), 張樂程希望能去在計(jì)算機(jī)領(lǐng)域排行“數(shù)一數(shù)二”的加州大學(xué)伯克利分校,見識一下業(yè)界最厲害的“大牛”……
當(dāng)然,少年人愛玩的天性不變。即使在這么忙的情況下,張樂程依然記掛著他的另一重身份:視頻博主“孫1超”。在夏俊眼里,張樂程是個(gè)典型的競賽生,在數(shù)學(xué)、計(jì)算和編程方面有天賦,但不擅長表達(dá)。為此,夏俊曾特意讓張樂程和一群高年級的訪問學(xué)生、碩士生一起看論文、說論文,鍛煉他的口頭表達(dá)能力。豈料,“躲”在視頻背后的“孫1超”,卻玩得“游刃有余”:西湖大學(xué)本科生的錄取通知書長什么樣?想看看本科生的寢室嗎?西湖大學(xué)超市里600ml的可樂只要2塊9,是真的嗎……一個(gè)個(gè)話題時(shí)不時(shí)掀起一陣小高潮。

張樂程的個(gè)人主頁
下一個(gè)話題是什么?說不好。也許對年輕人的想象,我們永遠(yuǎn)不能停留在今天。
最新資訊
學(xué)術(shù)研究
學(xué)術(shù)研究
大學(xué)新聞
大學(xué)新聞