2019-12-09 11:17 | 來源:科技日報 | 作者:未知 | [科技] 字號變大| 字號變小
???????近年來,胡清華一直在不確定性建模領域深耕,他希望從“不確定性”中尋找“確定性”,從看似無規律的數據中發現規律。“我的工作主要是研究算法,從一些低質量的、雜亂的數據中找尋規律。”他說。
陳 曦
走進胡清華的辦公室,立刻被他滿屋子的書所吸引。這些書的種類既有專業類書,也有哲學類、文學類書,甚至還“藏”著幾本金庸小說。放松的時候,這位天津大學智能與計算學部教授兼人工智能學院院長,就愛讀讀武俠小說。
“我覺得知識是相通的,不要給自己設定邊界,要對新事物保持好奇。”這是胡清華常對學生說的一句話,這也是他的科研準則。
從動力機械到人工智能(AI),10年前,不給自己設限的胡清華,以跨界者身份走進了這一如今炙手可熱的領域。
近年來,胡清華一直在不確定性建模領域深耕,他希望從“不確定性”中尋找“確定性”,從看似無規律的數據中發現規律。“我的工作主要是研究算法,從一些低質量的、雜亂的數據中找尋規律。”他說。
前不久,2019年度國家杰出青年科學基金項目評審結果正式公布,胡清華申報的研究項目“不確定性人工智能”名列其中。
從動力機械走向人工智能
胡清華出生在湖南省婁底市雙峰縣,小時候,書是他最喜歡的“玩具”。“我每次去親戚家串門,第一件事就是找書看。找到一本書就躲進角落讀,完全忘了外面的熱鬧。”他說。
上世紀80年代,胡清華家鄉的圖書、報刊很少,多虧在外地上大學的叔叔每次放假回家帶一大摞書回來。從那時起,胡清華就向往上大學,“因為能有看不完的書”。
1995年,胡清華考入哈爾濱工業大學,學習動力機械專業。“作為一個地道的南方人,我跑到東北去上學,只是因為語文課本上一篇課文,把北大荒描述得太美了,讓我對那里充滿無限的想象。”他笑著回憶道。
上大學時,胡清華的專業學習主要圍繞火力發電廠的鍋爐和汽輪機。當時,隨著發電機組向大型化方向發展,對設備可靠性的要求也日益提高。發電機組開始安裝上各種傳感器,實時采集大量數據,用于設備的狀態監測與故障診斷。
“讀研時,導師希望我能開發出算法,以自動分析這些監測數據,判斷設備的狀態。我發現這項研究很有意思,從生產數據中尋找規則、建立模型,然后用模型判斷、預測設備狀態。現在看來,這屬于人工智能范疇,但當時自己并未意識到這一點,從事相關研究的人也不多。尤其在動力機械領域,這還是很前沿的方向。”胡清華回憶道。
如果說,此時人工智能在胡清華心中,還只是個火種,那么把它變為熊熊大火的,是他參加的一個學術會議。
2000年前后,中國科學院發起“龍星計劃”,邀請一批在美國學術界已有一定成就的華人教授,不定期回國在某所大學,系統地講授一門美國研究生課程。“在那個年代,數據挖掘就像現在的大數據一樣時髦。2002年暑假,數據挖掘領域的頂尖學者韓家煒來北京大學授課,在課程快結束時,他還請來了在歐美大學任教的多位學者作報告。”胡清華說。
當時,還在讀研的胡清華,就坐在臺下。“這些平時只在論文中才能‘見’到的學者,面對面給我們講授數據挖掘知識,實在太震撼了。”從此,他開始把研究領域從動力機械慢慢延伸至模式識別、數據挖掘。
“不務正業”助其順利完成跨界
雖然跨界到人工智能的想法,已在胡清華腦中醞釀多時,但他“并不急于一步到位”。
在碩博階段,胡清華依舊圍著“老本行”動力機械轉,但在研究過程中他應用了大量人工智能知識,并將相關成果寫成十余篇論文。
此外,胡清華還閱讀了大量與人工智能相關的書籍和文獻,也常去參加學術會議。為更好地向同行學習,他甚至申請擔任了南京大學BBS小百合數據挖掘版的版主,定期在網上組織學術討論。
“其實,很多論文的原始想法,都源于和網友進行的討論,可以說很多靈感都是碰撞出來的。”胡清華笑著回憶道,當時周圍人覺得他在網上組織討論是“不務正業”,但如今想來,恰是這些經歷,讓他更順暢地實現了跨界。
經過漫長的醞釀期,直到博士畢業后,2009年去香港理工大學做博士后研究,胡清華才算正式邁入人工智能的大門。
其實,早在念本科時,胡清華“不務正業”的本性就已顯露。
大二時,胡清華當上了校報記者,還長期為校刊《哈工大人》寫專欄。“起初,寫稿是為了賺稿費,拿到稿費后就可以去買更多的書。后來自己慢慢喜歡上了寫東西,不寫不成。”他回憶道。
無心插柳,讓胡清華沒想到的是,經過幾年的新聞語言訓練,自己的寫作能力得到迅速提升,語言表達更加精準、有力,這對他后來的科研工作幫助極大。
“很多理工科學者最頭疼的,就是寫論文、寫申請、做報告,由于之前積累的筆頭功夫,寫論文對于我來說,非常輕松。別人可能需要一個月才能完成的論文初稿,我不到一周就可以寫好。在惡補人工智能領域相關知識時,對文字的駕輕就熟,也使我的閱讀理解速度快過旁人,一些大部頭的書,我有時一兩周就能‘啃’完。”胡清華說。
一些人工智能學界的同行表示,胡清華清新的文風、簡潔的語言風格,使他寫出的論文更易被人理解,學術觀點也更易被同行接受。同時,這樣的語言風格也有助于提高其文章的引用率。
“當版主、記者,在當時,這些都是我的興趣,可能看上去有些‘務不正業’,但我一直覺得,學習是觸類旁通的,你永遠不知道,不經意的積累,會將你的人生引向何處。”胡清華表示,他也常對學生說,要珍視自己的興趣,它是“你科研路上最好的老師”。
在不確定性建模領域深耕10年
興趣是最好的老師,但僅憑興趣,并不能讓胡清華在人工智能這個新領域開疆拓土。
2011年底,胡清華結束了在香港理工大學的博士后研究工作,進入天津大學。入職后,他接到的首個項目就極具挑戰性,胡清華與博士生導師一起獲得“國家重點基礎研究發展計劃(973計劃)”課題的資助,開展“新能源不確定性建模”方面的研究。
胡清華介紹道,這個研究圍繞電力系統中的太陽能、風能展開。“這部分能源有點‘不靠譜’,大規模利用它們時,可能會破壞電力系統的穩定性,降低供電質量。只有摸清這些能源的‘脾氣’,才能讓其為我所用。”他說。
對胡清華來說,新能源不確定性建模,是一個完全陌生的領域。從查資料、讀文獻,到收集數據、分析數據,胡清華的“拓荒之路”走得異常艱辛。
但幾年努力下來,“門外漢”胡清華,硬是在該領域闖出了一片天地。“為提升風功率預報的精度,我進行了大量的建模工作并設計了眾多算法。在此基礎上,風速難以被確定等難題被逐步破解,風功率預報的精度隨之得到提升。”他說。
2016年,這個項目順利通過了驗收,他所在的課題組被評為優秀。在一般人看來,此時研究也就該結束了。然而,胡清華“并不想就此收手”。
“圍繞這一項目,還有很多東西可以挖掘,所以研究不僅沒有結束,而且才剛剛開始。”在胡清華眼中,這項研究屬于數據不確定性建模研究范疇,而這類研究是機器學習和數據挖掘領域的難點。“大數據時代已經到來,在利用大數據方面的最大問題就是,數據質量的不穩定。質量低下的數據,可能導致基于數據的決策出現重大偏差。”
于是,胡清華組建起一支20多人的團隊,向著一個個數據不確定性建模難題,發起沖鋒。從新能源的不確定性擴展到大數據的不確定性,胡清華率隊從工程應用研究中發現基礎研究問題,再將基礎研究成果應用于工程領域,實現了科研的良性循環。
經過近10年的開疆拓土,胡清華對不確定性建模研究,有了更系統的認知,逐漸意識到這是座處在交叉學科領域的科研“富礦”。今年,胡清華獲批的國家杰出青年科學基金項目,依舊是瞄準不確定性,從數據的不確定性向建模任務的不確定性延展。
“未來,我計劃將團隊研究的算法,應用于天氣預報、森林火災預報以及大型裝備故障預報等領域,希望成果能有更廣闊的應用空間。”胡清華說。
《電鰻快報》
1.本站遵循行業規范,任何轉載的稿件都會明確標注作者和來源;2.本站的原創文章,請轉載時務必注明文章作者和來源,不尊重原創的行為我們將追究責任;3.作者投稿可能會經我們編輯修改或補充。
熱門
相關新聞