劉玉升,男,山東籍,合肥大學(xué)人工智能與大數(shù)據(jù)學(xué)院2022級電子信息(計算機技術(shù))專業(yè)碩士研究生,師從徐立祥教授。研究生期間,榮獲國家獎學(xué)金、校一等學(xué)業(yè)獎學(xué)金等多項獎勵,積極投身科研創(chuàng)新和社會實踐活動,獲評“合肥大學(xué)優(yōu)秀研究生”榮譽稱號。
創(chuàng)新:投身圖智能與推薦系統(tǒng)研究
在導(dǎo)師徐立祥的悉心指導(dǎo)下,他專注于圖神經(jīng)網(wǎng)絡(luò)、圖對比學(xué)習(xí)與推薦系統(tǒng)等領(lǐng)域的研究,致力于通過優(yōu)化數(shù)據(jù)增強機制提升推薦模型的泛化能力與魯棒性。
圖增強策略優(yōu)化圖對比學(xué)習(xí)的推薦系統(tǒng)結(jié)構(gòu)圖
在推薦系統(tǒng)中,用戶-物品二部圖的原始數(shù)據(jù)質(zhì)量直接影響推薦效果,因此如何構(gòu)造高質(zhì)量的增強圖表示,同時保留原始語義信息,是圖對比學(xué)習(xí)領(lǐng)域亟待解決的核心問題。圖增強策略作為提升圖對比學(xué)習(xí)模型魯棒性的關(guān)鍵技術(shù),已廣泛應(yīng)用于推薦系統(tǒng)。然而,現(xiàn)有方法多采用隨機啟發(fā)式增強策略,這可能會引入偏差性噪聲,并在LightGCL傳播過程中進一步放大,進而影響推薦效果。
針對上述問題,劉玉升所在團隊提出了一種基于鄰接矩陣重構(gòu)與屬性自適應(yīng)擾動的圖增強方法,能夠在保持原始語義信息的同時,自適應(yīng)地去除圖中的噪聲干擾,從而提升推薦系統(tǒng)的性能與泛化能力。項目組通過長達16個月的持續(xù)攻關(guān)(包括10個月的反復(fù)實驗驗證與6個月的論文撰寫與修改),研究成果《Graph Augmentation Empowered Contrastive Learning for Recommendation》發(fā)表于CCF-A類國際權(quán)威期刊《ACM Transactions on Information Systems》。
此外,劉玉升積極參與各類學(xué)術(shù)科研項目,協(xié)助開展多項課題研究,以第一作者或第二作者身份發(fā)表3篇學(xué)術(shù)論文,其中包括中科院三區(qū)期刊論文1篇、EI會議論文2篇。在科研過程中,他逐步掌握了從數(shù)據(jù)預(yù)處理、模型設(shè)計、實驗復(fù)現(xiàn)到論文撰寫的全流程技能,主動協(xié)助指導(dǎo)低年級研究生開展科研工作。
礪能:提升跨領(lǐng)域建模實戰(zhàn)能力
劉玉升始終秉持“以賽促學(xué)、以賽促研”的理念,積極參與各類高水平學(xué)科競賽,在實踐中不斷拓展學(xué)術(shù)視野、提升創(chuàng)新能力。在2023年“華為杯”第二十屆中國研究生數(shù)學(xué)建模競賽中,他帶領(lǐng)團隊克服重重困難,最終榮獲國家三等獎。
在競賽開始之初,團隊就面臨嚴(yán)峻挑戰(zhàn)。在選定“強對流降水臨近預(yù)報”賽題后,他們遇到的第一個難題是:100多G的賽題數(shù)據(jù)無法正常下載。面對海量數(shù)據(jù)處理難題,團隊成員萌生了更換賽題的想法,但劉玉升果斷決策:“數(shù)據(jù)量大我們就分步解決,這既是挑戰(zhàn)也是機遇。”
針對強對流天氣臨近預(yù)報這一專業(yè)領(lǐng)域難題,他構(gòu)建了Bi-ConvLSTM深度學(xué)習(xí)模型,將動態(tài)注意力機制與雙偏振雷達數(shù)據(jù)進行融合,有效提升了降雨預(yù)測精度與模型穩(wěn)定性。在最后沖刺的那一夜,實驗室的燈光一直亮到天明,劉玉升主動承擔(dān)最復(fù)雜的模型優(yōu)化部分,同時協(xié)調(diào)隊友分工,確保每個環(huán)節(jié)都萬無一失。這次經(jīng)歷不僅贏得了國家級獎項,更讓他深刻體會到:科研路上沒有捷徑,唯有迎難而上,方能突破自我。
應(yīng)用:助力大模型技術(shù)場景落地
2024年6月至9月,在導(dǎo)師推薦下,劉玉升通過選拔進入科大訊飛股份有限公司訊飛數(shù)碼研究院實習(xí),深度參與了訊飛星火大模型的研發(fā)工作,主要負(fù)責(zé)Prompt工程優(yōu)化任務(wù)。憑借扎實的專業(yè)基礎(chǔ)和出色的工程能力,他系統(tǒng)性地完成了各類任務(wù)的整編工作,通過深入分析客戶需求,制定了差異化的Prompt優(yōu)化策略。在數(shù)據(jù)處理層面,他運用Python對訓(xùn)練數(shù)據(jù)進行清洗與統(tǒng)計分析,成功構(gòu)建了包含10萬余條的高質(zhì)量SFT數(shù)據(jù),覆蓋33個具體任務(wù)場景。此外,他還參與了大模型效果的評測工作,為后續(xù)模型的迭代優(yōu)化提供了支持。
因在實習(xí)期間表現(xiàn)優(yōu)異,劉玉升被科大訊飛選派前往深圳鵬城實驗室,參與深圳市政府智慧公安項目。在項目競標(biāo)階段,他對不同任務(wù)進行了分類整理,將所學(xué)的Prompt優(yōu)化策略應(yīng)用于任務(wù)優(yōu)化,與研發(fā)人員密切配合,推動項目成功上線,并在團隊綜合評分中取得第一名的成績。
來源:研究生處 編輯:劉鵬飛 解雅婕 預(yù)審:瀟瀟 審核:賈峰