5月13-17日,國際數據庫頂級學術會議ICDE 2024于荷蘭烏得勒支舉行,我院博士研究生張持完成的“SSDRec: Self-Augmented Sequence Denoising for Sequential Recommendation”論文被ICDE2024錄用,韓啟龍教授赴荷蘭參加會議并作報告。
ICDE與SIGMOD、VLDB并稱數據管理與數據庫領域的三大國際頂級學術會議,入選為中國計算機學會(CCF)推薦的A類國際學術會議,在國際上享有盛譽并具有廣泛的學術影響力。
針對短期序列數據降噪過程中的過降噪和欠降噪問題(OUPs),該文提出了三階段學習範式的SSDRec框架,在序列降噪之前執行顯式的序列增強技術,從全局數據中選擇合理的對象插入到目标序列中,最大程度減少對原始序列的擾動,豐富序列的可學習信息。
SSDRec框架首先以數據驅動的方式構建多關系圖,再利用全局關系編碼器挖掘跨序列複雜模式,指導對目标序列的增強和降噪;其次利用全局與局部的不一緻性設計了一種序列自增強模塊,選擇目标序列中特定位置注入全局信息,以豐富目标序列;最後采用分層降噪模塊,分别對目标序列中的增強數據與原始數據進行噪聲識别,在保證增強序列質量的基礎上産生可靠的無噪子序列。
目前,以模型為中心的人工智能正在向以數據為中心的人工智能研究轉變,在數據質量較低的現實應用場景中,SSDRec框架作為一種通用的序列降噪插件,可無縫地與現有序列表示學習模型相結合,通過提升序列數據質量改善現有方法的表示學習能力,具有廣闊的應用前景。