
近日,計(jì)算機(jī)與信息科學(xué)學(xué)院 軟件學(xué)院羅辛教授團(tuán)隊(duì)攜手英國(guó)皇家工程院院士Jim Woodcock在數(shù)據(jù)挖掘領(lǐng)域取得突破,研究成果《自編碼神經(jīng)Tucker分解》(Auto-encoding Neural Tucker Factorization)被國(guó)際著名期刊《IEEE知識(shí)與數(shù)據(jù)工程匯刊》(IEEE Transactions on Knowledge and Data Engineering)錄用為長(zhǎng)文并正式發(fā)表。

研究聚焦信息物理系統(tǒng)中高維不完整數(shù)據(jù)的建模問(wèn)題,結(jié)合張量低秩分解與神經(jīng)網(wǎng)絡(luò)理論,提出了一種新型低秩隱因子分解模型——自編碼神經(jīng)Tucker分解(ANTucF),旨在高效挖掘數(shù)據(jù)中的隱式時(shí)空模式。與傳統(tǒng)線性張量分解方法不同,ANTucF在Tucker低秩分解框架下引入非線性時(shí)空表征機(jī)制,綜合采用數(shù)據(jù)驅(qū)動(dòng)的密度導(dǎo)向建模、基于時(shí)空模式編碼的特征交互張量構(gòu)建以及自編碼潛在交互學(xué)習(xí)等策略,從而在保持模型結(jié)構(gòu)簡(jiǎn)潔的同時(shí),通過(guò)實(shí)現(xiàn)核心張量的零化,顯著提升其唯一性與表達(dá)能力。實(shí)驗(yàn)結(jié)果表明,ANTucF在真實(shí)數(shù)據(jù)集的缺失值恢復(fù)任務(wù)中表現(xiàn)優(yōu)于多種先進(jìn)基線模型,并能夠捕捉更細(xì)粒度的復(fù)雜時(shí)空動(dòng)態(tài)特征。
西南大學(xué)為論文第一完成單位。西南大學(xué)圖與社會(huì)計(jì)算創(chuàng)新團(tuán)隊(duì)唐鵬博士為該論文第一作者;西南大學(xué)圖與社會(huì)計(jì)算創(chuàng)新團(tuán)隊(duì)羅辛教授和英國(guó)皇家工程院院士Jim Woodcock教授為該論文共同通訊作者。該研究獲得國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金、重慶市自然科學(xué)基金、重慶市技術(shù)創(chuàng)新與應(yīng)用發(fā)展專項(xiàng)和重慶市教委科學(xué)技術(shù)研究計(jì)劃等項(xiàng)目的資助。