NeurIPS`25 | 感嘆歲月神偷!南開&三星開源Cradle2Cane:完美破解“年齡-身份”兩難困境!
作者:Tao Liu, Dafeng Zhang等
解讀:AI生成未來
亮點(diǎn)直擊
直擊痛點(diǎn),提出“Age-ID Trade-off”: 深入分析了人臉老化任務(wù)中“年齡準(zhǔn)確性”與“身份保持”之間的內(nèi)在矛盾。現(xiàn)有方法往往顧此失彼,而本文提出的框架旨在打破這一零和博弈 。
首創(chuàng)兩階段(Two-Pass)解耦架構(gòu): 提出 Cradle2Cane 框架。第一階段利用自適應(yīng)噪聲注入(AdaNI)專注于“變老”,第二階段利用身份感知Embedding(IDEmb)專注于“找回身份”。這種分而治之的策略實(shí)現(xiàn)了1+1>2的效果 。
巧妙的特征解耦設(shè)計(jì): 引入了 SVR-ArcFace 和 Rotate-CLIP 模塊。通過奇異值重加權(quán)(SVR)剔除ArcFace特征中的年齡干擾,利用球面線性插值(Slerp)在CLIP空間平滑遷移年齡屬性,實(shí)現(xiàn)了身份與年齡特征的精準(zhǔn)剝離與控制 。
基于SDXL-Turbo的高效推理:利用少步(Few-step)擴(kuò)散模型的優(yōu)勢,僅需0.56秒即可生成高質(zhì)量圖像,在保持極高保真度的同時,完美支持從“幼年到老年(Cradle to Cane)”的全年齡段平滑變換 。
解決的問題
長期以來,人臉老化(Face Aging)任務(wù)都面臨一個核心挑戰(zhàn):如何在大幅度改變年齡特征的同時,完美保留原本的身份信息? 作者將這一挑戰(zhàn)定義為 “Age-ID Trade-off”(年齡-身份權(quán)衡)。
傳統(tǒng)GAN方法(如Lifespan, CUSP):在身份保持上表現(xiàn)尚可,但在處理大跨度年齡變化(如從幼年到老年)時,往往生成模糊,且難以模擬真實(shí)的皮膚紋理和骨骼變化 。
現(xiàn)有Diffusion方法(如FADING):雖然生成畫質(zhì)高,但往往伴隨著嚴(yán)重的身份漂移(Identity Drift),生成的“老年版”看起來像是另一個人 。 如圖1所示,現(xiàn)有方法的性能曲線往往呈現(xiàn)“trade-off”的趨勢——年齡遷移準(zhǔn)確性越高,身份相似度就越低。反之,身份相似度越高,年齡遷移準(zhǔn)確性就越低。如何打破這一現(xiàn)狀,實(shí)現(xiàn)全生命周期的高保真老化,是本文解決的核心問題。
提出的方案
本文提出了一種基于 SDXL-Turbo 的兩階段(Two-Pass)擴(kuò)散框架 —— Cradle2Cane。該方案的核心思想是“解耦”:將年齡變換和身份保持拆解為兩個獨(dú)立的子任務(wù)進(jìn)行優(yōu)化。

第一階段(1st Pass):自適應(yīng)噪聲注入 (AdaNI)
這一階段的目標(biāo)是“精準(zhǔn)變老”。 作者發(fā)現(xiàn),年齡跨度越大,所需的圖像結(jié)構(gòu)變化越劇烈。因此,AdaNI 機(jī)制會根據(jù)目標(biāo)年齡與源年齡的差距,動態(tài)調(diào)整注入潛空間(Latent Space)的噪聲水平 。
小跨度: 注入低噪聲,微調(diào)紋理。
大跨度: 注入高噪聲,允許模型對臉型、皺紋、發(fā)際線進(jìn)行大刀闊斧的修改。 雖然這一步會犧牲部分身份信息,但它為生成逼真的老化特征奠定了基礎(chǔ)。
第二階段(2nd Pass):身份感知Embedding (IDEmb)
這一階段的目標(biāo)是“找回身份”。 在第一階段生成的圖像基礎(chǔ)上,模型通過引入 IDEmb 進(jìn)行去噪引導(dǎo)。IDEmb 由兩個創(chuàng)新模塊組成:
SVR-ArcFace: 傳統(tǒng)ArcFace特征中混雜了年齡信息。作者利用奇異值重加權(quán)(Singular Value Reweighting, SVR)技術(shù),抑制特征中隨年齡變化的成分,提取出更純粹的“身份核心” 。
Rotate-CLIP: 既然CLIP文本特征具有方向性,作者提出在CLIP空間中進(jìn)行“旋轉(zhuǎn)”(Rotate)。通過球面插值(Slerp)而非簡單的向量相減,平滑地將特征導(dǎo)向目標(biāo)年齡,同時保留語義一致性 。
達(dá)到的效果
平衡的性能
在 CelebA-HQ 和 CelebA-HQ (in-the-wild) 數(shù)據(jù)集上的實(shí)驗(yàn)表明,Cradle2Cane 在 Face++ 和 Qwen-VL 多模態(tài)大模型兩種評估協(xié)議下,均取得了 SOTA 的成績。 特別是在 HCS (Harmonic Consistency Score) 這一綜合指標(biāo)上,本文方法大幅領(lǐng)先于 SAM, CUSP, FADING 等基線模型 。

自然的視覺效果
無論是皺紋的加深、皮膚的松弛,還是發(fā)色的改變(如變白),Cradle2Cane 都能生成極其自然的細(xì)節(jié)。 更重要的是,即使是處理 In-the-wild 的圖片,在面對遮擋、側(cè)臉、復(fù)雜光照時,該模型仍舊能夠展現(xiàn)不錯的效果。


靈活的應(yīng)用擴(kuò)展
得益于兩階段編輯的靈活性,除了單獨(dú)改變年齡,該方法還能同步進(jìn)行人臉屬性編輯。比如該方法可以無縫地應(yīng)用各種屬性,例如,戴眼鏡、綠色的頭發(fā)、戴帽子,同時持續(xù)地進(jìn)行年齡增長,顯著提高了生成圖像的多樣性和可控性。

更多結(jié)果

總結(jié)
Cradle2Cane 的成功證明了在生成式AI時代,針對特定任務(wù)的結(jié)構(gòu)化解耦設(shè)計(jì)依然具有巨大的潛力。通過放棄“一步到位”的傳統(tǒng)思路,采用由粗到精、先年齡遷移再ID增強(qiáng)的策略,南開大學(xué)與三星的研究團(tuán)隊(duì)為基于Diffusion的人臉年齡編輯任務(wù)提供了一個新的框架,來解決長久存在的“Age-ID trade-off“問題。 這不僅是一次算法的創(chuàng)新,更讓我們看到了AI在數(shù)字娛樂、影視特效甚至尋找走失人口等社會公益領(lǐng)域的廣闊應(yīng)用前景。
參考文獻(xiàn)
[1] From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging
原文標(biāo)題 : NeurIPS`25 | 感嘆歲月神偷!南開&三星開源Cradle2Cane:完美破解“年齡-身份”兩難困境!
發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
即日-5.20立即下載>> 【限時免費(fèi)】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 特斯拉Optimus Gen3量產(chǎn)在即,哪些環(huán)節(jié)最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測:中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 5 Tesla AI5芯片最新進(jìn)展總結(jié)
- 6 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 7 熱點(diǎn)丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機(jī)器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













