报告时间:2025年10月16日(星期四)14:40
报告地点:翡翠湖校区科教楼B501报告厅
报 告 人:邓志杰 助理教授
工作单位:上海交通大学
举办单位:计算机与信息学院
报告简介:
以自回归模型和扩散模型为代表的多模态生成模型是当前人工智能领域的前沿热点,不过两类模型各有优劣和适用场景。本报告将探讨二者的有机结合,主要围绕 diffusion for AR 的思路,解决自回归模型在连续信号建模、推理效率等方面的问题,并简要介绍相关方法在跨模态生成、VLA 等场景的应用。
报告人简介:
邓志杰,于清华大学计算机系取得学士(2017)和博士(2022)学位,现任上海交通大学助理教授。主要研究生成模型,代表工作包括 D2F(首个超越自回归模型生成速度的开源扩散语言模型)和 Orthus(最早的具有原生图像生成能力的多模态大语言模型之一),相关技术应用于美团 LongCat、阶跃星衍 NextStep 等业界大模型。
在 ICML、NeurIPS、CVPR 等会议和期刊上发表论文近 50 篇(第一/通讯作者 30 余篇),包括多篇 Spotlight。任 ICLR、CVPR 等会议领域主席,获 NVAIL Pioneering Research Award 等。主持多项国家/省部级和 CCF 产学合作基金。