网站导航

邓志杰: 自回归-扩散混合模型及应用

发布时间:2025-10-13
点击:
来源:计算机与信息学院

报告时间2025年10月16日(星期四)14:40

报告地点翡翠湖校区科教楼B501报告厅

报 告 人邓志杰 助理教授

工作单位上海交通大学

举办单位计算机与信息学院

报告简介

以自回归模型和扩散模型为代表的多模态生成模型是当前人工智能领域的前沿热点,不过两类模型各有优劣和适用场景。本报告将探讨二者的有机结合,主要围绕 diffusion for AR 的思路,解决自回归模型在连续信号建模、推理效率等方面的问题,并简要介绍相关方法在跨模态生成、VLA 等场景的应用

报告人简介

邓志杰,于清华大学计算机系取得学士(2017)和博士(2022)学位,现任上海交通大学助理教授。主要研究生成模型,代表工作包括 D2F(首个超越自回归模型生成速度的开源扩散语言模型)和 Orthus(最早的具有原生图像生成能力的多模态大语言模型之一),相关技术应用于美团 LongCat、阶跃星衍 NextStep 等业界大模型

在 ICML、NeurIPS、CVPR 等会议和期刊上发表论文近 50 篇(第一/通讯作者 30 余篇),包括多篇 Spotlight。任 ICLR、CVPR 等会议领域主席,获 NVAIL Pioneering Research Award 等。主持多项国家/省部级和 CCF 产学合作基金。

上一篇: 黄爽: 星火大模型应用落地的安全挑战与实践

下一篇: 刘海涛: 数据何以涌现智能?

本月热点