Publications

UltraFlux: Data-Model Co-Design for High-quality Native 4K Text-to-Image Generation across Diverse Aspect Ratios

Tian Ye*, Song Fei*, Lei Zhu

CVPR 2026

PosterOmni: Generalized Artistic Poster Creation via Task Distillation and Unified Reward Feedback

Sixiang Chen*, Jianyu Lai*, Jialin Gao*, Hengyu Shi*, Zhongying Liu*, Tian Ye, Junfeng Luo, Xiaoming Wei, Lei Zhu

CVPR 2026

PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework

SiXiang Chen*, Jianyu Lai*, Jialin Gao*, Tian Ye, Haoyu Chen, Hengyu Shi, Shitong Shao, Yunlong Lin, Song Fei, Zhaohu Xing, Yeying Jin, Junfeng Luo, Xiaoming Wei, Lei Zhu

ICLR 2026

Improved and Accelerated Text-to-Image Generation with Collect, Reflect, and Refine

Shitong Shao, Zikai Zhou, Dian Xie, Yuetong Fang, Tian Ye, Lichen Bai, Zeke Xie

IEEE TPAMI 2026

EditMGT: Unleashing Potentials of Masked Generative Transformers in Image Editing

Wei Chow, Linfeng Li, Lingdong Kong, Zefeng Li, Qi Xu, Hang Song, Tian Ye, Xian Wang, Jinbin Bai, Shilin Xu, Xiangtai Li, Junting Pan, Shaoteng Liu, Ran Zhou, Tianshu Yang, Songhua Liu

CVPR 2026

LucidFlux: Caption-Free Universal Image Restoration via a Large-Scale Diffusion Transformer

Song Fei*, Tian Ye*, Lujia Wang, Lei Zhu

ICLR 2026

arXiv

AuroraLong: Bringing RNNs Back to Efficient Open-Ended Video Understanding

Weili Xu, Enxin Song, Wenhao Chai, Xuexiang Wen, Tian Ye, Gaoang Wang

CVPR 2025

Detect Any Mirrors: Boosting Learning Reliability on Large-Scale Unlabeled Data with an Iterative Data Engine

Zhaohu Xing, Lihao Liu, Yijun Yang, Hongqiu Wang, Tian Ye, Sixiang Chen, Wenxue Li, Guang Liu, Lei Zhu

CVPR 2025

Posta: A Go-To Framework for Customized Artistic Poster Generation

Haoyu Chen, Xiaojie Xu, Wenbo Li, Jingjing Ren, Tian Ye, Songhua Liu, Ying-Cong Chen, Lei Zhu, Xinchao Wang

CVPR 2025

SnowMaster: Comprehensive Real-world Image Desnowing via MLLM with Multi-Model Feedback Optimization

Jianyu Lai, Sixiang Chen, Yunlong Lin, Tian Ye, Yun Liu, Song Fei, Zhaohu Xing, Hongtao Wu, Weiming Wang, Lei Zhu

CVPR 2025

GenHaze: Pioneering Controllable One-Step Realistic Haze Generation for Real-World Dehazing

Sixiang Chen, Tian Ye, Yunlong Lin, Yeying Jin, Yijun Yang, Haoyu Chen, Jianyu Lai, Song Fei, Zhaohu Xing, Fugee Tsung, Lei Zhu

ICCV 2025

GlassWizard: Harvesting Diffusion Priors for Glass Surface Detection

Wenxue Li*, Tian Ye*, Xinyu Xiong, Jinbin Bai, Feilong Tang, Wenxuan Song, Zhaohu Xing, Lie Ju, Guanbin Li, Lei Zhu

ICCV 2025

MagicInfinite: Generating Infinite Talking Videos with Your Words and Voice

Hongwei Yi*, Tian Ye*, Shitong Shao*, Xuancheng Yang*, Jiantong Zhao*, Hanzhong Guo, Terrance Wang, Qingyu Yin, Zeke Xie, Lei Zhu, Wei Li, Michael Lingelbach, Daquan Zhou

Technical Report 2025

Technical report for Hedra Inc.’s Character-3 model.

MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Few-Step Synthesis

Shitong Shao, Hongwei Yi, Hanzhong Guo, Tian Ye, Daquan Zhou, Michael Lingelbach, Zhiqiang Xu, Zeke Xie

Technical Report 2025

Acceleration technique and foundational image-to-video model work for Hedra Inc.’s Character-3.

AGLLDiff: Guiding Diffusion Models Towards Unsupervised Training-free Real-world Low-light Image Enhancement

Yunlong Lin*, Tian Ye*, Sixiang Chen*, Zhenqi Fu, Yingying Wang, Wenhao Chai, Zhaohu Xing, Lei Zhu, Xinghao Ding

AAAI 2025

arXiv Project Page

DPLUT: Unsupervised Low-Light Image Enhancement with Lookup Tables and Diffusion Priors

Yunlong Lin, Zhenqi Fu, Kairun Wen, Tian Ye, Sixiang Chen, Ge Meng, Yingying Wang, Chui Kong, Yue Huang, Xiaotong Tu, Xinghao Ding

AAAI 2025

PromptHaze: Prompting Real-world Dehazing via Depth Anything Model

Tian Ye, Sixiang Chen, Haoyu Chen, Wenhao Chai, Jingjing Ren, Zhaohu Xing, Wenxue Li, Lei Zhu

AAAI 2025

Residual Diffusion Deblurring Model for Single Image Defocus Deblurring

Haoxuan Feng, Haohui Zhou, Tian Ye, Sixiang Chen, Lei Zhu

AAAI 2025

MovieChat+: Question-Aware Sparse Memory for Long Video Question Answering

Enxin Song, Wenhao Chai, Tian Ye, Jenq-Neng Hwang, Xi Li, Gaoang Wang

IEEE TPAMI 2025

RestoreAgent: Autonomous Image Restoration Agent via Multimodal Large Language Models

Haoyu Chen, Wenbo Li, Jinjin Gu, Jingjing Ren, Sixiang Chen, Tian Ye, Renjing Pei, Kaiwen Zhou, Fenglong Song, Lei Zhu

NeurIPS 2024

Cross-Conditioned Diffusion Model for Medical Image-to-Image Translation

Z Xing, S Yang, S Chen, Tian Ye, Y Yang, J Qin, L Zhu

MICCAI 2024

Teaching Tailored to Talent: Adverse Weather Restoration via Prompt Pool and Depth-Anything Constraint

Sixiang Chen, Tian Ye, Kai Zhang, Zhaohu Xing, Yunlong Lin, Lei Zhu

ECCV 2024

arXiv Code Project Page

Learning Diffusion Texture Priors for Image Restoration

Tian Ye, Sixiang Chen, Wenhao Chai, Zhaohu Xing, Jing Qin, Ge Lin, Lei Zhu

CVPR 2024 Highlight

PDF Project Page

SegMamba: Long-range Sequential Modeling Mamba For 3D Medical Image Segmentation

Zhaohu Xing, Tian Ye, Yijun Yang, Guang Liu, Lei Zhu

MICCAI 2024 Spotlight

arXiv Code

Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis

Jinbin Bai*, Tian Ye*, Wei Chow, Enxin Song, Qing-Guo Chen, Xiangtai Li, Zhen Dong, Lei Zhu, Shuicheng Yan

ICLR 2025

arXiv Project Page

The first SDXL-level high-resolution non-AR T2I model.

Adverse Weather Removal with Codebook Priors

Tian Ye*, Sixiang Chen*, Jinbin Bai*, Shi Jun, Chenghao Xue, Jingjia Jiang, Junjie Yin, Erkang Chen, Yun Liu

ICCV 2023

PDF

Sparse Sampling Transformer with Uncertainty-Driven Ranking for Unified Removal of Raindrops and Rain Streaks

Sixiang Chen*, Tian Ye*, Jinbin Bai, Jun Shi, Erkang Chen, Lei Zhu

ICCV 2023

PDF Code Project Page

arXiv Code

Perceiving and Modeling Density for Image Dehazing

Tian Ye*, Yunchen Zhang*, Mingchao Jiang*, Liang Chen, Yun Liu, Erkang Chen

ECCV 2022 Oral

PDF Code

Publications

UltraFlux: Data-Model Co-Design for High-quality Native 4K Text-to-Image Generation across Diverse Aspect Ratios

PosterOmni: Generalized Artistic Poster Creation via Task Distillation and Unified Reward Feedback

PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework

Improved and Accelerated Text-to-Image Generation with Collect, Reflect, and Refine

EditMGT: Unleashing Potentials of Masked Generative Transformers in Image Editing

LucidFlux: Caption-Free Universal Image Restoration via a Large-Scale Diffusion Transformer

AuroraLong: Bringing RNNs Back to Efficient Open-Ended Video Understanding

Detect Any Mirrors: Boosting Learning Reliability on Large-Scale Unlabeled Data with an Iterative Data Engine

Posta: A Go-To Framework for Customized Artistic Poster Generation

SnowMaster: Comprehensive Real-world Image Desnowing via MLLM with Multi-Model Feedback Optimization

GenHaze: Pioneering Controllable One-Step Realistic Haze Generation for Real-World Dehazing

GlassWizard: Harvesting Diffusion Priors for Glass Surface Detection

MagicInfinite: Generating Infinite Talking Videos with Your Words and Voice

MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Few-Step Synthesis

AGLLDiff: Guiding Diffusion Models Towards Unsupervised Training-free Real-world Low-light Image Enhancement

DPLUT: Unsupervised Low-Light Image Enhancement with Lookup Tables and Diffusion Priors

PromptHaze: Prompting Real-world Dehazing via Depth Anything Model

Residual Diffusion Deblurring Model for Single Image Defocus Deblurring

MovieChat+: Question-Aware Sparse Memory for Long Video Question Answering

RestoreAgent: Autonomous Image Restoration Agent via Multimodal Large Language Models

Cross-Conditioned Diffusion Model for Medical Image-to-Image Translation

Teaching Tailored to Talent: Adverse Weather Restoration via Prompt Pool and Depth-Anything Constraint

Learning Diffusion Texture Priors for Image Restoration

SegMamba: Long-range Sequential Modeling Mamba For 3D Medical Image Segmentation

Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis

Adverse Weather Removal with Codebook Priors

Sparse Sampling Transformer with Uncertainty-Driven Ranking for Unified Removal of Raindrops and Rain Streaks

See and Think: Embodied Agent in Virtual Environment

Integrating View Conditions for Image Synthesis

VQCNIR: Clearer Night Image Restoration with Vector-Quantized Codebook

Perceiving and Modeling Density for Image Dehazing