Publications

Efficient Inference

Faster and Better LLMs via Latency-Aware Test-Time Scaling

Zili Wang*, Tianyu Zhang*, Haoli Bai, Lu Hou, Shiming Xiang, Xianzhi Yu, Wulong Liu, Lei Zhu^✉

EMNLP Empirical Methods in Natural Language Processing (Findings), 2025

MoESD: Unveil Speculative Decoding's Potential for Accelerating Sparse MoE

Zongle Huang, Lei Zhu, Zongyuan Zhan, Ting Hu, Weikai Mao, Xianzhi Yu, Yongpan Liu, Tianyu Zhang^✉

NeurIPS🏆 Spotlight Annual Conference on Neural Information Processing Systems, 2025

Long-Context Modeling

Revisiting the Integration of Convolution and Attention for Vision Backbone

Lei Zhu, Xinjiang Wang, Wayne Zhang, Rynson WH Lau

NeurIPS Annual Conference on Neural Information Processing Systems, 2024

RelayAttention for Efficient Large Language Model Serving with Long System Prompts

Lei Zhu, Xinjiang Wang, Wayne Zhang, Rynson WH Lau

ACL Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2024

BiFormer: Vision Transformer with Bi-Level Routing Attention

Lei Zhu, Xinjiang Wang, Zhanghan Ke, Wayne Zhang, Rynson WH Lau

CVPR IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023

Other

GRPO-VPS: Enhancing Group Relative Policy Optimization with Verifiable Process Supervision for Effective Reasoning

Jingyi Wang, Lei Zhu^✉, Tengjin Weng, Song-Li Wu, Haochen Tan, Jierun Chen, Chaofan Tao, Haoli Bai, Lu Hou, Lifeng Shang, Xiao-Ping Zhang^✉

ICLRW ICLR 2026 Workshop on Logical Reasoning of Large Language Models, 2026

MTR-DuplexBench: Towards a Comprehensive Evaluation of Multi-Round Conversations for Full-Duplex Speech Language Models

He Zhang*, Wenqian Cui*, Haoning Xu, Xiaohui Li, Lei Zhu^✉, Haoli Bai, Shaohua Ma^✉, Irwin King

ACL Annual Meeting of the Association for Computational Linguistics (Findings), 2026

The Synergy Dilemma of Long-CoT SFT and RL: Investigating Post-Training Techniques for Reasoning VLMs

Jierun Chen*, Tiezheng Yu*, Haoli Bai^✉, Lewei Yao, Jiannan Wu, Kaican Li, Fei Mi, Chaofan Tao, Lei Zhu, Manyi Zhang, Xiaohui Li, Lu Hou, Lifeng Shang, Qun Liu

TMLR Transactions of the Machine Learning Research, 2026

openPangu DeepDiver-V2: Multi-Agent Learning for Deep Information Seeking

openPangu-Team including Lei Zhu

preprint Technical Report, 2025

Think Before You Talk: Enhancing Meaningful Dialogue Generation in Full-Duplex Speech Language Models with Planning-Inspired Text Guidance

Wenqian Cui, Lei Zhu, Xiaohui Li, Zhihan Guo, Haoli Bai, Lu Hou, Irwin King

preprint arXiv preprint arXiv:2508.07375, 2025

Analytic-Splatting: Anti-Aliased 3D Gaussian Splatting via Analytic Integration

Zhihao Liang, Qi Zhang, Wenbo Hu, Ying Feng, Lei Zhu, Kui Jia

ECCV🏆 Oral European Conference on Computer Vision, 2024

Inverse Rendering of Glossy Objects via the Neural Plenoptic Function and Radiance Fields

Haoyuan Wang, Wenbo Hu, Lei Zhu, Rynson WH Lau

CVPR IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2024

Towards Self-Adaptive Pseudo-Label Filtering for Semi-Supervised Learning

Lei Zhu, Zhanghan Ke, Rynson WH Lau

preprint arXiv preprint arXiv:2309.09774, 2023

Neural Preset for Color Style Transfer

Zhanghan Ke, Yuhao Liu, Lei Zhu, Nanxuan Zhao, Rynson WH Lau

CVPR IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023

Harmonizer: Learning to perform white-box image and video harmonization

Zhanghan Ke, Chunyi Sun, Lei Zhu, Ke Xu, Rynson WH Lau

ECCV European Conference on Computer Vision, 2022

Mitigating intensity bias in shadow detection via feature decomposition and reweighting

Lei Zhu, Ke Xu, Zhanghan Ke, Rynson WH Lau

ICCV International Conference on Computer Vision, 2021

Efficient Inference

Long-Context Modeling

Other

GRPO-VPS: Enhancing Group Relative Policy Optimization with Verifiable Process Supervision for Effective Reasoning

2026

GRPO-VPS: Enhancing Group Relative Policy Optimization with Verifiable Process Supervision for Effective Reasoning

2025

2024

2023

2022

Before 2022