Publications

The full list can be found at Google Scholar. (* for corresponding author, # for co-first author)

2026

Exploring Code Analysis: Zero-Shot Insights on Syntax and Semantics with LLMs
Wei Ma, Zhihao Lin, Shangqing Liu, Qiang Hu, Ye Liu, Wenhan Wang, Cen Zhang, Liming Nie, Li Li, Yang Liu, Lingxiao Jiang.
ACM Transactions on Software Engineering and Methodology (TOSEM). [pdf].

How Powerful are LLMs in Generating Program Specifications?
Fanpeng Yang, Xing Li, Shuling Wang, Jie An, Zeyu Sun, Shenghua Feng, Wenhan Wang, Weiyi Wang, Naijun Zhan, Fanjiang Xu. In ICML 2026 (to appear).

2025

TESTEVAL: Benchmarking Large Language Models for Test Case Generation
Wenhan Wang#, Chenyuan Yang#, Zhijie Wang#, Yuheng Huang, Zhaoyang Chu, Da Song, Lingming Zhang, An Ran Chen, Lei Ma. In NAACL 2025 findings. [pdf]

2024

VulAdvisor: Natural Language Suggestion Generation for Software Vulnerability Repair
Jian Zhang, Chong Wang, Anran Li, Wenhan Wang, Tianlin Li, Yang Liu.
39th IEEE/ACM International Conference on Automated Software Engineering, ASE 2024. [PDF]

Unveiling code pre-trained models: Investigating syntax and semantics capacities.
Wei Ma, Shangqing Liu, Mengjie Zhao, Xiaofei Xie, Wenhang Wang, Qiang Hu, Jie Zhang, Yang Liu.
ACM Transactions on Software Engineering and Methodology (TOSEM). [PDF]

An Empirical Study on Noisy Label Learning for Program Understanding
Wenhan Wang, Yanzhou Li, Anran Li, Jian Zhang, Wei Ma, Yang Liu.
In Proceedings of the IEEE/ACM 46th International Conference on Software Engineering (ICSE 2024). [PDF]

BadEdit: Backdooring Large Language Models by Model Editing
Yanzhou Li, Tianlin Li, Kangjie Chen, Jian Zhang, Shangqing Liu, Wenhan Wang, Tianwei Zhang, Yang Liu.
The Twelfth International Conference on Learning Representations (ICLR 2024). [PDF]

2023

Learning Program Representations with a Tree-Structured Transformer
Wenhan Wang, Kechi Zhang, Ge Li, Shangqing Liu, Anran Li, Zhi Jin.
2023 IEEE International Conference on Software Analysis, Evolution and Reengineering (SANER 2023). [PDF]

2022

Learning to Represent Programs with Heterogeneous Graphs
Kechi Zhang#, Wenhan Wang#, Huangzhao Zhang, Ge Li, Zhi Jin.
30th IEEE/ACM International Conference on Program Comprehension (ICPC 2022). [PDF]

2021

Integrating Tree Path in Transformer for Code Representation
Han Peng, Ge Li, Wenhan Wang, Yunfei Zhao, Zhi Jin.
Advances in Neural Information Processing Systems (NeurIPS 2021). [PDF]

2020

Modular Tree Network for Source Code Representation Learning
Wenhan Wang, Ge Li, Sijie Shen, Xin Xia, Zhi Jin.
ACM Transactions on Software Engineering and Methodology (TOSEM), Volume 29, Issue 4. [PDF]

Detecting Code Clones with Graph Neural Network and Flow-Augmented Abstract Syntax Tree
Wenhan Wang, Ge Li, Bo Ma, Xin Xia, Zhi Jin.
2020 IEEE 27th International Conference on Software Analysis, Evolution and Reengineering (SANER 2020). [PDF]