LOGO LOGO
博士生桂祎的两篇论文被万维网和数据挖掘领域国际顶会WWW 2025会议录用
时间:2025-01-24 10:35:21

近日,2022级博士生桂祎(导师蒋文斌教授)的两篇论文“WebCode2M: A Real-World Dataset for Code Generation from Webpage Designs”和“UICopilot: Automating UI Synthesis via Hierarchical Code Generation from Webpage Designs”被2025年国际万维网会议(International World Wide Web Conferences 2025WWW 2025)录用,并均被选为口头报告(oral presentation)环节。

这两篇研究工作均专注于网页设计到代码生成的自动化进展。第一篇论文“WebCode2M: A Real-World Dataset for Code Generation from Webpage Designs”提出了一个全新的数据集WebCode2M,包含超过256万条实例,涵盖真实网页资源中的设计图像、对应网页代码及详细布局信息。该数据集填补了从设计图生成代码领域缺乏高质量、真实场景数据集的空白,并通过创新的TreeBLEU度量标准显著提升了多模态大语言模型(Multimodal Large Language Models,MLLMs)在网页代码生成中的能力,为前端设计工具的自动化应用提供了重要的数据支持。

在此基础上,第二篇论文“UICopilot: Automating UI Synthesis via Hierarchical Code Generation from Webpage Designs”进一步推进了这一研究,提出了UICopilot系统。该系统采用层次化的代码生成方法,将网页设计图像自动转化为高质量UI代码,显著减少开发者的工作量,并大幅降低人为错误的风险。系统训练了一个结构生成模型,先预测网页代码的粗粒度HTML骨架,再细化预测局部的细粒度代码,从而减轻了MLLMs在生成长代码时的压力,同时提升了网页设计图中结构信息的保留程度。这两篇工作紧密相连,互为补充,为前端开发自动化工具的创新发展奠定了坚实基础。

WWW是万维网和数据挖掘领域的国际顶级学术会议,也是中国计算机学会CCF)推荐的A类会议。WWW 2025的投稿量达到2062篇,最终接收了409篇(录用率为19.83%),其中口头报告的文章数量不超过录用篇数的50%。

(通讯员:桂祎)