首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】WebSight - 网页截图转换为HTML代码数据集

WebSight是由Hugging Face机构开发的一个网页截图转换为HTML代码的合成数据集。该数据集包含200万对HTML代码及其对应的截图,是开源社区中首次尝试将网页截图转换为可用HTML代码的重要资源。在构建过程中,研究人员首先使用一个小型语言模型来生成多样化的网站主题和设计,然后把这些网站主题和设计输入到一个代码大模型中生成最终的HTML代码,最后采用Playwright工具来可视化并捕获生成的HTML代码的输出。该数据集可用于训练视觉语言模型,使其能够基于网页截图生成对应的HTML代码,这对于无代码开发和提高UI开发效率具有重要意义。

详情请参见五号雷达:https://www.5radar.com/result?key=WebSight

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oe4mgtC10hXBaYfYj8Lrmqhg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券