这是一篇论文的解读,原文标题:
Learning Visual Importance for Graphic Designs and Data Visualizations
该论文解决了预测平面设计作品的视觉焦点这一问题,帮助我们预测用户点击行为,或者评估平面设计作品的设计质量,下图是其训练结果与测试结果的对比图:
该论文基于FCN像素语义分割。
Fully Convolutional Networks for Semantic Segmentation,简称FCN,是一种end-to-end的做semantic segmentation的方法。
FCN可以基于若干种结构(VGGNet, AlexNet, SIFT-Flow)。结果最好的是基于VGGNet的FCN-32/16/8s。
FCN个明显的优点:
可以接受任意大小的输入图像,而不用要求所有的训练图像和测试图像具有同样的尺寸。
可以看下本论文的训练数据,尺寸都不一样,非常自由,如下图所示:
下图为本论文的原理:
我比较关心这2个方面:
一、数据集:
训练集862组,设计图跟视觉焦点图各862张;
测试集216组。
大概有个1000组数据就可以做到此论文的预测结果,可以以此为参照,准备自己的训练数据集。
二、应用:
辅助设计:
改变字体颜色,大小,位置,都会影响视觉焦点,集成到设计工具中,可以实时地告诉用户,设计图的焦点在哪里,达到辅助设计的目的。
自动生成缩略图:
减少很多人力去做裁切缩略图的工作,以后裁切设计图,不需要美工参与了。
设计+人工智能的文章推荐:
设计+人工智能深度案例分析报告
DIY一个人工智能设计师_v0.0.1
人工智能设计师v0.0.2
人工智能设计师之智能排版v0.0.3
电影封面海报个性化推荐+人工智能设计师v0.0.4
人工智能「 服装设计师 」上
人工智能「 服装设计师 」中
聊聊人工智能建筑师
人工智能设计师之智能排版的另一种实现方式
论文原文:http://web.mit.edu/zoya/www/docs/predImportance_final.pdf