建筑师又在用人工智能做什么？（2019年第01期-02期）

mixlab

发布于 2019-10-21 17:10:18

9560

发布于 2019-10-21 17:10:18

第一期

em。。。各位好，我又来了。去年发表的文章《建筑师用人工智能在做什么？》（https://zhuanlan.zhihu.com/p/51284408）得到了很大的反响，我也很欣慰各位同行能从我微不足道的愿景中得到启发。有各位的支持，我就有动力继续为大家解读最新成果，继续在AI+AD的道路上飞奔！

去年的文章已经仔细介绍了常用的神经网络的基础知识和理论分类，所以往后的文章将会直奔主题，介绍最新的人工智能+建筑设计的研究论文和成果。今年随着同济大学创办第一届CDRF (Computational Design and Robotic Fabrication) 会议，参数化设计领域的重大会议正式增加为5个，分别为ACADIA, CAADRIA, eCAADe, CAAD Futures, CDRF。上半年已经结束了CAADRIA，CAAD Futures和CDRF，因此本篇文章将对这三大会议中有关人工智能在建筑设计中的研究做一个梳理和介绍。

总的来说，今年上半年的各大会议，明显增加了人工智能所占的比例。在大量的AI文章中，不乏令人拍手称奇的高度原创性文章，本文会着重介绍。其他相似的其他文章就一笔带过，不浪费各位宝贵的时间。那么，我们开始吧！

首先是设计认知方向的文章：

(Karoji et al. 2019)非常巧妙的使用了RNN这一序列模型，将行人在商场内的行为作为数据，训练了一个行为预测器，能根据行人目前的位置和朝向等信息，推断他的前进方向，进而指导商场的设计，使得在行人预计路线上有更高的商业价值。很难得看到一个RNN在建筑上的应用，将时间作为序列的导线。可以说这个研究是很有启发性的，之后在预测动态的，长度不定的，和时间有关的数据时，RNN会有很好的表现。

(Kato and Matsukawa 2019)使用了基于图像的神经网络，从Google地图中抓取街景图，然后使用encoder概括街景的色彩倾向。算法类似图像分类器，不过多阐述。类似的，(Cao, Fukuda, and Yabuki 2019)同样使用了基于图像的神经网络GAN来提取一张图片中的天空部分，然后快速导入算法中计算Sky View Factor (SVF) 参数，评价城市环境。

(Kim, Song, and Lee 2019a)一如既往的专注CNN算法，识别建筑图像中的设计元素，比如室内照片中的椅子属性什么的。(Kim, Song, and Lee 2019b)还是延世大学的三人组，他们还用CNN对BIM模型中的元素提取出的图像做分类，然后训练了自动化分类BIM模型的神经网络。(Ng et al. 2019)同样用CNN进行图像分类，把建筑平面和剖面图区分开来。(Peng, Liu, and Jin 2019)则使用CNN来分类城市地图，对城市不同区域的平面图像的属性做标签，比如建筑密度和功能分区。

(Ferrando et al. 2019)把建筑理解为图结构（graph），提取建筑物中各个空间的可达性，并生成关联矩阵。然后使用基于图结构的SVM算法对建筑空间进行切割和分类，分析建筑空间设计的合理性。图结构明显要比图像结构更节省算力，但是相关的高级算法和数据结构从2018年才开始成熟。未来还有很大的发展空间。

(Zheng 2019)关注建筑师本身对设计的审美倾向，通过建筑师对形态的评分调查，使用神经网络拟合了特定受访者的潜在审美参数。原先被认为无法量化的美学因素，在神经网络的辅助下得以量化被评价。计算机可以模拟建筑师的美学判断来筛选方案。

然后是设计生成方向的文章：

(Koh, Amorim, and Huang 2019)这是一篇个人觉得特别有意思的文章。讲起来不得不提到两款游戏，一是GBA平台上的神奇宝贝（童年记忆啊），二是PC平台上的暗黑破坏神2（又是童年记忆）。先说暗黑破坏神2，它和别的游戏不同点在于，它的地图系统是根据玩家的操作和位置即时生成的，而不是预先设计好的。它将地图元素理解为坐标和种类，然后使用重复出现的图块来生成地图。而神奇宝贝之类的远古游戏也都是这样理解地图的。这样做的好处是，地图可以被向量化，然后就有了算法介入的可能。所以这篇文章讲的是，在类似神奇宝贝的地图模式下，使用强化学习的方式来生成地图。

在现有地图的情况下，计算机决策是否扩大地图并加入新的元素，进而生成合理的城市空间。这种对建筑和城市数据的游戏性理解大大扩展了生成式设计的可能性。

(del Campo et al. 2019)是一篇使用style transfer做设计的文章。秉承了一贯的UPenn设计导向的做法，风格迁移算法在这里起到了生成建筑风格化图像的作用，然后建筑师依据生成的图像做二次设计，生成建筑方案。

这里需要批判一下，AI在这类的研究中并没有实质上生成什么，而是起到启发建筑师的作用，决定设计的还是建筑师本身。而算法本身的误差带来的图像模糊，却转身一变成为了所谓“参数化形态”的来源，极具讽刺性啊。

(Steinfeld et al. 2019)巧妙的把三维建筑形态转化成二维的三视图数据，然后通过二维的CNN神经网络作为一个设计的评价者，并使用遗传算法找出当前评价体系下（比如最像香蕉的设计）的最优房屋形态解。区别于直接把模型给到3DCNN学习，这种数据的转译方式虽然不能描述所有形态，但却提高了形态储存的精度，加快了算法的速度。

最后是辅助工具方向的文章：

(Jiaxin et al. 2019)开发了一套ANN框架，对复杂的环境计算进行了简化，并直接得到建筑节能的应对策略。同样的，(Lin et al. 2019)也使用了ANN框架来寻找变化的风环境下，建筑形态设计的最优应对策略。和去年张砚同学的论文比较类似，(Lorenz et al. 2019)也使用ANN来简化环境运算，得到环境模拟数据的实施反馈。

(Dobbs 2019)使用了聚类算法，把收集到的行为数据进行清理，剔除了不合法的数据。同样的，(Willemse, Tuncer, and Bouffanais 2019)也对他们收集到的行为位置数据做了聚类，分析城市空间中的人口密度信息。(Sánchez-Vaquerizo and Llach 2019)除了聚类行为数据外，还使用了类似YOLO的CNN算法，利用城市摄像头来采集数据，这样大大降低了数据采集的难度。

(Cheng and Hou 2019)还是使用了聚类算法，不过他们关心的是如何把无人机三维扫描得到的建筑城市模型进行简化，去除不必要的多余信息，然后重构城市模型。(Yousif and Yan 2019)的聚类算法则是关心形态的聚类，比如在生成的众多形态中，有些是相似的，不需要反复出现，因此就可以先用聚类剔除相似的形态，然后给到用户更精确的，没有重复的推荐。

继去年一篇研究grasshopper论坛中的主题关键词的文章后，今年也有一篇研究建筑类论文的关键词的统计学研究。(Papasotiriou 2019)使用聚类算法对人工智能相关的词汇在建筑设计研究中出现的次数和频率等进行分析，说明近年来AI在AD领域的高速发展。

第二期

9月和10月是会议频发的两个月。今年9月举行了eCAADe 2019和Design Modelling Symposium 2019两大会议，10月将要举行IASS2019和ACADIA 2019。我也是刚刚拿到eCAADe 2019和Design Modelling Symposium 2019的论文集，粗略翻了一遍，发现有很多可圈可点的AI+AD研究。所以今年第二期“建筑师又在用人工智能做什么？”将会以这两大会议为主，介绍最新的研究论文。同时，10月的两大会议结束后，我也会整理论文集，发出今年的第三期，敬请期待！（各位如果有去巴塞罗那参加IASS 2019的话，欢迎偶遇！）

正文开始之前，我想先聊聊一些理论方面的想法。有小伙伴和我讨论过在建筑设计领域使用机器学习的必要性，我认为人工智能设计师和人类设计师相比，有很明显的两点优势：一是速度上，人工智能远远超过人类。这点来源于计算机这类硅基生物本身的运行机制上，不需要更多的解释。二是质量上，机器学习可以学习人类无法理解的原理，比如自然结构和图案，并用于设计中。比如，大家都听过一种说法，世界上没有两片叶子是一样的。人类至今还没有找到一个公式来完全总结叶子生长的规律，更不用说模仿它来做设计。分形算法这类的公式也只是对自然规律的不完全的模拟，显然自然背后的逻辑不是人类创造的简单公式可以描述的。因此，机器学习庞大的学习框架和强大的学习能力，使得它在处理复杂问题上，比人类有着更高度的归纳能力。机器学习使用复杂公式来拟合复杂问题，大大增加了准确度，在设计上也提供了一种更有逻辑的手段，来支撑建筑师的设计出发点。不过关于这点的研究还处于初级阶段，不仅在建筑学上，生物学和遗传学领域也开始使用人工智能来理解并学习自然。

另外，之前也有文章提到“智能人工”这个概念，它和“人工智能”的区别是，“智能人工”指高智商的人类在做设计，而“人工智能”指人类创造的高智商机器在做设计。我理解，“智能人工”和参数化设计是同一个概念，就是人类通过算法和公式来做设计；而“人工智能”是通过机器学习大数据来找到设计方法，然后机器自己做设计。至于哪种方法更好，就像手绘和计算机渲染的区别一样，它们都在做一件事情，有人喜欢手绘，有人喜欢计算机绘图，没有绝对的优劣之分。而这两种方法会并存，就像传统的手工艺不会随着效率工具的出现就彻底消失，只是手工艺产业发生了转型。所以两种方法都是不错的选择，具体就看使用者的个人价值观吧。

好啦不聊理论啦，我们进入正文来看看近期会议的最新成果吧！

设计认知方向的文章：

(Uzun and Çolakoğlu 2019)是一篇标准的CNN做分类的文章。作者使用CNN来区分建筑平面图和剖面图，简洁明了，通俗易懂。综合准确率在80%左右。

Plan & Section Recognition with the Accuracy Percentage

(Wu et al. 2019)也使用了基于图像的CNN神经网络来识别竹子节点的位置，进而指导结构搭建。

Trained model recognizing random bamboo poles

(Kinugawa and Takizawa 2019)训练GAN来识别全景照片的深度信息。作者首先从谷歌街景中抓取了街景照片和相应的深度图，然后将照片作为输入，深度图作为输出，训练了GAN神经网络来识别照片中的景深。

(Left) Input RGB image(center) Real depth image of (left) (right) Generated depth image

(Turlock and Steinfeld 2019)这是一篇介于设计认知和设计生成之间的文章。首先延续了作者一贯的风格，将索状结构转译为了黑白空间区分的图像，然后训练CNN对这些图像进行分类。作者先随机生成了大量的结构模型，然后拍平成为图像，然后将这些图像分发给志愿者，询问他们是否觉得优美。所以训练过的CNN能根据志愿者的回答，学习到建筑学意义上的优美指标，并且结合传统的结构评估指标，程序就能找到既优美又坚固的设计方案。不得不说这种想法是十分有趣的，把建筑师的评价标准给量化表达了。转译黑白图像类似(Steinfeld et al. 2019)，学习人为评价标准类似(Zheng 2019)。

Sample of results

(Rhee, Llach, and Krishnamurti 2019)使用了聚类算法对城市空间进行大数据定量分析。其实聚类这种无监督学习算法不同于神经网络这类有监督的学习算法，输入和输出的概念是很模糊的，我也一直犹豫是否该介绍。但本文在聚类算法应用上的效果表达还是很不错的。

T-SNE Visualization of DID-PGH Based on the Similarity of Architectural Context Conditions

设计生成方向的文章：

(Aksöz and Preisinger 2019)这篇文章解决的是结构优化领域的运算量问题。作者巧妙的运用了ANN神经网络来学习有限元分析中的受力条件和应对方法，然后使用生成的样本数据来训练神经网络，最后使用训练好的神经网络来根据用户给定的受力条件，生成结构选型。为了简化问题，作者将复杂的结构体系拆分成小单元，而整体结构是通过每个经过ANN优化过的小单元组合而成的。这种做法无疑是提高了运算效率，但是局部最优不代表整体最优，获得效率的同时势必丧失了求解空间的可能性。

Graphic displays the abstraction of the structural system to optimize and generate the data set

(Yetkin and Sorguç 2019)和上一篇文章类似，本文作者也是通过训练ANN来优化了结构计算过程，但是优化的目标是小型的桁架结构。

Flowchart of the research method

(Campo et al. 2019)我们亲爱的Matias和Sandra又一次介绍了Style Transfer生成建筑表现图。和上一期介绍的文章(del Campo et al. 2019)大同小异所以就不再赘述。下面来看一张美图吧。

The Project Church of AI by Marianna Sanche & Leete Jane Wang – University of Pennsylvania 2018

(Newton 2019)这是一篇关于使用GAN生成平面图的文章。逻辑和方法参考了(Huang and Zheng 2018)，但是使用的训练集来自于柯布西耶的建筑作品，因此样本数量非常少，只有45张。效果如下图，并不理想，可见训练集的质量和数量直接决定训练效果啊。

Samples of GAN generated plans using the original 45 image Le Corbusier house dataset with no augmentation.

(Zandavali and García 2019)同样使用了GAN，对任意边界生成铺砖模式图案。作者先调研了四种传统墙面铺砖的算法，然后生成了大量的铺砖实例，作为图像用来训练GAN，进而生成不同外边缘的铺砖图形。比较好的一篇GAN测试文章，但是实用性和必要性经不起推敲。

Input and output images for the four bonding patterns: Stretcher, Header, Englishand, Flemish.

(Miguel et al. 2019)本期最推荐的文章！作者把建筑形态转译为了特征向量，然后给到ANN神经网络里学习。特别的是，神经网络的输入和输出是相同的数据。在网络结构中可以看到，35000个输入特征先经过编码器（encoder）被映射到了一个2维向量上，这个2维向量可以用来表示压缩过的输入形态信息。然后，这个2维向量又通过解码器（decoder）重新映射回了35000个输出向量。而整个网络运行之后，目标是输入的特征经过编码+解码之后不会发生改变。这样，其中的那个2维向量就被训练到一个极致，可以完整压缩表示整个形态信息。那么，有了这个训练后的神经网络，用户就可以给定两个形态，然后分别通过编码器压缩为2维向量，然后计算它们之间的差值空间，再依次通过解码器复原为形态，这样就可以得到两个形态按照任意比例结合起来的形态。这个神经网络其实间接描述了建筑学上很难描述的形态风格参数，做到了两个形态的结合，产生了新的设计方案。

Diagram of VAE model architecture with 150 million trainable parameters.

Output of VAE trained model

辅助工具方向的文章：

(Chen et al. 2019)这篇文章是(Luo, Wang, and Xu 2018)的进阶版，和前文相比，概述了各种神经网络在预测3D打印路径上的不同表现。大同小异，感兴趣的同学可以参考原文哦。

Validation and application in design

(Thomsen et al. 2019)类似于上一篇文章，本文作者同样使用神经网络来预测建造过程。但是不同的是，本文作者先使用打孔机制造了多件打孔板样本，然后在聚光灯的照射下，拍摄这些样本的透光照片。然后将这些透光照片作为输入，打孔位置的图片作为输出，训练GAN。最终效果是，用户给定特殊的透光照片，比如特殊的图案，神经网络可以输出想要实现这种透光效果的打孔位置图片，进而指导机械生产出指定的打孔板。首先真是辛苦作者了，一共制作了1323个样本，训练的成果也很接近真实，达到了预期的效果。

Knit fabrication files A, B and C, shadow (input), fabrication file (output), learned fabrication output

(Rossi and Nicholas 2019)这是一篇关于机械臂控制的文章。通过GH中机械臂路径插件生成的数据的学习，作者训练了一个路径规划工具取代了原先的算法，更快速的生成机械臂移动轨迹，在到达目标的同时避开障碍。不过从作者的陈述看来，预测的正确率并没有和机械臂的极小误差达到同一水平。还有很长的路要走啊。