社区首页 >问答首页 >为具有柔性形状的CoreML 2模型指定输入/输出尺寸

问为具有柔性形状的CoreML 2模型指定输入/输出尺寸
EN

Stack Overflow用户

提问于 2018-10-31 22:13:15

回答 1查看 1.9K关注 0票数 9

我设法创建了一个具有灵活输入/输出形状大小的CoreML 2.0模型：

但是，我不知道如何在我的Xcode项目中设置大小。如果设置输入像素缓冲区大小2048x2048，则输出像素缓冲区仍为1536x1536。如果将其设置为768x768，则结果像素缓冲区仍为1536x1536，但在768x768区域外为空白。

我检查了自动生成的Swift模型类，没有看到任何线索。

我在任何地方都找不到一个例子，说明如何使用“灵活性”大小。

在WWDC 2018年会议708“核心ML中的新内容”中，第1部分指出：

这意味着，现在您必须交付一个单一的模式。你不必有任何多余的代码。如果您需要在标准定义和高清晰度之间切换，您可以更快地完成它，因为我们不需要从头开始重新加载模型；我们只需要调整它的大小。您有两个选项来指定模型的灵活性。可以为其维度定义范围，因此可以定义最小宽度和高度以及最大宽度和高度。然后在推理中选择介于两者之间的任何值。但还有另外一种方法。您可以枚举要使用的所有形状。例如，所有不同的高宽比，所有不同的分辨率，这是更好的性能。核心ML更早地了解您的用例，所以它可以--它有机会执行更多的优化。

他们说“我们只需要调整它的大小”。这太让人沮丧了，因为他们不告诉你怎么调整尺寸！他们还说，“然后在推断之间挑选任何价值”，但没有提供任何线索，如何在两者之间选择价值！

下面是我如何添加灵活的形状大小：

import coremltools
from coremltools.models.neural_network import flexible_shape_utils
spec = coremltools.utils.load_spec('mymodel_fxedShape.mlmodel')
img_size_ranges = flexible_shape_utils.NeuralNetworkImageSizeRange()
img_size_ranges.add_height_range(640, 2048)
img_size_ranges.add_width_range(640, 2048)
flexible_shape_utils.update_image_size_range(spec, feature_name='inputImage', size_range=img_size_ranges)
flexible_shape_utils.update_image_size_range(spec, feature_name='outputImage', size_range=img_size_ranges)
coremltools.utils.save_spec(spec, 'myModel.mlmodel')

下面是模型的描述：

description {
  input {
    name: "inputImage"
    shortDescription: "Image to stylize"
    type {
      imageType {
        width: 1536
        height: 1536
        colorSpace: BGR
        imageSizeRange {
          widthRange {
            lowerBound: 640
            upperBound: 2048
          }
          heightRange {
            lowerBound: 640
            upperBound: 2048
          }
        }
      }
    }
  }
  output {
    name: "outputImage"
    shortDescription: "Stylized image"
    type {
      imageType {
        width: 1536
        height: 1536
        colorSpace: BGR
        imageSizeRange {
          widthRange {
            lowerBound: 640
            upperBound: 2048
          }
          heightRange {
            lowerBound: 640
            upperBound: 2048
          }
        }
      }
    }
  }
}

有两个使用“outputShape”的层：

layers {
    name: "SpatialFullConvolution_63"
    input: "Sequential_53"
    output: "SpatialFullConvolution_63_output"
    convolution {
      outputChannels: 16
      kernelChannels: 32
      nGroups: 1
      kernelSize: 3
      kernelSize: 3
      stride: 2
      stride: 2
      dilationFactor: 1
      dilationFactor: 1
      valid {
        paddingAmounts {
          borderAmounts {
          }
          borderAmounts {
          }
        }
      }
      isDeconvolution: true
      hasBias: true
      weights {
      }
      bias {
      }
      outputShape: 770
      outputShape: 770
    }
  }
  ...relu layer...
  layers {
    name: "SpatialFullConvolution_67"
    input: "ReLU_66"
    output: "SpatialFullConvolution_67_output"
    convolution {
      outputChannels: 8
      kernelChannels: 16
      nGroups: 1
      kernelSize: 3
      kernelSize: 3
      stride: 2
      stride: 2
      dilationFactor: 1
      dilationFactor: 1
      valid {
        paddingAmounts {
          borderAmounts {
          }
          borderAmounts {
          }
        }
      }
      isDeconvolution: true
      hasBias: true
      weights {
      }
      bias {
      }
      outputShape: 1538
      outputShape: 1538
    }
  }

我现在正试图弄清楚如何从这两个层中删除outputShape。

>>> layer = spec.neuralNetwork.layers[49]
>>> layer.convolution.outputShape
[1538L, 1538L]

我试着把它设置为[]：

layer.convolution.outputShape = []

以一种形状：

layer.convolution.outputShape = flexible_shape_utils.Shape(())

无论我尝试什么，我都会犯错误：

TypeError: Can't set composite field

我是否必须创建一个新的层，然后将其链接到输出到它的层和它输出到的层？

ios

swift

coreml

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-08-01 15:40:52

本例中的问题是，模型中存在一些层，它们的outputShapes使用固定的形状。例如：

>>> layer = spec.neuralNetwork.layers[49]
>>> layer.convolution.outputShape
[1538L, 1538L]

所讨论的模型确实是完全卷积的，因此在转换到CoreML之前，它可以处理任何输入和输出形状。

我能够使用以下命令删除固定的outputShape：

layer = spec.neuralNetwork.layers[49]
del layer.convolution.outputShape[:]

在此之后，模型具有灵活的输入和输出形状。

这个答案的所有功劳都归功于马蒂杰斯·霍勒曼人。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53096060

复制

【Apache Ant】ANT解析以及ANT在myEclipse中的使用

apache jar linux

Apache Ant，是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具，大多用于Java环境中的软件开发。

谙忆

2021/01/21

1.5K0

为什么在静态方法中不能使用this

java

在JVM的运行时数据区中有个虚拟机栈(或Java栈),在它的里面是由栈帧'叠加'而成.栈帧由局部变量表,操作数栈,动态连接,方法返回地址等组成.

书唐瑞

2022/06/02

1.9K0

在vue的v-for中，key为什么不能用index？

node.js javascript 编程算法

在前端中，主要涉及的基本上就是 DOM的相关操作和 JS，我们都知道 DOM 操作是比较耗时的，那么在我们写前端相关代码的时候，如何减少不必要的 DOM 操作便成了前端优化的重要内容。

bb_xiaxia1998

2022/10/01

1.1K0

在vue的v-for中，key为什么不能用index？4

javascript 编程算法网站

bb_xiaxia1998

2023/01/06

1.1K0

cmake:在Makefile中运行ant脚本

打包 apache makefile c++https

10km

2019/05/25

1.7K0

为什么我退出了编程工作

网站

从很小的时候就在印度出生和成长，在那里我们只有少数的职业选择。工程师和医生是很多人的头两个选择。现在，随着互联网的兴起，事情正在发生变化，但是父母期望孩子成为医生或工程师的情况并不少见。

程序那些事儿

2023/03/07

3150

在ReadWriteLock类中读锁为什么不能升级为写锁？

java api jdk github

关于读写锁里面有一个锁升级和降级的问题，也就是写锁可以降级为读锁，但是读锁却不能升级为写锁。那么为什么是这样？

我是攻城师

2018/08/03

3K0

nextline函数_在JAVA中Scanner中的next（）和nextLine()为什么不能一起使用？

编程算法 c++

Java 输入一直是一个坑，本来一直用 Scanner，但一直搞不懂换行符啥的，就用 BufferReader ，但前不久大疆笔试需要持续输入，早忘了 Scanner 怎么写，而那个场景用 Scanner 很好实现 ……

全栈程序员站长

2022/09/05

2.7K0

java中的ant详解

apache java xml jar

概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个

botkenni

2021/09/23

1.1K0

晶振为什么不能放置在PCB边缘？

某行车记录仪，测试的时候要加一个外接适配器，在机器上电运行测试时发现超标，具体频点是84MHz、144MHz、168MHz，需要分析其辐射超标产生的原因，并给出相应的对策，辐射测试数据如下：

AI 电堂

2022/12/08

3730

我在 Z 厂的半年工作总结

腾讯云测试服务自动化

Z厂前: 在一家K12教育公司(简称S厂),定位是测试开发岗位,主要负责效能工具研发、自动化、服务端压测、测试环境治理,带5人小团队.S厂的测试和测开分发的,测开不负责业务,所以到最后会感觉到脱离业务比较多,S厂离职后面试很吃亏,比如: 美团、阿里、便利峰,技术能力没啥问题,主要是简历中无法体现所负责的业务价值.

测试加

2022/04/27

6660

Ant中的SVN 使用

svn

最近在调整SDK的打包脚本的时候重新树立了一下ant下面的SVN命令的用法。先简单列举下，以后有精力再慢慢整理细说吧。 svn copy 多用于生成当前版本的tag <arg line="copy SVN_URL1 SVN_URL2 --no-auth-cache --non-interactive --username USERNAME --password PASSWORD -m MSG" /> </exec> svn add 多用于提交在版本打包过程生成的重要文件，例如代码混淆生成的mapp

子勰

2018/05/22

8900

在java中String类为什么要设计成final？

编程算法

final的出现就是为了为了不想改变，而不想改变的理由有两点：设计(安全)或者效率。

一觉睡到小时候

2019/07/02

9330

在java中String类为什么要设计成final？

其他

String很多实用的特性，比如说“不可变性”，是工程师精心设计的艺术品！艺术品易碎！用final就是拒绝继承，防止世界被熊孩子破坏，维护世界和平！

用户1205080

2018/09/12

1.1K0

工作中我常用的分析算法

数据分析线性回归数据挖掘编程算法

统计性描述更为侧重单变量的描述，即描述X、X与X之间的关系，在通过X去描述Y的时候，我更关心X与Y间存在何种关系，此时便需要借助散点图去印证X与Y相关的内在一致性，并通过方差、协方差过渡到统计相关的本质。

许卉

2019/09/24

6310

在IT开发中工作种类的分类

python

可能很多同学在学习python之前都听说过什么：前端程序员，后端程序员，安全工程师，运维，爬虫，全栈程序员等等各种各样的头衔名称，搞得大家都不知道该怎么选择了。我当初学编程之前也有过类似的经历，所以这里我尽可能给大家解释明白。

python自学网

2021/11/27

9510

我在 IBM 从事开源工作的十一年

开源 openstack 云计算 serverless

编者说：在国际知名公司从事开源工作是一种怎样的体验？目前越来越多的来自中国的企业、组织或开发者，都纷纷投身到全球技术的开源生态建设大潮中，甚至将开源作为一份全职工作。那在如火如荼的开源热浪中，国内开源爱好者们在国际开源舞台上的参与度如何？作为开源新兵，又该如何步入或活跃于国际开源组织，在开源社区中建立自己的声誉和话语权呢？带着这些问题，腾源会采访了在 IBM 公司从事 11 年开源工作的高级工程师侯胜博，和他聊聊在 IBM 参与开源背后的那些成长故事，以及在开源社区参与大规模协作过程中所收

腾源会

2021/11/11

5360

聊聊我在腾讯和字节工作感受

单片机

大家好，我是鱼皮，最近这段时间，应该是正值大三的小伙伴最忙碌的时候，不少同学都在准备秋季校园招聘。

程序员鱼皮

2021/08/12

3.3K0

谈谈在我在外包公司工作的经历

ps 项目经理

来源：zhihu.com/question/52994936/answer/958545980

JAVA葵花宝典

2020/11/04

2.5K0

在应用开发中，我为什么选择 Flutter 而不是 React Native ？

ios flutter android react 腾讯云测试服务

作为一位开发人员，我想在本文中与大家聊聊跨平台开发领域的两大核心选项——Flutter 与 React Native 框架，并介绍我自己为什么更偏爱 Flutter。

逆锋起笔

2021/01/28

3.3K0

相似问题

输入的defaultValue在ant设计上不能正常工作

6606

为什么我的Ant主构建文件不能正常工作？

为什么`<Input>`在Ant设计中没有变化？

Ant设计卡不能正确对齐

239

为什么我的混合模型循环不能工作？(RStudio，交叉设计)

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问为具有柔性形状的CoreML 2模型指定输入/输出尺寸
EN

回答 1

Stack Overflow用户

输入的defaultValue在ant设计上不能正常工作

为什么我的Ant主构建文件不能正常工作？

为什么`<Input>`在Ant设计中没有变化？

Ant设计卡不能正确对齐

为什么我的混合模型循环不能工作？(RStudio，交叉设计)

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为具有柔性形状的CoreML 2模型指定输入/输出尺寸EN

回答 1

Stack Overflow用户

输入的defaultValue在ant设计上不能正常工作

为什么我的Ant主构建文件不能正常工作？

为什么`<Input>`在Ant设计中没有变化？

Ant设计卡不能正确对齐

为什么我的混合模型循环不能工作？(RStudio，交叉设计)

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为具有柔性形状的CoreML 2模型指定输入/输出尺寸
EN