从一行中的两列自动缩放图像？_从自动缩放的图像Wordpress中删除"-scaled“_按比例将左侧图像缩放到右侧两行的高度 - 腾讯云开发者社区

Alexander 的论文《Pediatric Bone Age Assessment Using Deep Convolutional Neural Networks》（Vladimir Iglovikov、Alexander Kalinin 以及 Alexey Shvets 联合完成的一项工作）已经发表在第 4 届 Deep Learning in Medical Image Analysis（DLMIA 2018）Workshop 上。这不是 Neuromation 在医学影像方面发表的第一篇论文，但这是一个深入了解该研究细节的好机会。与我们之前发表的关于医疗概念规范化的文章（https://medium.com/neuromation-io-blog/neuromation-research-medical-concept-normalization-in-social-media-posts-f06504200cec）相似，这是一件严肃且相当复杂的事。

最新iOS设计规范四｜3大界面要素：视图(Views)

iOS是运行于iPhone、iPad和iPod touch设备上、最常用的移动操作系统之一。作为互联网应用的开发者、产品经理、体验设计师，都应当理解并熟悉平台的设计规范。这有利于提高我们的工作效率，保证用户良好的体验。

您找到你想要的搜索结果了吗？

是的

没有找到

图片布局的最全实现方式都在这了！附源码

Scaling Laws又失灵了？谷歌新研究：扩散模型不是越大越好

OpenAI是scaling laws的坚定拥护者。可是模型训练是否真的大力出奇迹呢？

Iris: 比ScanContext更加精确高效的激光回环检测方法（IROS 2020）

代码已开源: https://github.com/JoestarK/LiDAR-Iris

基础渲染系列（一）图形学的基石——矩阵

这是基础渲染课程系列的第一部分，主要涵盖变换矩阵相关的内容。如果你还不清楚Mesh是什么或者怎么工作的，可以转到Mesh Basics 相关的章节去了解（译注：Mesh Basics系列皆已经翻译完毕，但与本系列主题关联不大，讲完4个渲染系列之后，再放出来）。这个系列会讲，这些Mesh是如何最终变成一个像素呈现在显示器上的。

识别自动驾驶的深度

有许多传感器可用于在车辆行驶时捕获信息。捕获的各种测量结果包括速度，位置，深度，热等。这些测量结果被输入到反馈系统中，该系统训练并利用运动模型来遵守车辆。本文重点介绍通常由LiDAR传感器捕获的深度预测。LiDAR传感器使用激光捕获与物体的距离，并使用传感器测量反射光。但是，对于日常驾驶员而言，LiDAR传感器是负担不起的，那么还能如何测量深度？将描述的最新方法是无监督的深度学习方法，该方法使用一帧到下一帧的像素差异或差异来测量深度。

何凯明: 扩散模型的解构研究

本研究对去噪扩散模型（DDM）进行了解构，发现其关键组件是分词器，而其他组件并非必要。DDM的表现能力主要来自去噪过程而非扩散过程。研究还发现，通过消除类标签条件化项和KL正则化项，使用补丁式分词器可获得与卷积VAE相当的表现。最后，将现代DDM推向经典DAE，通过消除输入缩放和直接定义噪声调度，可获得更好的结果。

前端|响应式布局原理

首先通过媒体查询确认container的宽度，每个col-xx-xx都是通过百分比定义的，屏幕尺寸变化了，container就变化了，col自然就变了。

Iris: 比ScanContext更加精确高效的激光回环检测方法（IROS 2020）

代码已开源: https://github.com/JoestarK/LiDAR-Iris

【从零学习OpenCV 4】边缘检测原理

图像的边缘指的是图像中像素灰度值突然发生变化的区域，如果将图像的每一行像素和每一列像素都描述成一个关于灰度值的函数，那么图像的边缘对应在灰度值函数中是函数值突然变大的区域。函数值的变化趋势可以用函数的导数描述。当函数值突然变大时，导数也必然会变大，而函数值变化较为平缓区域，导数值也比较小，因此可以通过寻找导数值较大的区域去寻找函数中突然变化的区域，进而确定图像中的边缘位置。图5-27给出一张含有边缘的图像，图像每一行的像素灰度值变化可以用图中下方的曲线表示。

黑科技DeepFake检测方法：利用心跳做信号，还能「揪出」造假模型

伪造人像视频生成技术给社会带来了新的威胁，例如利用逼真的伪造图像和视频进行政治宣传、名人模仿、伪造证据以及其他与身份有关的操作。伴随着这些生成技术的发展，出现了一些被证实有效的 deepfake 检测方法，这些方法具备较高的分类准确率。然而，目前几乎没有任何工作关注 deepfake 视频的来源（即生成 deepfake 视频的模型）。

R包：gtable包用于处理ggplot2图像

ggplot2是基于grid的绘图工具，它绘制的图像其实是由多个grob（grid graph object）组成的，比如一张点图，它的标题是titleGrob，点图的基本单元包括pointsGrob。

荣登Nature，时隔15年NumPy论文终发表！

NumPy是一个强大、紧凑和表达力强的语法来访问、操作和计算向量、矩阵和高维数组的科学计算库。

集乐-统一多媒体文件资源管理器-开发记录

市面上常见的多媒体资源管理器并不少见，比如很有名的本地电子书管理工具-Calibre，图片管理工具-Eagle，以及音频爱好者喜爱的foobar2000。它们在各自的领域内都完美解决了诸多痛点，但人的需求是在不断变化的，互联网的环境也是在不断发生改变的。

Pixelmator Pro for Mac(媲美PS的修图软件)v3.1中文激活版

Pixelmator Pro是一种图像编辑器，旨在使每个人都可以使用最强大的专业图像编辑工具。拥有大量用于编辑和修饰照片，创建图形设计，绘画，绘制矢量图形以及添加令人惊叹的效果的工具，这是您唯一需要的图像编辑器。

机器视觉算法(第9期)----OpenCV中最最最重要的类型

今天我们主要学习一下OpenCV中最重要的数据类型--数组Mat，这个结构可以视为是OpenCV所有C++实现的核心，OpenCV中所有主要函数都或是Mat类的成员，或是将Mat类作为参数，或是返回一个Mat类型。很少有函数和这三者都没有关系的。

集乐-统一多媒体文件资源管理器-开发记录

基于geopandas的空间数据分析——空间计算篇(上)

在本系列之前的文章中我们主要讨论了geopandas及其相关库在数据可视化方面的应用，各个案例涉及的数据预处理过程也仅仅涉及到基础的矢量数据处理。

【他山之石】Pytorch学习笔记

“他山之石，可以攻玉”，站在巨人的肩膀才能看得更高，走得更远。在科研的道路上，更需借助东风才能更快前行。为此，我们特别搜集整理了一些实用的代码链接，数据集，软件，编程技巧等，开辟“他山之石”专栏，助你乘风破浪，一路奋勇向前，敬请关注。

（数据科学学习手札84）基于geopandas的空间数据分析——空间计算篇（上）

在本系列之前的文章中我们主要讨论了geopandas及其相关库在数据可视化方面的应用，各个案例涉及的数据预处理过程也仅仅涉及到基础的矢量数据处理。在实际的空间数据分析过程中，数据可视化只是对最终分析结果的发布与展示，在此之前，根据实际任务的不同，需要衔接很多较为进阶的空间操作，本文就将对geopandas中的部分空间计算进行介绍。

提高效率 |ArcGIS Pro 中所有快捷键一网打尽

这是 ArcGIS Pro 中可用的键盘快捷键的完整列表，并且在每个软件版本中都会更新。可以从 https://links.esri.com/arcgis-pro-shortcuts 下载 PDF 版本。

2.LifeGame生命游戏

这个东西以前在看知乎的时候就看到过，感觉挺好玩的。最近又看到了，细细看了一下原理，恍然大悟这不就是一个空域滤波么？写一个应该很好玩吧？于是就动手了，为了显示方便用的Opencv的Mat数据结构来存取数据和显示。写了一下午差不多就可以了，后面再加了些配置文件的接口，并给了一些配置文件，这里记录一下。

基于模板的文字识别结果结构化处理技术 | 公开课速记

随着行业的发展和技术的成熟，文字识别（OCR）目前已经应用到了多个行业中，比如物流行业快递包裹的分拣，金融行业的支票单据识别输入，交通领域中的车牌识别，以及日常生活中的卡证、票据识别等等。OCR（文字识别）技术是目前常用的一种AI能力。但一般OCR的识别结果是一种按行输出的半结构化输出。

Neuromation：一文告诉你如何用 CNN 检测儿童骨龄

一直以来，NeuroNuggets和Neuromation Research系列文章都致力于介绍其优秀团队的人工智能研究人员。

第4章-变换-4.1-基础变换

本节介绍最基本的变换，例如平移、旋转、缩放、剪切、变换级联、刚体变换、法线（normal）变换（不太normal）和逆计算。对于有经验的读者，它可以作为简单变换的参考手册，对于新手，它可以作为对该主题的介绍。这些材料是本章其余部分和本书其他章节的必要背景。我们从最简单的变换开始——平移。

011

任意半径中值滤波（扩展至百分比滤波器）O(1)时间复杂度算法的原理、实现及效果。

主要参考论文：Median Filter in Constant Time.pdf

深入Java Swing用户界面组件布局管理器：网格布局+面板+边界布局

在讨论每个Swing组件（例如文本域和单选按钮）之前，首先介绍一下如何把这些组件安排在一个框架内。与Visual Basic不同，JDK没有表单设计器，需要通过编写代码来定制（布局）用户界面组件所在的位置。

讲解Layout of the output array img is incompatible with cv::Mat (step[ndims-1] !

在使用OpenCV进行图像处理时，可能会遇到一个常见的错误消息："Layout of the output array img is incompatible with cv::Mat (step[ndims-1] !"。本文将详细解释这个错误的原因以及如何解决它。

学界 | 把酱油瓶放进菜篮子：UC Berkeley提出高度逼真的物体组合网络Compositional GAN

生成对抗网络（GAN）是在给定输入的条件下生成图像的一种强大方法。输入的格式可以是图像 [9，37，16，2，29，21]、文本短语 [33，24，23，11] 以及类标签布局 [19，20，1]。大多数 GAN 实例的目标是学习一种可以将源分布中的给定样例转换为输出分布中生成的样本的映射。这主要涉及到单个目标的转换（从苹果到橙子、从马到斑马或从标签到图像等），或改变输入图像的样式和纹理（从白天到夜晚等）。但是，这些直接的以输入为中心的转换无法直观体现这样一个事实：自然图像是 3D 视觉世界中交互的多个对象组成的 2D 投影。本文探索了组合在学习函数中所起到的作用，该函数将从边缘分布（如椅子和桌子）采集到的目标不同的图像样本映射到捕获其联合分布的组合样本（桌椅）中。

PyTorch 深度学习（GPT 重译）（二）

在上一章中，我们了解到张量是 PyTorch 中数据的构建块。神经网络将张量作为输入，并产生张量作为输出。事实上，神经网络内部的所有操作以及优化过程中的所有操作都是张量之间的操作，神经网络中的所有参数（例如权重和偏置）都是张量。对于成功使用 PyTorch 这样的工具，对张量执行操作并有效地对其进行索引的能力至关重要。现在您已经了解了张量的基础知识，随着您在本书中的学习过程中，您对张量的灵活性将会增长。

C＋实现神经网络之六—实战手写数字识别

用最简单的方式在C#中使用多线程加速耗时的图像处理算法的执行（多核机器）。

根据文章内容总结的摘要

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐