html边界像素调节_html调节高低_html调节背景大小 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

论文阅读: 2103.Boundary IoU

2103.16562：Boundary IoU: Improving Object-Centric Image Segmentation Evaluation

02

CNN卷积神经网络模型搭建

前段时间尝试使用深度学习来识别评测过程中的图片，以减少人力成本。目前是在深度学习框架Keras(后端使用TensorFlow)下搭建了一个CNN卷积神经网络模型，下面就如何搭建一个最简单的数字图像识别模型做下介绍。

02

您找到你想要的搜索结果了吗？

是的

没有找到

CVPR2021 分割之“Boundary IoU”，衡量物体边界分割质量的新度量

源码：https://github.com/bowenc0221/boundary-iou-api

03

消除图像复原中的“misalignment”，性能大幅提升

arXiv:https://arxiv.org/pdf/2112.04491.pdf

03

基于卷积神经网络的图像情感分析模型，Python实现

图片情感分析，重点是颜色特征的提取，将每一个像素点的颜色特征转换成一个值，最终效果是把一个图片转换成一个二维矩阵，矩阵中每一个值都代表该像素点的颜色特征。概括来说就是将每个像素点的RGB值转换为HSV，然后对HSV三个值进行加权求和，得出一个值来表示颜色特征，RGB值转换为HSV有标准公式，对HSV三个值进行加权求和时权值的选择参考自一篇对服装图像进行分类的论文。具体过程如下：

02

基于OpenCV的多位数检测器

现在数字无处不在，无论是闹钟、健身追踪器、条形码还是包装好了的送货包裹。利用MNIST数据集，机器学习可用来读取单个手写数字。现在，我们可以将其扩展为读取多个数字，如下所示。底层的神经网络同时进行数字定位和数字检测。这在很多实际环境中是非常有用的，例如读取商店中的标签，车牌，广告等。

01

图像处理-图像滤波

加性噪声一般指热噪声、散弹噪声等，它们与信号的关系是相加，不管有没有信号，噪声都存在。

02

SGM-Nets：第一个将SGM与深度学习结合的网络

本文将对2017年的CVPR会议文章《SGM-Nets: Semi-global matching with neural networks》进行简介，该论文作者为Akihito Seki（东芝公司）、Marc Pollefeys（苏黎世联邦工业大学以及微软公司）。研究针对SGM需要根据影像人工调整惩罚参数的问题，利用深度学习网络自动学习惩罚参数，最后利用Kitti标准数据集进行测试，获得了较好的匹配效果。

02

“先粗后精”的实例分割，BPR：使用Crop-then-Refine的性能提高方法

题目：Look Closer to Segment Better:Boundary Patch Refinement for Instance Segmentation

05

OpenCV 滤波与卷积之 —— 边界与阈值化

滤波器指的是一种由一幅图像(x,y)根据像素点x,y附近的区域计算得到一幅新图像’(x,y)的算法。其中，模板规定了滤波器的形状以及这个区域内像素的值的组成规律，也称“滤波器”或者核。本章中出现的滤波器多数为线性核，也就是说I"(x,y)的像素的值由(x,y)及其周围的像素的值加权相加得来。这个过程可以用下面的方程表示：

01

基于FPGA的均值滤波（一）

均值滤波的数学表达式列出：由上述公式列出求图像均值的步骤：（1）获取当前窗口所有像素。（2）计算当前窗口所有像素之和。（3）将（2）结果除以当前窗口数据总数。（4）滑动窗口到下一个窗口，直到

07

自制人脸数据，利用keras库训练人脸识别模型

机器学习最本质的地方就是基于海量数据统计的学习，说白了，机器学习其实就是在模拟人类儿童的学习行为。举一个简单的例子，成年人并没有主动教孩子学习语言，但随着孩子慢慢长大，自然而然就学会了说话。那么孩子们是怎么学会的呢？很简单，在人类出生之前，有了听觉开始，就开始不断听到各种声音。人类的大脑会自动组织、分类这些不同的声音，形成自己的认识。随着时间的推移，大脑接收到的声音数据越来越多。最终，大脑利用一种我们目前尚未知晓的机制建立了一个成熟、可靠的声音分类模型，于是孩子们学会了说话。机器学习也是如此，要想识别出这张人脸属于谁，我们同样需要大量的本人和其他人的人脸数据，然后将这些数据输入Tensorflow这样的深度学习（深度学习指的是深度神经网络学习，乃机器学习分支之一）框架，利用深度学习框架建立属于我们自己的人脸分类模型。只要数据量足够，分类准确率就能提高到足以满足我们需求的级别。

03

图像的卷积(滤波)运算(二)——高斯滤波

在图像处理中，选定X方向上长度为3的窗口，令δ=1，中心坐标为1，由上述公式，其卷积核(Xa,X,Xb)可以如下计算：

02

北航、旷视联合，打造最强实时语义分割网络

下面要介绍的论文由北航、旷视、鹏城实验室发于2019年12月，题为「Real-Time Semantic Segmentation via Multiply Spatial Fusion Network」。

01

图像分割【论文解读】快速图像分割的SuperBPD方法 CVPR-2020

提出的super-BPD 与之前方法MCG相比，精度相当或者更优，而却可以达到 25fps，MCG仅 0.07fps。速度更快且有更好的迁移性，可应用于未见的场景。

02

《Unet》论文阅读与

上篇对FCN的论文解读提到，FCN的训练依赖大量数据，并且仍存在分割结果不精细的弱点。今天要说的Unet就是受到FCN启发针对医学图像做语义分割，且可以利用少量的数据学习到一个对边缘提取十分鲁棒的模型，在生物医学图像分割领域有很大作用。据我了解，Unet是现在很多公司的魔改对话，在移动/嵌入式端的，也已经有把Unet做到了实时的例子。

01

1024x1024 分辨率，效果惊人！InsetGAN：全身图像生成 (CVPR 2022)

该论文是出自于CVPR2022关于GAN的最新文章。要知道虽然目前GAN可以在某些领域的理想条件下能够生成逼真的图像，但由于发型、服装和姿势的多样性，生成全身人体图像仍然很困难，之前的方法一般是用单个GAN对这个复杂域进行建模。

04

明月深度学习实践010：ISBI 2015细胞追踪挑战赛和龋齿检测挑战赛的冠军架构U-Net

左侧可以理解为编码器，右侧可以理解为解码器。编码器又分为4个子模块，每个子模块包含2个卷积层和1个max pool下采样层，编码器同样分为4个子模块，每个子模块也是2个卷积层和1个上采样层。下采样的时候，分辨率减半，上采样的时候分辨率乘以2，但是这并不代表该网络输入和输出的分辨率是一样的，因为每次经过卷积层分辨率都在减少。另外，该网络还使用了跳层连接，处于同一水平上的模块连接在一起，类似RenNet的残差模块。从这点上看，它应该是比较适用于去噪去水印之类的任务的。

02

【文本检测与识别-白皮书-3.1】第二节：基于分割的场景文本检测方法

像素级别的文本检测方法通常借鉴物体语义分割和实例分割的思想，利用全卷积神经网络(fully convolution network，FCN)(Long 等人，2015)对图像中的每个像素点进行文本和非文本分类，从而得到文本区域掩码图(Mask)。然后通过一些像素聚合的后处理方式将属于同一文本的文本像素点聚合在一起得到最后的文本实例边界框。

01

『论文阅读』U-Net Convolutional Networks for Biomedical Image Segmentation

普遍认为，深度网络的成功培训需要数千个带注释的训练样本。在本文中，提出了一种网络和培训策略，依靠强大的数据增强功能（data augmentation）更有效地使用可用的注释示例。该体系结构包括捕捉上下文的收缩路径（contracting path）和实现精确定位的对称扩展路径（symmetric expanding path）。表明，这种网络可以从非常少的图像端对端地进行训练，并且在ISBI对电子微观堆栈中的神经结构进行分割的挑战方面优于先前的最佳方法（滑动窗口卷积网络）。使用透射光显微镜图像（相差和DIC）训练的相同网络，我们在这些类别中赢得了ISBI 2015细胞跟踪挑战赛并有大幅度提升。而且，网络速度很快。在最近的GPU上，512x512图像的分割需要不到一秒的时间。Caffe实现和模型见http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net。

02

OpenCV: 分水岭算法的图像分割及Grabcut算法交互式前景提取

任何灰度图像都可以看作是一个地形表面，其中高强度的像素表示山峰，低强度表示山谷。可以用不同颜色的水(标签)填充每个孤立的山谷(局部最小值)。随着水位的上升，根据附近的山峰(坡度)，来自不同山谷的水明显会开始合并，颜色也不同。为了避免这种情况，要在水融合的地方建造屏障。继续填满水，建造障碍，直到所有的山峰都在水下。然后创建的屏障将返回分割结果。这就是Watershed（分水岭算法）背后的“思想”。

02

GNN入门必看！Google Research教你如何从毛坯开始搭建sota 图神经网络

近几年，神经网络在自然语言、图像、语音等数据上都取得了显著的突破，将模型性能带到了一个前所未有的高度，但如何在图数据上训练仍然是一个可研究的点。

02

【数字图像】数字图像平滑处理的奇妙之旅

数字图像处理是一门涉及获取、处理、分析和解释数字图像的科学与工程领域。这一领域的发展源于数字计算机技术的进步，使得对图像进行复杂的数学和计算处理变得可能。以下是数字图像处理技术的主要特征和关键概念：

01

图像特征点|Harris特征点

小白在之前的为小伙伴在前面的推送中带来了moravec算子，忘记了的小伙伴可以回过去看一下《图像特征点|moravec特征点》，但是moravec算子也具有很多不足之处。接下来小白将介绍Harris角点中针对其不足之处进行的改进地方。

02

U-Net: Convolutional Networks for Biomedical Image Segmentation

人们普遍认为，深度网络的成功训练需要数千个带注释的训练样本。在本文中，我们提出了一种网络和训练策略，它依赖于数据扩充的强大使用，以更有效地使用可用的带注释的样本。该体系结构由捕获上下文的收缩路径和支持精确定位的对称扩展路径组成。我们证明这样的网络可以从非常少的图像端到端的训练，并且在ISBI挑战中在电子显微镜栈中神经结构的分割上胜过先前的最佳方法(滑动窗口卷积网络)。我们使用相同的网络训练透射光学显微镜图像(相位对比和DIC)，在2015年ISBI细胞跟踪挑战赛中，我们在这些类别中获得了巨大的优势。此外，网络速度很快。在最近的GPU上，512x512图像的分割需要不到一秒的时间。

03

北大联合UCLA发表论文：9头以上Transformer就能模拟CNN！

Visual Transformer（ViT）在计算机视觉界可以说是风头无两，完全不使用卷积神经网络（CNN）而只使用自注意力机制的情况下，还可以在各个CV任务上达到sota。

01

NDK OpenGL ES 3.0 开发（十八）：相机 LUT 滤镜

什么是 LUT ？ LUT 是 Look Up Table 的简称，称作颜色查找表，是一种针对色彩空间的管理和转换技术。

03

OpenGL ES 相机 LUT 滤镜

什么是 LUT ？ LUT 是 Look Up Table 的简称，称作颜色查找表，是一种针对色彩空间的管理和转换技术。

01

北大联合UCLA发表论文：9头以上Transformer就能模拟CNN！

---- 新智元报道编辑：LRS 【新智元导读】在Transformer当道的今天，CNN的光芒逐渐被掩盖，但Transformer能否完全取代CNN还是一个未知数。最近北大联合UCLA发表论文，他们发现Transformer可以在一定限制条件下模拟CNN，并且提出一个两阶段训练框架，性能提升了9%。 Visual Transformer（ViT）在计算机视觉界可以说是风头无两，完全不使用卷积神经网络（CNN）而只使用自注意力机制的情况下，还可以在各个CV任务上达到sota。研究结果也表明，

02

Computer Graphics note(3):视图变换 & 光栅化

M变换：https://blog.csdn.net/Enterprise_/article/details/106880754 VP变换：https://blog.csdn.net/Enterprise_/article/details/106934622

02

细粒度图像分割 (FGIS)

如今，照片逼真的编辑需要仔细处理自然场景中经常出现的颜色混合，这些颜色混合通常通过场景或对象颜色的软选择来建模。因此，为了实现高质量的图像编辑和背景合成，精确表示图像区域之间的这些软过渡至关重要。工业中用于生成此类表示的大多数现有技术严重依赖于熟练视觉艺术家的某种用户交互。因此，创建如此准确的显著性选择成为一项昂贵且繁琐的任务. 为了填补熟练视觉艺术家的空白，我们利用计算机视觉来模拟人类视觉系统，该系统具有有效的注意力机制，可以从视觉场景中确定最显着的信息。这类问题也可以解释为前景提取问题，其中显着对象被视为前景类，其余场景为背景类。计算机视觉和深度学习旨在通过一些选择性研究分支对这种机制进行建模，即图像抠图、显著目标检测、注视检测和软分割。值得注意的是，与计算机视觉不同，深度学习主要是一种数据密集型研究方法。

04

讲解python图像边缘检测

图像边缘检测是计算机视觉和图像处理中的重要任务，它用于检测图像中物体和区域之间的边缘和轮廓。在Python中，有多种方法可以进行图像边缘检测，本文将介绍一种常用的方法：Canny边缘检测算法。

01

图像处理——Canny算子

（1）爱鱼 https://www.cnblogs.com/mightycode/p/6394810.html

03

使用Numpy和Opencv完成图像的基本数据分析

对于深度学习而言，很多任务都是与数字图形处理打交道。这类任务的数据集一般是由很多张图像构成，有时候，当原始图像不能直接送入模型中时，需要对其进行一定的预处理操作，这时候就不得不向大家介绍一个十分有用的软件包OpenCV，用它处理图像起来非常方便，OpenCV是一个基于BSD许可发行的跨平台计算机视觉库，它轻量且高效，是由一系列C函数和少量C++类构成，支持Python、MATLAB等语言接口，内部包含了很多图像处理的相关算法。下面将向大家介绍如何使用NumPy和OpenCV对数字图像进行简单的处理方法：

02

JSTA：将空间转录组原始数据转换成单细胞水平空间表达谱的专用工具

基于RNA杂交的空间转录组方法提供了极高的RNA检测准确率。然而其需要使用图像分割算法将图像分割成细胞，将RNA检测转换为空间单细胞数据。把mRNA分配给细胞仍然是一个具有挑战性的问题，会大大影响组合FISH方法的整体准确性。

01

苏黎世华人博士提出模型SwinIR，只用33%的参数量就碾压图像修复领域sota

图像修复（image restoration）是一个受到长期关注和研究的最基础的CV问题，它能够从低质量的图像，例如缩略图、有噪音的图或是压缩图像中恢复为原始高质量图像。

01

85. 三维重建20-立体匹配16，端到端立体匹配深度学习网络之视差计算

在我的上一篇文章84. 三维重建19-立体匹配15，端到端立体匹配深度学习网络之代价体的计算和正则化中，我们学习到了端到端立体匹配网络的代价体计算及正则化的过程，我看到了3D和4D两类代价立方体、以及混合使用两者的方案。正如下图所示，

02

OpenCV 角点检测(三) Shi-Tomasi

就像Harrise算子是在Moravec算子的基础上改进得到的一样： http://blog.csdn.net/chaipp0607/article/details/54692818 Shi-Tomasi算子是在Harrise算子的基础上改进的，改进之处在于他们使用了不同的响应函数。

03

Computer Graphics note(3):视口变换&光栅化

Games101 Lecture5-6-7 在M(模型)V(视图)P(投影)变换之后，得到[−1,1]3[-1,1]^3[−1,1]3，接下来就是将其映射到屏幕空间上去。 M变换：https://blog.csdn.net/Enterprise_/article/details/106880754 VP变换：https://blog.csdn.net/Enterprise_/article/details/106934622

02

4分钟45亿年！澳洲小哥用GPU模拟地球，3D裸眼震撼

一位小哥编写程序在GPU上实现了高精度的地球模拟，4分钟内演示了45亿年的历史，足以让人震撼！

03

JSTA：将空间转录组原始数据转换成单细胞水平空间表达谱的专用工具

基于RNA杂交的空间转录组方法提供了极高的RNA检测准确率。然而其需要使用图像分割算法将图像分割成细胞，将RNA检测转换为空间单细胞数据。把mRNA分配给细胞仍然是一个具有挑战性的问题，会大大影响组合FISH方法的整体准确性。

03

综述：图像滤波常用算法实现及原理解析

来源丨https://zhuanlan.zhihu.com/p/279602383

02

[深度学习]Charpter 9:卷积网络

卷积网络convolutional network,也叫做卷积神经网络convolutional neural network CNN 专门用来处理类似网格结构数据的神经网络. 比如

01

OpenGL 图形渲染流程入门

1、什么是 shader shader 中文名为着色器，全称为着色器程序，是专门用来渲染图形的一种技术。通过 shader，我们可以自定义显卡渲染画面的算法，使画面达到我们想要的效果。小到每一个像素点，大到整个屏幕。通常来说，程序是运行在 CPU 中的，但是着色器程序比较特殊，它是运行在 GPU 中的，所以当我们在编写 shader 程序的时候，实际上也是在编写 GPU 程序。在 OpenGL 中，对应的着色器语言是 GLSL（OpenGL Shading Language）。通过 shader 编程，我们

01

个人博客主题模板给鼠标添加跟随特效教程

昨天写了一个网页鼠标特效的小玩具，当然代码不是我的，源自知更鸟，插件也很简单，但是考虑到不是所有人都喜欢用插件，包括我自己，所以今天抽空在写一个详细的教程，直接把代码写在主题里就不需要额外的开启插件了，代码都是一样的，只是稍微修改了一些，感谢作者，好了不废话了，教程如下。

04

个人博客主题模板给鼠标添加跟随特效教程

昨天写了一个网页鼠标特效的小玩具，当然代码不是我的，源自知更鸟，插件也很简单，但是考虑到不是所有人都喜欢用插件，包括我自己，所以今天抽空在写一个详细的教程，直接把代码写在主题里就不需要额外的开启插件了，代码都是一样的，只是稍微修改了一些，感谢作者，好了不废话了，教程如下。

05

图像滤波常用算法实现及原理解析

图像滤波是一种非常重要的图像处理技术，本文详细介绍了四种常见的图像滤波算法，并附上源码，包括自适应中值滤波、高斯滤波、双边滤波和导向滤波。

01

基于图割算法的木材表面缺陷图像分割

木材表面缺陷不利于木材的加工利用，降低木制品的品质，影响生产企业的经济效益，因此木材表面缺陷的图像检测技术越来越受重视。而采用图像处理方法进行木材表面缺陷检测，是实现木材表面缺陷自动检测、提高企业生产效率的必由之路。

05

论文复现之医学图像应用：视网膜血管分割

今日研究为继续上次论文中的一个内容：U-Net网络，于是找了一篇经典论文，并学习论文及代码解读。在学习U-Net网络后，使用U-Net神经网络提取视网膜纹理血管。

01

几种常见计算机图像处理操作的原理及canvas实现

即使没有计算机图形学基础知识的读者也完全不用担心您是否适合阅读此文，本文的性质属于科普文章，将为您揭开诸如Photoshop、Fireworks、GIMP等软件的图像处理操作的神秘面纱。之前您也许对这些处理技术感到惊奇和迷惑，但笔者相信您读完本文后会豁然开朗。本文主要介绍几种常见计算机图像处理操作的原理，为了操作简便和保证平台兼容性，采用HTML5的canvas作为代码实现样例，当然您也可以使用Qt、VisualStudio系列、Java等进行实现且可以利用多线程和GPU编程技术提高大像素文件的处理效率。本文的原理部分适合所有层面的读者，代码实现部分需要读者对小学数学的加减乘除运算有一定了解（其实写一些基础性代码不就是小学数学这种层次的事吗？非专业读者完全不用怕！笔者就是在作为计算机白痴的小学生时期就开始写程序的）。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭