人的大脑和自监督学习模型的相似度有多高?
麦吉尔大学和魁北克人工智能研究所(Mila)的计算神经科学家布莱克-理查兹(Blake Richar....
OpenCV中支持的非分类与检测视觉模型
前面给大家分别汇总了OpenCV中支持的图像分类与对象检测模型,视觉视觉任务除了分类与检测还有很多其....
灰度共生矩阵(GLCM)基本原理
灰度共生矩阵(Gray Level CO-Occurrence Matrix-GLCM)是图像特征分....
二值图像分析最常见的方式
二值图像分析最常见的一个主要方式就是轮廓发现与轮廓分析,其中轮廓发现的目的是为轮廓分析做准备,经过轮....
基于一致性的半监督语义分割方法
语义分割是一项重要的像素级别分类任务。但是由于其非常依赖于数据的特性(data hungary), ....
低分辨率行为识别技术具有广泛的应用价值
安防监控是智慧城市的重要组成部分。然而,在城市监控场景下,行人目标往往距离摄像头远,所占像素小,这为....
谷歌宣布了一门新的编程语言Carbon
正如微软创建TypeScript来更新JavaScript那样,Carbon作为一种在C++基础上开....
图像修复面临两个关键问题
图像修复是指对图像缺失区域进行补全,是计算机视觉的基本任务之一。该方向有许多实际应用,例如物体移除、....
一个YOLO系列的算法实现库YOLOU
这里主要是对于YOLO系列经典化模型的训练对比,主要是对于YOLOv5、YOLOv6、YOLOv7以....
OpenCV4.x可实现加载模型与执行推断
OpenCV4.x发布以后,有很多新的特性与黑科技支持,无论是支持OpenVINO加速、图计算模块、....
一种使用Mask Transformer进行全景分割的端到端解决方案
在 CVPR 2022 上发表的「CMT-DeepLab: Clustering Mask Tran....
基于配准的少样本异常检测的框架
近年来,异常检测在工业缺陷检测、医疗诊断,自动驾驶等领域有着广泛的应用。“异常”通常定义为 “正常”....
如何扩大卷积来消除与Transformer的性能差距
首先,先让我 brainstorm 一下。当你看到 neural network scaling 这....
关于Next-ViT 的建模能力
由于复杂的注意力机制和模型设计,大多数现有的视觉 Transformer(ViT)在现实的工业部署场....
一个大规模多任务学习框架µ2Net
这种方法可以提高每个任务的质量,并在收敛时间、训练实例数量、能源消耗等方面提高模型效率。本文提出的机....
单个CNN就能够在多个数据集上实现SOTA
然而,由于卷积核的离散性,传统的 CNN 不能跨分辨率使用。当考虑具有相同 CNN 的不同维度数据时....
如何实现遥感图像等超大尺寸图像快速识别
目前比较成熟的卫星图像识别算法并不少,但大多依托于强大的计算资源,为了用有限的计算资源实现大尺寸图像....
英伟达宣布全新编程平台—QODA量子优化设备架构
与 CUDA 类似,QODA 是开放的、统一的环境,后者适用于当今一些最强大的计算机和量子处理器,可....
图像修复与处理经典论文回顾和精读
在实践中,仅仅通过优化隐向量z难以准确重建ImageNet这样的复杂真实图像。训练GAN的数据集(I....
单应性矩阵计算函数与应用
其中scene_corners为对象在场景图像中的四点坐标,获得坐标以后就可以绘制对应的矩形,从而在....
存在一种完美的编程语言吗?
Xous 开发的第一年都是使用’no-std’完成的,代价是占用大量内存空间且复杂性高。尽管可以编写....
OpenCV种支持标准卷积边缘填充做法
OpenCV在使用卷积进行图像处理过程种,如何处理边缘像素与锚定输出两个技术细节一直是很多人求而不得....
Imagen的工作原理解读
在这部分,作者展示了 Imagen 的整体架构,并对其它的工作原理做了高级解读;然后依次更透彻地剖析....
有关batch size的设置范围
我们知道,batch size 决定了深度学习训练过程中,完成每个 epoch 所需的时间和每次迭代....