transformer

包含标签：transformer 的文章

" alt="全网首发，Swin Transformer+FaceNet实现人脸识别">

人工智能

全网首发，Swin Transformer+FaceNet实现人脸识别

目录一、简介二、Swin Transformer作为Backbone 1.Swin Transformer整体结构 2.PatchEmbed = Patch Partition + Linear Embedding 3.Swin Transfo……

admin 2022-05-05

0
人工智能

PyTorch基础（四）卷积神经网络

为什么要使用卷积神经网络？对于计算机视觉来说，每一个图像是由一个个像素点构成，每个像素点有三个通道，分别代表RGB三种颜色(不计算透明度)，我们以手写……

admin 2022-04-08

0
人工智能

神经网络之BERT深度剖析

关于BERT 作者：白鹿（花名）声明：以下介绍均以bert_base为基础进行介绍；网络结构从上面的架构图中可以看到, 宏观上BERT分三个主要模块. 最底层黄……

admin 2022-02-24

0
人工智能

ConViT

""" ConViT Model @article{d2021convit, title={ConViT: Improving Vision Transformers with Soft Convolutional Inductive Biases}, author={d'Ascol……

admin 2022-02-22

0
人工智能

【第29篇】MPViT：用于密集预测的多路径视觉转换器

MPViT：用于密集预测的多路径视觉转换器密集的计算机视觉任务（例如对象检测和分割）需要有效的多尺度特征表示来检测或分类具有不同大小的对象或区域。虽……

admin 2022-02-06

0
人工智能

ConvNeXt：超越 Transformer？总结涨点技巧与理解代码(附注释)

文章目录 1. 前言 2. 论文学习 2.1. 发展路线 2.2. 训练策略改进 2.3. 宏观设计 2.3.1. stage compute ratio 2.3.2. stem to “Patchify” 2.4. ResN……

admin 2022-01-15

0
人工智能

论文笔记——Intra- and Inter-Action Understanding via Temporal Action Parsing

目录论文主要工作：创新点：设计思路：数据集特点：论文方法：实验结果分析：论文可优化的地方：原文链接：跳转论文主要工作：进行动作分析——……

admin 2022-01-13

0
人工智能

神经网络学习小记录66——Vision Transformer（VIT）模型的复现详解

神经网络学习小记录66——Vision Transformer（VIT）模型的复现详解学习前言什么是Vision Transformer（VIT）代码下载 Vision Transforme的实现思路一……

admin 2022-01-04

0
人工智能

Masked Autoencoders Are Scalable Vision Learners 论文研读

NLP CV Transformer ViT BERT MAE 文章目录 1. 标题 2. 摘要 3. 模型架构 4. 结论 1. 标题 Masked Autoencoders Are Scalable Vision L……

admin 2021-12-12

0
人工智能

图像恢复 SWinIR : 彻底理解论文和源代码 (注释详尽）

文章目录 SwinIR 论文 SWinIR 网络结构整体框架浅层特征提取深层特征提取图像重建模块主要代码理解 SwinIR MLP Patch Embedding Window Atten……

admin 2021-11-12

0