transformer

包含标签：transformer 的文章

研发管理

在自定义数据集上微调Alpaca和LLaMA

本文将介绍使用LoRa在本地机器上微调Alpaca和LLaMA，我们将介绍在特定数据集上对Alpaca LoRa进行微调的整个过程，本文将涵盖数据处理、模型训练和使用流行的……

admin 2023-07-26

0
5G

深度学习一点通：PyTorch Transformer 预测股票价格，虚拟数据，chatGPT同源模型

预测股票价格是一项具有挑战性的任务，已引起研究人员和从业者的广泛关注。随着深度学习技术的出现，已经提出了许多模型来解决这个问题。其中一个模型是 Tran……

admin 2023-06-06

0
架构

ChatGPT背后的技术原理：领略Transformer架构的魅力

😲惊艳了时代的ChatGPT，背后到底有怎样的技术支持？本文将深入剖析ChatGPT背后的技术原理，从Transformer架构、自注意力机制到位置编码等方面，带领读者一探……

admin 2023-05-16

0
" alt="简单理解Transformer注意力机制">

物联网

简单理解Transformer注意力机制

这篇文章是对《动手深度学习》注意力机制部分的简单理解。生物学中的注意力生物学上的注意力有两种，一种是无意识的，零一种是有意识的。如下图1，由于红色……

admin 2023-05-06

0
5G

图解NLP模型发展：从RNN到Transformer

图解NLP模型发展：从RNN到Transformer 自然语言处理 (NLP) 是深度学习中一个颇具挑战的问题，与图像识别和计算机视觉问题不同，自然语言本身没有良好的向量……

admin 2023-04-11

0
人工智能

从Transformer到ViT：多模态编码器算法原理解析与实现

从Transformer到ViT：多模态编码器算法原理解析与实现模型架构与算法原理 Image Token Embedding Multi-head Self-attention流程线性变换 MatMul Sca……

admin 2023-03-18

0
人工智能

Transformer&BERT阅读笔记

两篇整理的特别好的笔记： Transformer：https://mp.weixin.qq.com/s?__biz=MzI0MTk1NjAxMQ==&mid=2247486498&idx=1&sn=6e546e5ee16393ff3efd027……

admin 2023-03-12

0
人工智能

AIGC、ChatGPT、GPT系列？我的认识

AIGC（AI generated content），新型内容生产方式。AIGC是利用人工智能技术来生成内容，也就是，它可以用输入数据生成相同或不同类型的内容，比如输入文字、……

admin 2023-02-26

0
人工智能

基于transformer和相关预训练模型的任务调优

使用的环境依赖: python3.9 ''' 对应的依赖： tensorflow==2.11.0 transformers==4.26.0 pandas==1.3.5 scikit-learn==1.0.2 ''' 模型的训练代码如下： from……

admin 2023-02-08

0
人工智能

变形金刚——Transformer入门刨析详解

Transformer是什么呢？ qquad Transformer最早起源于论文Attention is all your need，是谷歌云TPU推荐的参考模型。 qquad 目前，……

admin 2023-02-07

0