分类: 人工智能 | 飞云之下🌻

首页

C/C++

Linux

环境工具

生活随笔

人工智能

默认分类

人工智能未读

各种卷积计算过程图示

卷积各种算法图示 [1] Vincent Dumoulin, Francesco Visin - A guide to convolution arithmetic for deep learning (BibTeX) 📃 Convolution animations N.B.: Blue map

CNN 博客 2024-07-19

人工智能未读

自注意力机制中的MHA/MQA/GQA

1、MHA MHA (Multi-Head Attention): MHA 是 "Multi-Head Attention" 的缩写。它是一种注意力机制，通常用于处理序列数据，如自然语言文本。在 MHA 中，输入序列被分成多个头（head），每个头都可以关注输入序列的不同部分。这些头并行运算，然后结

大模型 2024-06-11

人工智能未读

PyTorch乘法

笔记：torch 乘法总结一、乘号(*) 和 torch.mul() element-wise 即对应元素相乘例子： echo "H HJ JKL!" pwd >>> a = torch.randn(2,3) >>> b = torch.randn(2,1) >>> res = a * b

torch 2024-06-07