16k 29 分钟

本篇记录了笔者学习LLVM IR和LLVM C++ API的学习笔记,目的是帮助对LLVM不熟悉但是需要入门LLVM及其API的同学快速入门。本篇内容涵盖了LLVM IR基础知识、LLVM C++ API开发环境配置、LLVM C++ API对指令/基本块/函数的操作。
2.2k 4 分钟

Transformer模型于2017年由Google的一个团队推出,正在逐步取代LSTM、GRU等RNN模型,成为在NLP问题上的首选模型。他被广泛应用于机器翻译、聊天机器人等领域,大名鼎鼎的BERT、ChatGPT等都采用了Transformer模型。本文是笔者学习Transformer模型的学习笔记,希望可以简单清晰的介绍Transformer的网络架构和其中涉及到的各项技术。
3.1k 6 分钟

卷积神经网络(Convolutional Neural Network)是一种专为图像处理设计的神经网络结构。相比于全连接神经网络结构,卷积神经网络在面对图像相关任务时有突出的表现,这是因为这种特殊的网络结构的设计思路与图像本身的特征紧密相关,也正因为如此,如果想将CNN应用于其他模态任务中,应根据具体模态的特征对网络进行修改。「著名的AlphaGo就是基于CNN结构来进行学习的」
1.3k 2 分钟

花了半天时间帮学姐调了一下原本项目代码无法在RTX 4080显卡上使用的bug,本质上是tensorflow2版本的问题,查了下之后发现这个问题其实还是很普遍的,所以记录一下。
2k 4 分钟

IRIG-B 协议广泛应用于电力公司、工业和其他行业,以确保断路器、继电器和电表等电力系统设备的精确时间同步。该协议具有携带信息量大、高分辨率、适于远距离传输等特点,在光纤授时中广泛应用。
2.7k 5 分钟

在光纤授时技术中无可避免的会涉及到光纤通信及相关技术,为了对光纤授时的具体细节有进一步的理解,本篇记录一下光纤通信的原理和波分复用技术。
1.9k 4 分钟

正则化主要用于避免过拟合的产生和减少网络误差,其本质就是选择更加平滑的Loss函数曲线(限制模型复杂度),使得异常数据对于模型影响较小。注意:我们追求“较”平滑的曲线,而非绝对平滑的曲线。