思建的NLP之旅

2020-10-31-注意力机制总结

发表于 2020-10-31 更新于 2021-09-02 阅读次数： Valine： 10k 9 分钟

注意力机制模型的总结

发表于 2020-08-16 更新于 2020-09-08 分类于服务器阅读次数： Valine： 12k 11 分钟

实验室服务器故障处理

发表于 2020-07-28 更新于 2020-11-13 分类于 transformer 阅读次数： Valine： 42k 38 分钟

transformer-pytorch

发表于 2020-07-25 更新于 2020-12-22 分类于服务器阅读次数： Valine： 6.5k 6 分钟

连接服务器时的总结体会

发表于 2020-09-05 更新于 2020-12-17 阅读次数： Valine： 17k 15 分钟

记录杂乱的知识点，持续更新

发表于 2021-03-15 分类于算法阅读次数： Valine： 2.2k 2 分钟

通过leetcode刷题，记录对递归的理解

发表于 2020-11-24 更新于 2020-12-01 阅读次数： Valine： 1.7k 2 分钟

transformer模型改进优化总结

发表于 2020-11-20 更新于 2020-11-26 分类于论文分享阅读次数： Valine： 6.5k 6 分钟

记录值得分享的论文; 《ConvBERT》: 对BERT中attention结构的改进

发表于 2020-11-19 更新于 2020-12-08 分类于论文分享阅读次数： Valine： 1.6k 1 分钟

记录值得分享的论文; 《Lambda network》: 提出了 lambda layer，通过将上下文转化为线性函数（lambda）来捕获关联性，以此避免attention maps，这样可以应用到长序列或者高分辨率的图象上。

发表于 2020-11-16 更新于 2020-11-19 阅读次数： Valine： 11k 10 分钟

在NLP领域越来越依赖预训练模型，那么如何高效使用已经预训练好的模型到自己的模型中呢？本文参考其它博客，做个总结