摘要: numpy、tensorflow手写SkipGram(没有negative sampling)和cbow: http://www.claudiobellei.com/2018/01/07/backprop-word2vec-python/ 这两种实现都需要动手算梯度,手动实现梯度下降,且不没有使用n 阅读全文
posted @ 2020-07-10 18:01 morein2008 阅读(340) 评论(0) 推荐(0) 编辑
摘要: https://blog.floydhub.com/the-transformer-in-pytorch/ 哈佛版本:http://nlp.seas.harvard.edu/2018/04/03/attention.html https://pytorch.org/docs/1.3.0/_modul 阅读全文
posted @ 2020-07-10 17:08 morein2008 阅读(1442) 评论(0) 推荐(0) 编辑