I'm trying to recreate a transformers based on the paper "Attention is all you need!". With thorough explainations and tutorial from https://www.youtube.com/watch?v=ISNdQcPhsts&t=5529s . I have finished the code.
「Attention is All You Need!」の論文に基づいてトランスフォーマーモデルを再現しようとしており、YouTubeのチュートリアル(https://www.youtube.com/watch?v=ISNdQcPhsts&t=5529s)を参考にしています。コードが完成しました。