名前の通りざっとGPTです(ざっとMoE-GPT) scratchでは使い物にならないな わけわからない文字しか出ないけど... あとattentionないからTransformarじゃないかも しかも学習してないからPre-lerningもちがう... Gは合ってるはず。Generation turbowarp(軽量) https://turbowarp.org/1333283517 (333!だ)
vocab @horiyouta さんのを少し改変 リストUI @PixelNest さん