ℹ️Cursorコーディングエージェントにまるごと生成させたプロジェクトです。僕は一切コードを組んだりしていません。 実行して触ることができるUIはありません。プロジェクトを完全にAIに生成させるという試験的な取り組みであるためです。 MNISTでトレーニングされた数字認識CNNです。旗を押された時に予測が実行されます。現在入力として与えられているのは実際にMNIST内に存在する「9」のデータの1つです。 〈モデル情報〉 ・種類:CNN(畳み込みニューラルネットワーク) ・総パラメーター数:26138(26K) ・精度:97.66% 〈モデルアーキテクチャ概要〉 入力 (1×28×28) ↓ Conv1 + ReLU (4×28×28) ↓ MaxPool1 (4×14×14) ↓ Conv2 + ReLU (8×14×14) ↓ MaxPool2 (8×7×7) ↓ Flatten (392) ↓ FC1 + ReLU (64) ↓ FC2 (10) ↓ 予測結果 (0-9) 〈モデルアーキテクチャ詳細〉 ・入力層 28x28ピクセル 1チャンネル ・第1畳み込み層(Conv1) ・タイプ:Conv2d ・入力:28x28 1チャンネル ・出力:28x28 4チャンネル ・カーネルサイズ:3x3 ・パディング:1 ・第1ReLU活性化層 ・タイプ:ReLU ・第1最大プーリング層(Pool1) ・タイプ:MaxPool2d ・入力:28x28 4チャンネル ・出力:14x14 4チャンネル ・カーネルサイズ:2x2 ・ストライド:2 ・第2畳み込み層(Conv2) ・タイプ:Conv2d ・入力:14x14 4チャンネル ・出力:14x14 8チャンネル ・カーネルサイズ:3x3 ・パディング:1 ・第2ReLU活性化層 ・タイプ:ReLU ・第2最大プーリング層(Pool2) ・タイプ:MaxPool2d ・入力:14x14 8チャンネル ・出力:7x7 8チャンネル ・カーネルサイズ:2x2 ・ストライド:2 ・フラット化層 3次元テンソルを1次元ベクトルに変換 ・第1全結合層(FC1) ・タイプ:Linear (Dense) ・入力:392要素 ・出力:64要素 ・第3ReLU活性化層 ・タイプ:ReLU ・第2全結合層(FC2) - 出力層 ・入力:64要素 ・出力:10要素