ai-thinking

自作フレームワークで1200万パラメータLLMを訓練

Aadi Kulshrestha@MankyDankyBanky2026年4月18日

♥ 2,614↻ 211👁 480,000

RustバックエンドとFlash Attention・AdamW等のCUDAカーネルを用いた自作MLフレームワークで、1200万パラメータのLLMを訓練した。 Transformerアーキテクチャ全体とBPEトークナイザをスクラッチで実装。フレームワークの特徴: - カスタムCUDAカーネル（Flash Attention、fused… https://t.co/YtfBH6YLan

原文を表示 / Show original

I trained a 12M parameter LLM on my own ML framework using a Rust backend and CUDA kernels for flash attention, AdamW, and more. Wrote the full transformer architecture, and BPE tokenizer from scratch. The framework features: - Custom CUDA kernels (Flash Attention, fused https://t.co/YtfBH6YLan

X でシェア LINE でシェア X で元記事を開く

AIFCC — AI Fluent CxO Club

読み書きそろばん、AI。経営者が AI を自分で動かせるようになるコミュニティ。

他の記事を見る AIFCC について

自作フレームワークで1200万パラメータLLMを訓練 | AIFCC