AIFCC
記事一覧へ
ai-thinking

自作フレームワークで1200万パラメータLLMを訓練

2,614211👁 480,000
RustバックエンドとFlash Attention・AdamW等のCUDAカーネルを用いた自作MLフレームワークで、1200万パラメータのLLMを訓練した。 Transformerアーキテクチャ全体とBPEトークナイザをスクラッチで実装。 フレームワークの特徴: - カスタムCUDAカーネル(Flash Attention、fused… https://t.co/YtfBH6YLan
原文を表示 / Show original
I trained a 12M parameter LLM on my own ML framework using a Rust backend and CUDA kernels for flash attention, AdamW, and more. Wrote the full transformer architecture, and BPE tokenizer from scratch. The framework features: - Custom CUDA kernels (Flash Attention, fused https://t.co/YtfBH6YLan

AIFCC — AI Fluent CxO Club

読み書きそろばん、AI。経営者が AI を自分で動かせるようになるコミュニティ。

自作フレームワークで1200万パラメータLLMを訓練 | AIFCC