ら行
公開日:
更新日:

LoRA(低ランク適応)

LoRA(低ランク適応)

「LoRA(Low-Rank Adaptation:低ランク適応)」とは、大規模言語モデル(LLM)などのニューラルネットワークをファインチューニングする際、元の巨大なモデルパラメータ(重み)を完全に固定(フリーズ)したまま、追加した「低ランクの小さな行列(アダプター)」のみを学習対象に設定することで、学習に必要なGPUメモリ量、計算時間、およびストレージ容量を劇的に削減する、パラメータ効率の良い微調整(PEFT)手法です。

数億〜数十億パラメータを持つ大規模モデルを、一般的なコンシューマー向けのグラフィックボード(NVIDIAのGeForceシリーズ等)や少数のGPUだけで安価に追加学習させることができるため、オープンソースAIコミュニティの発展を支える絶対的な基盤技術となっています。

この記事の3大要点(30秒でわかる要約)
  • GPUメモリ消費の大幅削減: モデル全体のすべてのウェイトを学習させる(フルファインチューニング)場合に比べ、数分の一から数十分の一のVRAM容量で学習が実行可能。
  • 超軽量なファイル容量: 学習後の成果物(LoRAアダプター)のサイズが、元モデル(数十GB)に対して「数MB〜数百MB程度」と極めて小さいため、保存や配布、システムへのデプロイが容易。
  • 動的な「脳の差し替え」: 土台となる巨大なベースモデルをサーバーのメモリ上に1つ配置しておけば、ユーザーの要求に応じて、異なるLoRAアダプター(例:『翻訳用LoRA』『法律相談用LoRA』等)を瞬時にロードして動的に知能を切り替えることができる。

LoRAの数理的背景と「低ランク(Low-Rank)」の仕組み

大規模モデルのパラメータは、数万次元の「巨大な行列(Weight Matrix)」で構成されています。しかし、特定のタスク(例:『翻訳』)に適応させる際、すべての次元のウェイトが変わるわけではなく、実際に重要なパラメータ変化はごく一部の低い次元の空間(固有次元)に収まるという仮説(低ランク性)に基づいています。LoRAは、パラメータ変化量(ΔW)を、次元を極限まで絞り込んだ2つの小さな行列(AとB)の掛け算「A × B」に分解して近似計算します。これにより、更新するパラメータ数が元モデルの「0.01%〜0.1%」程度で済み、驚異的な軽量化と計算の高速化を実現しています。

「LoRA」の具体的な会話例・使い方

新しく自社専用LLMを立ち上げたいAIスタートアップの開発現場

エンジニアA:「Llama 3 70Bをベースにしてフルファインチューニングをやりたいけれど、見積もりを取ったらA100 GPUが8枚必要で、予算が完全に足りないよ。」

エンジニアB:「それならLoRAを試してみよう。元のパラメータは固定して、アダプター行列だけを学習させるから、安価なGPUが1〜2枚あれば十分にファインチューニングできるし、精度もフル学習とほとんど変わらないよ。」

「フルファインチューニング」と「LoRAチューニング」の特性比較

特徴 フルファインチューニング (Full Fine-Tuning) LoRA (低ランク適応: PEFT)
学習対象パラメータ モデルのすべてのパラメータ(100%)。 追加した低ランク行列のみ(0.1%以下)。
成果物のファイル容量 元モデルと同じ巨大なサイズ(例:140GB)。 極めて軽量(数MB〜数百MB)。
推論時のオーバーヘッド なし(通常の推論速度)。 なし(学習した行列のウェイトを、元のウェイトにあらかじめマージ(融合)させておくことで、追加の計算遅延をゼロにできる)。

よくある疑問(FAQ)

Q:LoRAのパラメータである「r(ランク)」や「alpha(アルファ)」の決め方は?

A:「r(ランク)」は低ランク行列の幅を示す数値で、通常「8」や「16」(大きいほど複雑な関係性を学習できるがメモリ消費が増える)が一般的です。「alpha」は学習した重みを元の重みにどれだけの強さでブレンドするかを決めるスケーリング係数で、多くの場合「rの2倍(r=16ならalpha=32)」に設定することが推奨されます。これらはモデルの目的やデータの複雑度に応じてハイパーパラメータチューニングで微調整します。

オープンソースコミュニティにおけるマナーと共有の文化

LoRAの最大の強みは「ファイルサイズが小さい」ため、インターネット上のコミュニティ(「Hugging Face」や画像生成AIの「Civitai」など)で、個人開発者同士が作成したカスタムLoRAを簡単にアップロード・共有し合える点にあります。LoRAを共有する際は、ベースとなったモデルの名前、学習に使用したプロンプトの傾向、そして「マージ(融合)の比率(LoRAウェイト)」を詳細にドキュメント記載しておくことが、コミュニティメンバーに対する大切なマナーとされています。

LoRA(低ランク適応)」について

当ページは、意味・業界用語集における「LoRA(低ランク適応)」の解説ページです。専門用語の意味や使い方について加筆・修正のご要望がございましたら、お問い合わせフォームよりお気軽にご連絡ください。