「超効率化への挑戦: 大規模モデルの量子化のワークフローと研究状況」としまして下記のとおり開催いたします。
近年、 LLM(Large Language Model)の大規模化に伴い、 推論速度の低下、 メモリ使用量の増大、 および電力コストの上昇といった課題が顕在化している。 これらの課題に対処するため、 実数表現を離散化し計算効率を向上させる量子化技術が注目されている。 しかし、 LLMの量子化において、極低ビット量子化の実現は困難であることが報告されている。我々はこの課題に挑戦し、 1bitの極低ビット量子化であっても標準ベンチマーク上で平均90%の性能を維持することに成功した。 本講演では、この成果を実現するためのLLM量子化のワークフローおよび最新研究動向を体系的に概観する。
講師:市川 佑馬 氏(富士通株式会社人工知能研究所(主任研究員)、理研AIP(特任研究員))
テーマ: AI・データ利活用研究会 第104回
日時: 2026年03月27日(金) 講演 18:00-19:00 質疑 19:00-20:00
場所: オンライン開催
参加費: 無料
参加方法: Zoomウェビナーを用いたオンラインでの開催となります。
このウェビナーに事前登録する:
https://us02web.zoom.us/webinar/register/WN_334sHO34RACT9UVYW4xGlA
ご登録後、ウェビナー参加に関する確認メールが届きます。
アクセス: オンライン開催
| 主催校 | 大阪大学 |
| 開始日時 | 2026年03月27日(金) 18:00 |
| 終了日時 | 2026年03月27日(金) 20:00 |
| 場所 | オンライン開催(ホスト大阪大学) |
| 参加費 | 無料 |
| アクセス | WEB開催:大阪大学 ホスト |
| 問合せ | mmds-duexddrive@sigmath.es.osaka-u.ac.jp |