二次元裏@ふたば

画像ファイル名:1774499663432.png-(247109 B)
247109 B26/03/26(木)13:34:23No.1414388206そうだねx4 16:23頃消えます
Googleがメモリ使用量を6分の1に削減し速度を8倍向上させるAIアルゴリズムの開発を発表した後
RAMメモリ企業が急落し数百万ドルの損失を報告
このスレは古いので、もうすぐ消えます。
126/03/26(木)13:35:09No.1414388330+
ほう
226/03/26(木)13:46:23No.1414390429そうだねx118
ありがとうGoogle…
326/03/26(木)13:50:13No.1414391156そうだねx58
マジならマジで嬉しいが
426/03/26(木)13:51:39No.1414391456そうだねx45
>Googleがメモリ使用量を6分の1に削減し
なそ
>速度を8倍向上させるAIアルゴリズム
にん
526/03/26(木)13:52:17No.1414391574そうだねx3
でもGeminiはポンコツのままなんやな
626/03/26(木)13:52:26No.1414391597そうだねx6
大丈夫?できまぁす案件じゃない?
726/03/26(木)13:52:52No.1414391674そうだねx30
Chromeがどか食いなのに?
826/03/26(木)13:53:43No.1414391837そうだねx5
ブラウザもメモリ食い軽減して
926/03/26(木)13:55:03No.1414392061そうだねx50
6分の1にして空いた分を更に食い潰すのがChrome
1026/03/26(木)13:55:25No.1414392119+
AIもChromeに食われるのか
1126/03/26(木)13:56:21No.1414392274そうだねx4
ついでに戦争も止めてくれ
1226/03/26(木)13:56:50No.1414392360+
メモリやすくなる?
1326/03/26(木)13:57:17No.1414392441+
KVキャッシュのメモリ使用量削減を1/6らしい
KVキャッシュってAIでどの程度の割合を占めてるんだろう
1426/03/26(木)13:57:36No.1414392489そうだねx6
じゃあもっと注ぎ込めるじゃんっ!
1526/03/26(木)13:58:59No.1414392761そうだねx3
こういう事できそうと発表しただけで株が変動する
敏感すぎるぞ株価
もっと鈍感になれ
1626/03/26(木)14:00:37No.1414393039+
市場がここまで反応するなら確度高いんだろうなあ
意外にシンギュラリティ近いんじゃない?
1726/03/26(木)14:01:59No.1414393259そうだねx9
>こういう事できそうと発表しただけで株が変動する
>敏感すぎるぞ株価
>もっと鈍感になれ
情報が確定するまで待ってたら手遅れになるじゃん!
1826/03/26(木)14:02:56No.1414393432そうだねx5
>Googleが発表した「TurboQuant」 モデルの再学習不要で、KVキャッシュのメモリ消費を1/6に極限圧縮しつつ、精度低下ゼロ&処理速度アップというチート級の技術。ローカルLLM勢とって超朗報で、例えば​VRAM16GBのうち15GBをモデル本体で使って残り1GB、今まで3万トークンでOOMだったのが18万に爆増!
本当かよ
1926/03/26(木)14:05:06No.1414393816+
この手のやつ大体飛ばし記事
2026/03/26(木)14:06:12No.1414394005そうだねx34
頼むから本当であってくれって思った記事ばっかり本当にならない
2126/03/26(木)14:07:31No.1414394220+
>こういう事できそうと発表しただけで株が変動する
>敏感すぎるぞ株価
>もっと鈍感になれ
感度3000倍
2226/03/26(木)14:08:03No.1414394298そうだねx5
そのままのメモリ量を使えば48倍になるってことじゃん!?
2326/03/26(木)14:08:38No.1414394389そうだねx20
でもそういうのって従来と同じメモリの量使って実質6倍の8倍で48倍だぁー!ってやるもんじゃないの
2426/03/26(木)14:09:01No.1414394453+
>>こういう事できそうと発表しただけで株が変動する
>>敏感すぎるぞ株価
>>もっと鈍感になれ
>感度3000倍
んほおおおお!!(暴落
2526/03/26(木)14:09:58No.1414394587+
いやでもGoogleの研究だし
メモリ会社の株価下がってるし
本当臭いぞ
2626/03/26(木)14:10:57No.1414394752そうだねx13
>Chromeがどか食いなのに?
ホントにドカ食いだったらChromeOSみたいなフットプリント小さいOSは実現出来てないよ
2726/03/26(木)14:12:13No.1414394956+
解説見る限りそんなに面倒くさいことやってるわけじゃないし
たまたま試してみたら性能低下がなかったから発表したみたいな感じに見える
2826/03/26(木)14:13:31No.1414395192そうだねx3
いけっ!下がれっ!潰れろっ!
2926/03/26(木)14:14:35No.1414395337+
今のAIバブルだったらそれで6倍学習すりゃ
いいじゃんってなるだけじゃない
3026/03/26(木)14:14:47No.1414395369そうだねx25
>いけっ!下がれっ!
うn
>潰れろっ!
これはすごいぞ…
3126/03/26(木)14:15:14No.1414395435そうだねx6
>いやでもGoogleの研究だし
>メモリ会社の株価下がってるし
>本当臭いぞ
下がってるのは信じたやつが売ってるだけでしかないだろ
3226/03/26(木)14:15:48No.1414395512+
なんで技術説明だけで実行モデルが無いのよ
3326/03/26(木)14:15:52No.1414395523+
そんなに信じたくないのか…
3426/03/26(木)14:16:20No.1414395588そうだねx7
>そんなに信じたくないのか…
信じさせてくれよ!
3526/03/26(木)14:16:29No.1414395609そうだねx13
いや実際現状のあまりのメモリドカ食いによる資源消費を考えると
省力化はマジモンの課題ではあったからな…
3626/03/26(木)14:17:24No.1414395739+
しょぼいPCでもまともなモデルを使えるようになるのか!?
3726/03/26(木)14:17:35No.1414395764+
メモリ安くなってくれ…頼む
3826/03/26(木)14:17:36No.1414395766そうだねx2
>>潰れろっ!
>これはすごいぞ…
あり得ん話だけど今micron潰れたらPCガチで手の届かないものになりそうだな
3926/03/26(木)14:18:27No.1414395905そうだねx10
株価とかってマジで雰囲気で乱高下するからすごい
トレーダーさんとか頭おかしくならないの
4026/03/26(木)14:18:28No.1414395910+
読んでくればわかるよ
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/
4126/03/26(木)14:18:30No.1414395921+
コンテキスト部分だからデカいはデカいけど最近のモデルサイズから考えるとLLMで使うメモリ全体の5〜15%ぐらい
モデル自体のすげえ量子化技術ってわけじゃないから文字通りの6分の1ではないはず
4226/03/26(木)14:22:52No.1414396616そうだねx2
>株価とかってマジで雰囲気で乱高下するからすごい
>トレーダーさんとか頭おかしくならないの
最近の国際情勢とAI技術発展の変化の速さはもう既に頭おかしくなってそう
4326/03/26(木)14:23:40No.1414396718+
>あり得ん話だけど今micron潰れたらPCガチで手の届かないものになりそうだな
コンシューマ向けメモリはもう生産終了してるしPCの入手性は変わらないんじゃない?
4426/03/26(木)14:24:28No.1414396846そうだねx12
善いニュースは全て実現してほしいと思っています
4526/03/26(木)14:24:37No.1414396866そうだねx2
>メモリやすくなる?
上げた価格は戻さないよ
AIの他にも需要に対して供給足りなさすぎ
4626/03/26(木)14:24:56No.1414396909+
>じゃあもっと注ぎ込めるじゃんっ!
多分こうなるよね
価格はさらに上がる
4726/03/26(木)14:25:16No.1414396961+
メモリより下がった株買えばよろしい
4826/03/26(木)14:25:28No.1414397002+
再学習不要で精度落とせず圧縮ができる…コストすげー浮くな
4926/03/26(木)14:27:46No.1414397376+
メモリ6分の1になるってことは6倍使っても今までと同じ消費ってことだから需要が6倍高まる…!
5026/03/26(木)14:27:55No.1414397404+
カルテル止めろ
5126/03/26(木)14:30:42No.1414397895+
Chromeはあるだけつかうだけ
余してももったいないじゃん?
5226/03/26(木)14:31:18No.1414397988そうだねx3
>株価とかってマジで雰囲気で乱高下するからすごい
だから株価が下がっていくらの損失って言われても実体のない数字が書き換えられてるだけじゃんって思っちゃう
5326/03/26(木)14:31:44No.1414398055そうだねx5
つまりいまの6倍AIを動かせるってことだな!
5426/03/26(木)14:32:07No.1414398110+
KVキャッシュは単純に言うとAIのメモ帳だ
AIとの長い会話で出てきた単語や話の流れをメモっておく
これが少ないと三日後に取り出そうとして忘れてたりする
今回は特別なアルゴリズムでこれが圧縮して6分の1になった
三日後六倍になったわけだ
5526/03/26(木)14:32:51No.1414398216+
>Chromeはあるだけつかうだけ
>余してももったいないじゃん?
今はメモリセーバー他アグレッシブにメモリ解放してく設定もあるからシンプルに一度叩いて良いコンテンツ認定したから情報更新しないで叩いてる奴らがいるだけだ
5626/03/26(木)14:33:46No.1414398336+
その割にすぐGemini話忘れるよね
5726/03/26(木)14:35:01No.1414398539+
Chromeが6倍食べれる!
5826/03/26(木)14:35:06No.1414398558+
動画生成のローカルのハードル下がったりしそう?
5926/03/26(木)14:36:07No.1414398722+
>その割にすぐGemini話忘れるよね
無料だとかなり制限あるしな
有料でも忘れる?うーんGoogleに頑張ってもらおう
6026/03/26(木)14:36:53No.1414398858+
じゃあサム・アルトマンが買い占めたメモリの材料も暴落するの?
6126/03/26(木)14:38:07No.1414399057+
>つまりいまの6倍AIを動かせるってことだな!
結局これになってメモリ供給安定するとかはないと思う
6226/03/26(木)14:38:12No.1414399074+
Windowsも縦タスクバーにUI変更するけど同時にメモリ使用量もがっつり減るとおもうよ
たぶんかってにユーザー情報集めるなみたいな法律関係のなにかのせいだけど
6326/03/26(木)14:38:58No.1414399211+
あくまでAI全体の話じゃなくてAIの一部の機能が1/6に圧縮できる!って話か
それでもすごいけど
6426/03/26(木)14:39:22No.1414399269+
データセンター建て過ぎたらコストとの兼ね合いで
効率悪くなるとかないのかな
6526/03/26(木)14:39:54No.1414399352+
Crucialはまだ戻ってきそうにないな…
6626/03/26(木)14:40:06No.1414399381+
>無料だとかなり制限あるしな
>有料でも忘れる?うーんGoogleに頑張ってもらおう
課金も6分の1にしてくれ!
6726/03/26(木)14:40:55No.1414399525+
量子コンピュータとかできたら折角建てたデータセンターが全部ゴミになったりしないかな
6826/03/26(木)14:41:36No.1414399655+
余裕出来たならその分使うがモットーなんで無用になるということはない
6926/03/26(木)14:41:45No.1414399680+
一度に読み込めるトークン増えるから
精度上げて安く速くできるようになるな
Geminiだと無料枠増えるんじゃね
7026/03/26(木)14:42:59No.1414399892+
geminiのコンテキストが5Mとかになってから信じるか…
7126/03/26(木)14:43:54No.1414400060+
>Windowsも縦タスクバーにUI変更するけど同時にメモリ使用量もがっつり減るとおもうよ
>たぶんかってにユーザー情報集めるなみたいな法律関係のなにかのせいだけど
コア部分のUI実装方式全面的に書き換えるから軽量化出来るはずという見通しはあるけどテレメトリの収集とか全然関係ないな?
7226/03/26(木)14:44:52No.1414400233そうだねx3
Windowsが重い時はOneDriveが謎にリソース食ってる
7326/03/26(木)14:46:24No.1414400533そうだねx1
いきなり6分の1に削減ってそんな事可能なの
今までのが余程無駄が多かったってこと?
7426/03/26(木)14:47:30No.1414400776そうだねx3
モデル本体が減らないならまだまだRAM必要じゃない?
7526/03/26(木)14:47:36No.1414400796+
>いきなり6分の1に削減ってそんな事可能なの
>今までのが余程無駄が多かったってこと?
こういうので実際に6分の1になったの見たことない
7626/03/26(木)14:47:41No.1414400818+
余ったメモリでさらにぶん回すね
7726/03/26(木)14:47:54No.1414400857+
>頼むから本当であってくれって思った記事ばっかり本当にならない
頼むから嘘であってくれって記事は?
7826/03/26(木)14:48:30No.1414400957そうだねx3
LLMであるかぎり6分の1になってもメモリの需要は減らないと考えられる
7926/03/26(木)14:48:50No.1414401027そうだねx5
>Windowsが重い時はOneDriveが謎にリソース食ってる
あと裏で勝手にwindowsアプデ入れてる時だと思う
8026/03/26(木)14:49:32No.1414401143そうだねx2
それこそAIがマイクロ秒で取引するから投資家さんが今ちょっと正気でも
🤖下がる!下がりますぞー!ことごとく損切りして下されー!
ってなって結局ダダ落ちる
8126/03/26(木)14:49:44No.1414401176+
>余ったメモリでさらにぶん回すね
これ
8226/03/26(木)14:52:02No.1414401582+
AI業界もメモリ囲い込んでウハウハなんじゃなくてあるだけ買ってもまだ足りないからひーひー言ってる訳でしょ
やっぱり浮いた分規模デカくして結局足りないんじゃないの
8326/03/26(木)14:53:16No.1414401803+
>それこそAIがマイクロ秒で取引するから投資家さんが今ちょっと正気でも
>🤖下がる!下がりますぞー!ことごとく損切りして下されー!
>ってなって結局ダダ落ちる
ファンダメンタルよりセンチメンタルなんやなw
8426/03/26(木)14:53:18No.1414401807そうだねx1
メモリバカ食いしてるAI分野のメモリ効率化技術?
まあ1/6になったら6倍食わせるようになるだけだよな
8526/03/26(木)14:53:54No.1414401915+
モデルサイズ1/6にできるすげえ量子化技術ならともかくKVキャッシュだけだもんな…
8626/03/26(木)14:56:46No.1414402413+
>でもそういうのって従来と同じメモリの量使って実質6倍の8倍で48倍だぁー!ってやるもんじゃないの
AGI到達レースの段階だからなぁ
効率化しても製造リソースの偏りはそのままでぶっこむ未来しか見えない
8726/03/26(木)14:57:29No.1414402532+
今AI巡回許すニュースサイト立ち上げたらボロ儲けできるのでは
8826/03/26(木)14:58:38No.1414402734+
今一番金を生み出せるコーディングAIはどれだって勝負になってるから物覚えが良くなるほど強くなれる可能性がある
8926/03/26(木)15:01:14No.1414403168+
今まででもGPT-2以降1年ごとに1/10とかになってるんでしょ
それでも毎年メモリ消費も電力消費も倍々で増えてるんだからひょっとしなくても足りないままだよ
9026/03/26(木)15:02:47No.1414403415そうだねx1
>今まででもGPT-2以降1年ごとに1/10とかになってるんでしょ
>それでも毎年メモリ消費も電力消費も倍々で増えてるんだからひょっとしなくても足りないままだよ
今が株買い時ってことジャンっ!
9126/03/26(木)15:03:36No.1414403554+
画像生成のVRAM消費も節約してくれる?
9226/03/26(木)15:06:27No.1414404018+
ローカルでも軽くなるならいいことじゃん
9326/03/26(木)15:06:31No.1414404031+
早くAI企業淘汰されてハード買い占めチキンレース終わらせて…
9426/03/26(木)15:07:11No.1414404145+
AI方面でメモリ使用量が1/10になるだのいう理由は4ビット浮動小数点とかそんな工夫のせいだろ
9526/03/26(木)15:10:03No.1414404707+
でもさぁ使用量1/6になったところでメモリの実数値も1/6にします!とはならないじゃん…?
それより実数値そのままにすればスペック6倍じゃん?
9626/03/26(木)15:14:51No.1414405544+
これでまた爆発的にAIの性能がよくなったら夢があるな
9726/03/26(木)15:14:54No.1414405552+
TurboQuantの説明見てるけど大規模な浮動小数点数の演算を必要としてる所は変わらないって事は
引き続きNVIDIAの天下か
9826/03/26(木)15:15:21No.1414405642+
どーせローカル降りてきてもLLMならmacとか画像動画ならcomfyでしか使えん
9926/03/26(木)15:15:23No.1414405650+
次はPixelのTensorを鞍替えだ
10026/03/26(木)15:20:15No.1414406520+
googleはllm用のハードも自前で開発してるしこっちの流れが広がるとGPUを流用する必要もなくなる
AIに食い潰される未来を変える希望の星
10126/03/26(木)15:21:40No.1414406755そうだねx2
大手が株の投資判断もAIにさせるようになって10年ぐらい経つ
AIちゃんの判断が速すぎて株価が乱高下しかしなくなった
10226/03/26(木)15:23:53No.1414407143+
CUDA捨てれば60WぐらいのTPUで300W級グラボぐらいの演算はできんこたない時代なんだが時期が悪い
10326/03/26(木)15:25:15No.1414407390+
知らん
俺のブラウジングが快適になるならそれで俺は幸せだ
10426/03/26(木)15:26:10No.1414407536+
正直できるわけなくねって思うしできたところで余裕なんてあればあるほどいいのにこれで急落するの投資家パッションで生きてんのかよ
10526/03/26(木)15:26:26No.1414407576+
もしかしてハイスペなローカルLLMをそこそこPCで使えるようになる?
10626/03/26(木)15:28:53No.1414408046+
メモリの量が少なくなるぜ〜とはいうけどこれHBMとか爆速ストレージ使ってるマシンでの話だから
ご自宅のPCにそのまま適用できてもモデルロードだけで日が暮れそう
10726/03/26(木)15:29:27No.1414408157そうだねx1
6分の1になるからもっと使おうねってなるだけだろ
歴史を考えろ
10826/03/26(木)15:32:25No.1414408746そうだねx1
論文自体はずっと前から出てるんで株が反応してるのはニュースサイトしか見てないAI
10926/03/26(木)15:33:46No.1414409022+
オープンソース化されるかどうかだな
11026/03/26(木)15:34:10No.1414409099+
ローカルLLMか…エロテキスト生成を…?
11126/03/26(木)15:34:46No.1414409208+
Chromeもバージョンアップでメモリ食い減ったりするんかね
11226/03/26(木)15:39:06No.1414410057+
クソ長い会話ログを丸ごと記憶したり
ラノベ一冊分(8万文字)を参照できたり
エラー毎にプログラムコード全体を丸ごと解析したり
そういう使い方ができるようになる
11326/03/26(木)15:40:03No.1414410278+
要は学習し終わったモデルをいい感じに高圧縮かつ高速で使えるようにするアルゴリズムって事か?
11426/03/26(木)15:45:13No.1414411257+
Googleってもしかしてすごい?
11526/03/26(木)15:48:37No.1414411884+
マイクロンはうちの取引先だから潰れたらちょっと困るな…
11626/03/26(木)15:49:18No.1414412022+
ベクトル空間に無駄が多いのはなんとなくわかるけど
数ビットで足りるのはなんでなのん?
11726/03/26(木)15:51:48No.1414412498+
素直に嘘くさいんだけど信じられるのかこれ
メモリ領域余ったら余った分だけ別で使って重くする所だろ
11826/03/26(木)15:52:05No.1414412558+
>Googleってもしかしてすごい?
そもそも今のLLMの原型考えたのGoogle
11926/03/26(木)15:58:11No.1414413670+
俺のキオクシア株が…
12026/03/26(木)15:59:48No.1414413975+
今でもKVキャッシュをq8とかq4量子化してメモリ節約する方法あるけどそれとはまた別なのか
12126/03/26(木)16:03:02No.1414414584+
>オープンソース化されるかどうかだな
詳細な論文が発表されればソースそのものが公開されなくても割と実装されるから期待しとく
12226/03/26(木)16:06:29No.1414415248+
結局無限にメモリや電力欲しがるのがAIだもんな
12326/03/26(木)16:06:45No.1414415293+
上に貼ってあるのを見ても
素人には他の量子化技術よりちょっと上っぽい?くらいしかわからん!
12426/03/26(木)16:13:46No.1414416676そうだねx1
1/6にして6倍食わせたら6倍下げる研究できるんじゃね
そしたらまた下がるんじゃね
12526/03/26(木)16:16:51No.1414417289+
Googleの技術力こわ…
12626/03/26(木)16:17:21No.1414417399+
ゲームのAI製NPCなんかに良い技術だ
人物設定で「こいつは何を知っているか?」という部分を少ない容量で大量に記憶できるようになった
こっちが話した内容もちゃんと記憶できる


1774499663432.png