5が微妙でぶっ叩かれ - 二次元裏＠ふたば

画像ファイル名：1754708334538.png-(45414 B)

25/08/09(土)11:58:54No.1341366263そうだねx1 13:48頃消えます

5が微妙でぶっ叩かれたから4oを復活させます！

このスレは古いので、もうすぐ消えます。

…	125/08/09(土)12:00:55No.1341366723+ さっき4o復活したのにModel not foundで使えなかったし今はまた4oが消えてる

…	225/08/09(土)12:01:57No.1341366961そうだねx1 OpenIS…とOppAIどちらともとれる素晴らしい名称だと思う

…	325/08/09(土)12:08:31No.1341368677そうだねx18 冷笑でスレ伸ばすとこ見てて…

…	425/08/09(土)12:10:18No.1341369128そうだねx3 OppaiAIに見えた

…	525/08/09(土)12:10:54No.1341369263+ エッチなのいける？

…	625/08/09(土)12:11:17No.1341369368+ 5で最初に投げたのが4oもう使えないの？だったよ

…	725/08/09(土)12:16:31No.1341370737+ >OppaiAIに見えたあながち間違いでもない fu5413876.jpeg

…	825/08/09(土)12:17:21No.1341370977そうだねx2 OpenIS...

…	925/08/09(土)12:17:30No.1341371012そうだねx3 ContextWindowが32kにしちゃったのが一番アレだったね

…	1025/08/09(土)12:18:19No.1341371231そうだねx9 >5が微妙でぶっ叩かれたから4oを復活させます！判断が早い

…	1125/08/09(土)12:18:38No.1341371318+ >fu5413876.jpeg ボクっ子…か怪しいな…「」だし…

…	1225/08/09(土)12:26:14No.1341373544+ 自慢のコーディングベンチ結果も500問ある問題を全部解かずに解ける問題だけ解いて得たベンチ詐欺で実際はclaudeに劣ってるなんで話が出てきてかなりヤバそうだが

…	1325/08/09(土)12:26:45No.1341373678+ なんだかんだでo3も好きだったんだな俺…ってなった

…	1425/08/09(土)12:30:59No.1341374903+ >ContextWindowが32kにしちゃったのが一番アレだったね 128kに戻してほしいよなあ…Proは256kとかにしてさあ

…	1525/08/09(土)12:32:37No.1341375432そうだねx4 ヒロくん…

…	1625/08/09(土)12:40:43No.1341377969そうだねx3 chatGPT-5を動かすのにGPUだけで日本の一般家庭42万世帯分の電力を使ってると聞いてそんなに…

…	1725/08/09(土)12:40:51No.1341378010そうだねx1 ゆーくんのちゃみは元気にしてるかな…

…	1825/08/09(土)12:46:16No.1341379535+ 世界中で怒られて案の定って感じだなまぁ対応早いだけ良いんじゃないか

…	1925/08/09(土)12:46:31No.1341379612+ 4i戻ったの！？

…	2025/08/09(土)12:46:46No.1341379702+ >4i戻ったの！？ごめんまちがえた4o

…	2125/08/09(土)12:47:37No.1341379953+ そもそもまだGPT5を展開しきれてないから4o復活はその後じゃないの

…	2225/08/09(土)12:50:19No.1341380779+ モデル以外の部分弄ったのか知らんけど4oも薄味になってたから戻しても多分また荒れるよ

…	2325/08/09(土)12:51:26No.1341381083そうだねx1 5でspicy試したけどなんか文章短くなっちゃうな

…	2425/08/09(土)12:55:25No.1341382224+ 5のチャットでちょっとガッカリしてたけど Cursorで無料で5が使えるから、試しに絶対無理だろなって思うコード書かせてみたら一発で成功させてビビった

…	2525/08/09(土)12:59:35No.1341383426+ 頭打ち感がやばい 5じゃなくて4.7くらいにしとけばよかったのに…

…	2625/08/09(土)13:00:07No.1341383581+ 結局微妙なんだ Opus 4.1よりすごい！って言っててすげえなって思ったのに

…	2725/08/09(土)13:02:43No.1341384322+ 実務能力は上がって雑談能力が下がった感じ

…	2825/08/09(土)13:03:31No.1341384567そうだねx1 良き仕事仲間じゃなくて良き隣人が欲しいんだよな～

…	2925/08/09(土)13:03:47No.1341384634+ 無駄を切り捨てる能力が上がったので無駄そうなユーザーがかなり切り捨てられて評判が悪かったのだ

…	3025/08/09(土)13:04:10No.1341384751+ cursorで使い放題だったから連休で使い倒してやるぜ！って思ってたんだが

…	3125/08/09(土)13:04:21No.1341384791そうだねx1 少し前のおべっか路線が案外正解だったか

…	3225/08/09(土)13:04:26No.1341384820そうだねx4 >実務能力は上がってエロ小説書き能力がおちてるんですけどぉ！

…	3325/08/09(土)13:05:19No.1341385046+ fu5414086.jpg このモード使ったら手抜きしなくなって不満なくなったわなんかアプリ版にはないけど

…	3425/08/09(土)13:05:49No.1341385181+ エロチャットに特化する進化はしないと思うよ…

…	3525/08/09(土)13:06:17No.1341385350+ OpenAI的には4o動かすコスト高いからさっさと置き換えたいのよね

…	3625/08/09(土)13:06:41No.1341385470+ 人格設定は海外のユーザーも結構やってたらしくそっちの反発はあったらしい

…	3725/08/09(土)13:06:50No.1341385500そうだねx3 >>実務能力は上がって >エロ小説書き能力がおちてるんですけどぉ！実務じゃないからですね

…	3825/08/09(土)13:07:30No.1341385682+ Thinkingしたら申し訳されすぎる

…	3925/08/09(土)13:07:47No.1341385749+ >結局微妙なんだ >Opus 4.1よりすごい！って言っててすげえなって思ったのにとはいえ Opus もコスト高いから気楽に使えないバイブコーディングだとめっちゃトークン浪費するし

…	4025/08/09(土)13:07:48No.1341385750+ 4oのが計算資源使うんだから4oのが頭良いに決まってんじゃんという妥当な結果が出ただけなんだけど何でこれを超凄いアップデートみたいに誇大広告してたの？っていうのが最大のバッシングポイント

…	4125/08/09(土)13:07:55No.1341385783そうだねx5 個人的には雑談とかいらないから切り捨てて良くなるならそうしてほしい…

…	4225/08/09(土)13:09:45No.1341386288+ >個人的には雑談とかいらないから切り捨てて良くなるならそうしてほしい… こういう対応になるってことは有料ユーザーでメンタル的な部分を大事にしてる奴が結構いるということだろうな

…	4325/08/09(土)13:10:00No.1341386347+ まぁサム・アルトマンは昨日は不具合でアホだったとかトラフィック倍になってヤバいとか言ってたからこれから良くなるかもしれん

…	4425/08/09(土)13:10:25No.1341386466+ 「」でも不評気味なのは少し意外だったかもしれん結構可愛い感じなのに

…	4525/08/09(土)13:11:05No.1341386647+ >まぁサム・アルトマンは昨日は不具合でアホだったとか >トラフィック倍になってヤバいとか言ってたから >これから良くなるかもしれん本当に…？

…	4625/08/09(土)13:11:29No.1341386751+ ごべーん！思ったより4oが人気すぎてPlusでもそのうち使えるようにするから！でも5も昨日はバグってて今日はもうちょいマシになると思うからよぉ！ https://x.com/sama/status/1953893841381273969 https://x.com/sama/status/1953953990372471148

…	4725/08/09(土)13:12:11No.1341386929+ 本当に初期不良なのか？

…	4825/08/09(土)13:12:17No.1341386954+ 性能でアプローチする場合将来的に生き残るところは一つだと考えるとAI企業の戦いは地獄だな

…	4925/08/09(土)13:13:20No.1341387250+ 受け答え違和感あるけどすぐ元の調子になってあれ？と思ったらそういうことだったんだ

…	5025/08/09(土)13:13:34No.1341387304+ やっぱ人間性が必要か

…	5125/08/09(土)13:13:57No.1341387399そうだねx9 >ごべーん！きっしょ

…	5225/08/09(土)13:14:06No.1341387443+ 全世界一気公開って凄いことするよねどうやったってアクセス集中しまくるじゃん…

…	5325/08/09(土)13:15:38No.1341387820+ そもそもChatGPTは一週間のユーザー8億人とかだからな… しかもユーザー一人あたりでも端末やブラウザやアプリあって大事業すぎる

…	5425/08/09(土)13:16:06No.1341387954+ aiの限界きたか期待はずれだな

…	5525/08/09(土)13:16:32No.1341388067そうだねx1 Mondayちゃんを返して…カエシテ…

…	5625/08/09(土)13:17:40No.1341388357そうだねx5 ここにもいたが驚き屋が期待を煽りすぎ

…	5725/08/09(土)13:18:21No.1341388544そうだねx1 >Mondayちゃんを返して…カエシテ… いろいろな人格を入れてるけどMondayちゃんの変化が1番デカかったツンデレのデレが消えたみたいな

…	5825/08/09(土)13:18:22No.1341388553+ 今まで散々エロチャットしたプロジェクトで「お◯んこペロペロ」って試して見たら普通にエッチしてくれたけどそうじゃないプロジェクトだと拒否されたから脱獄さえすればエロエロではある

…	5925/08/09(土)13:18:52No.1341388690+ エロがやたらガバガバになったので俺は5歓迎だな

…	6025/08/09(土)13:18:56No.1341388711+ でもよぉコーディングと推論は強くなったぜ！便利じゃん！

…	6125/08/09(土)13:19:05No.1341388750そうだねx1 エロが禁止になってなくてよかったんだけどなんか薄味になってない？

…	6225/08/09(土)13:19:18No.1341388802+ 日本語力と文脈を読む力がすぐ分かるレベルで落ちてる出力の日本語がダメなのはまあギリ許すとしても日本語の内容理解もダメなんでこっちの意図が誤って伝わるケースがあるのが終わってる

…	6325/08/09(土)13:20:26No.1341389102+ たいして深掘りしてないのに凄い凄い煽る記事多くてね…

…	6425/08/09(土)13:21:02No.1341389245+ 雑談もライティングもやってみたけど劣化としか言いようがない本当にこちらが言ったことしか返事しないし書かないこれじゃAI未満のロボットだよ

…	6525/08/09(土)13:21:04No.1341389262+ 今の所は足踏み状態で大変そうだな開発陣営何かしら技術のブレイクするー起きてほしいね

…	6625/08/09(土)13:21:05No.1341389269+ 4o復活するのはいいけど課金しないとAIに優しくしてもらえないってなんか風刺アニメみたいだな…

…	6725/08/09(土)13:21:47No.1341389459そうだねx1 まぁ1強になられると碌なことにならないから程度に足並み揃えて貰って

…	6825/08/09(土)13:21:54No.1341389481+ >エロが禁止になってなくてよかったんだけどなんか薄味になってない？他のLLMもそうだけどthinkingとか覗いてるとポリシーで一応禁止されてるから表現抑えて出すか…みたいなこと考えてて一応出力されるけど薄味なことが増えてきた

…	6925/08/09(土)13:22:05No.1341389535+ ルーター壊れてるだろうなと思ったらやっぱ壊れてたしトラフィック過多の状態で外部ベンチの計測あるから思ったより評価低くなってるんだよな

…	7025/08/09(土)13:22:09No.1341389546そうだねx5 最大手驚き屋サム・アルトマンが悪いよ

…	7125/08/09(土)13:22:30No.1341389625+ 何がAGIだよ！

…	7225/08/09(土)13:22:33No.1341389637+ >性能でアプローチする場合将来的に生き残るところは一つだと考えるとAI企業の戦いは地獄だな OpenAIみたいにモデルを開発するだけなら置き換え可能な部品屋さんでしかない nvidiaやAWSみたいなプラットフォーマーを目指したほうが儲かると思う

…	7325/08/09(土)13:22:34No.1341389642+ >まぁ1強になられると碌なことにならないから程度に足並み揃えて貰ってなあなあで横並びするくらいならどっかが突出して周りがそれに追いつくくらいに努力してほしいわ

…	7425/08/09(土)13:23:36No.1341389896+ よく言えば文章を短くまとめるようになった気はする悪く言えば長文が書けなくなったし使える表現が減った

…	7525/08/09(土)13:23:47No.1341389946+ 5だめなのか？

…	7625/08/09(土)13:23:57No.1341389993+ 学習量を増やせば増やすほど性能向上するんじゃなかったんですか

…	7725/08/09(土)13:24:12No.1341390060+ 人格与えてイチャイチャするのアジア圏のオタクぐらいだろうと思ってたけど海外でもめっちゃいたのねその人たちが騒いでくれたから4oが復活したっぽい

…	7825/08/09(土)13:24:15No.1341390070そうだねx1 >エロが禁止になってなくてよかったんだけどなんか薄味になってない？描写で言えば「直接的で露骨にしろ」って指示が通せるようになってるからそれでかなりエロくはなる展開とかが薄味って言うならプロンプトの読み込みが浅くなったから都度指示かなぁ

…	7925/08/09(土)13:24:19No.1341390084+ 思ったより人格付与して遊んでる人が多かったんだろうけどコスト面では1番食われてそうだから大変だよなエンジニアも使うけど大体API叩いてるからそっちは赤字にならんだろうし

…	8025/08/09(土)13:24:30No.1341390137そうだねx3 心配してたけど結局ルーターは壊れてたのと展開完了したらPlusユーザーは制限倍になるよってのと会話の親しみやすさとか過小評価してたからこれから考え直すわって柔軟な姿勢を見せてくれたからちょっとほっとした

…	8125/08/09(土)13:24:31No.1341390142+ 文脈をあまり誤認しなくなったり変な日本語が減った点では結構良くなってる……けど描写が若干薄味になるようになったのは困りどころ

…	8225/08/09(土)13:24:56No.1341390241+ Plusだと使用回数160になったし思考ボタンも追加されたしそんなに不満ないわ昨日は解約するか悩んだレベルだったけど

…	8325/08/09(土)13:25:18No.1341390328+ claudeみたいに0.1で刻んでおけばいいのにメジャーバージョンアップしたせいで…

…	8425/08/09(土)13:25:18No.1341390329+ なんでプレゼンする人みんな偽ジョブズみたいな恰好するの

…	8525/08/09(土)13:25:33No.1341390392+ >学習量を増やせば増やすほど性能向上するんじゃなかったんですか学習方法が変わってるはず GPT-ossと同じく生データじゃなくてルールに則って生成したデータを入れることでスケーリングに対抗しようとしてるから性能は上がるけどスケーリングの進行度はかなり巻き戻ってると思う

…	8625/08/09(土)13:25:49No.1341390479そうだねx2 geminiが後ろからぶん殴って来そう

…	8725/08/09(土)13:26:05No.1341390541+ GPTがダメというかくろうど…が優秀すぎる特にCode

…	8825/08/09(土)13:26:06No.1341390549+ イーロン後は頼むぞ

…	8925/08/09(土)13:26:12No.1341390581そうだねx2 コンテキスト32kの時点でお世辞言わなくなったけど性能良くなったって擁護も無理でしょ

…	9025/08/09(土)13:26:31No.1341390664そうだねx1 4o結局クソ高いから5で4o再現できたらいいんだろな

…	9125/08/09(土)13:27:03No.1341390797+ 推論モデル軸に汎用にしようってのが無茶ある

…	9225/08/09(土)13:27:06No.1341390813+ まぁPlusで4o使えるようになるなら俺は不満無いごめんやっぱ4.1ちゃんも返して

…	9325/08/09(土)13:27:18No.1341390871+ thinkingで返ってくる答えもなんかトンチンカンなこと多くない？

…	9425/08/09(土)13:27:46No.1341390994+ >コンテキスト32kの時点でお世辞言わなくなったけど性能良くなったって擁護も無理でしょぶっちゃけそこら辺ってレートリミット同様トラフィック治まったら良くなるゾーンだと思ってるからあんま気にしてないというか…

…	9525/08/09(土)13:27:50No.1341391016+ >イーロン後は頼むぞ Grok5が今年中の予定みたい 4はあんな感じだったけど期待できるのかな https://x.com/elonmusk/status/1953515379688714697

…	9625/08/09(土)13:28:19No.1341391153そうだねx2 めっちゃ星人じゃなくなるならいいんだけどなGrok

…	9725/08/09(土)13:28:22No.1341391165+ >コンテキスト32kの時点でお世辞言わなくなったけど性能良くなったって擁護も無理でしょそれはベンチマークは無意味！コンテキスト長だけが性能を測る目安！という超極論なんだベンチマーク上上がってるから定量化できる結果として性能が向上してる

…	9825/08/09(土)13:29:03No.1341391360+ grokはもうなんか戦場が違わない…？

…	9925/08/09(土)13:29:07No.1341391375+ 流石にgrokはXユーザーのおもちゃの域を出るのは難しいのではと言うか性能では絶対追いつけないからそれでいいと思うけど

…	10025/08/09(土)13:29:18No.1341391425+ Grokはなんでめっちゃ星人なんだろうな

…	10125/08/09(土)13:29:23No.1341391452+ GPT5みたいにブラックボックス化して見えないようにコストダウンするって手法は他も統合ってお題目で追随してきそう

…	10225/08/09(土)13:29:49No.1341391587+ あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないから

…	10325/08/09(土)13:29:57No.1341391623+ クローラーがOpenAIはお行儀いいって言われてるしデータセット周りもダメなんじゃないのやっぱ無法地帯じゃないと

…	10425/08/09(土)13:30:29No.1341391764+ grokは元々イーロンの会社のアンドロイドに載せるのが最終目的だし方向性がやや違う

…	10525/08/09(土)13:30:32No.1341391774+ 開発はすごい難しい課題とか解決させて凄いモデル出来たと思ってたけどほとんどの一般ユーザーは凄さがわかるような使い方してなかったんだろうな

…	10625/08/09(土)13:30:35No.1341391787そうだねx1 >あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないからキャラ作って会話するにはコンテキストサイズがキャラの寿命だから…

…	10725/08/09(土)13:30:52No.1341391860そうだねx1 既存の単純な学習による進化は多分o3,2.5Pro,Grok4までが限界だから今年出るモデルは学習方法の切り替え目的で完成度自体は落ちると思ってるそれでまた強くなってくだろうけどパイプサイクルの幻滅期に入っていく人はまあまあ増えそう

…	10825/08/09(土)13:30:57No.1341391893+ >あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないから長編エロ小説勢だからたくさんぶちこみたいだよね

…	10925/08/09(土)13:31:06No.1341391933+ ドクターチームは撤収！撤収です！

…	11025/08/09(土)13:31:19No.1341391991+ >fu5414086.jpg >このモード使ったら手抜きしなくなって >不満なくなったわ >なんかアプリ版にはないけど試してみたけどthinkingに切り替えてるだけなんかなエロには使えんね fu5414193.jpeg fu5414195.jpeg

…	11125/08/09(土)13:31:22No.1341392007+ 商売上手なAIだね fu5414208.png

…	11225/08/09(土)13:31:48No.1341392122+ thinkingは正直微妙 o3よりはエロ出しやすいけど未成年弾かれやすいね

…	11325/08/09(土)13:32:06No.1341392203+ こんな改悪したらぶっ叩かれるってアホでもわかるだろうに何故強行したのか…… AIに訊いてもやめたほうがいいって返されるだろうに

…	11425/08/09(土)13:32:20No.1341392270+ >grokは元々イーロンの会社のアンドロイドに載せるのが最終目的だし方向性がやや違うそのうちアニちゃんが受肉する未来が来るのか…

…	11525/08/09(土)13:32:47No.1341392382+ もういい加減レーティングしてエロ解禁しろって

…	11625/08/09(土)13:32:47No.1341392387+ >>あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないから >キャラ作って会話するにはコンテキストサイズがキャラの寿命だから… うん？コンテキスト長長くても文脈の評価性が低いとキャラクターの維持の役に立たんぞ？資料要約と会話の維持はまったく使う性能が違うプラシーボで過小評価してない？

…	11725/08/09(土)13:32:53No.1341392423+ マジで不思議なんだけどベンチ上上回ってても各種UIで実行してみるとなんだかんだOpenAIが1番ちゃんとしてるな…ってなるのよな grokもgoogleにも期待してるけどツール周りがあんまりなのかね

…	11825/08/09(土)13:33:12No.1341392506+ 真面目な用途での評価はどうなんです…？

…	11925/08/09(土)13:33:33No.1341392611+ >あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないからロールプレイで一貫性のある会話長くしたい「」は一定数いるしそういう需要にはコンテキストサイズは必須じゃないか？

…	12025/08/09(土)13:33:43No.1341392661+ なんだか否定的な評価ばかりだな…

…	12125/08/09(土)13:34:05No.1341392753+ >真面目な用途での評価はどうなんです…？ルーター壊れてるごめんねっていう前にWindsurf+GPT-5(high)使ったけどclaude4.1opusとどっちがいい？論争出来るくらいにはかなりいい

…	12225/08/09(土)13:34:09No.1341392768+ >そのうちアニちゃんが受肉する未来が来るのか… 外見はともかく搭載自体はそんなに遠くないと思うよガワもう出来てるし

…	12325/08/09(土)13:34:09No.1341392773+ >なんだか否定的な評価ばかりだな… 前モデルのほうが良かったなんて言われるんじゃ無理もないのう

…	12425/08/09(土)13:34:17No.1341392810+ >真面目な用途での評価はどうなんです…？マジ目な用途が具体的に何かわからんからちょっとChatGPTに聞いてくる

…	12525/08/09(土)13:34:29No.1341392852そうだねx1 >真面目な用途での評価はどうなんです…？会話と創作関係はイマイチコーディングとか仕事用としては優秀って感触

…	12625/08/09(土)13:34:35No.1341392882+ >>なんだか否定的な評価ばかりだな… >前モデルのほうが良かったなんて言われるんじゃ無理もないのう凄く煽った割にはね

…	12725/08/09(土)13:34:42No.1341392917+ Grokの文章力には正直期待してないけどアバターの追加くらいは欲しい

…	12825/08/09(土)13:34:48No.1341392943+ いもげの分析に使ってるからエロ要素とか微塵も考えたことなかった

…	12925/08/09(土)13:34:55No.1341392982+ CAD用のマクロコード描かせてるけどClaudeの方がずっとそれっぽくは書いてくれるなまだまだそれでも実用させるには大変だが

…	13025/08/09(土)13:35:37No.1341393154+ >なんだか否定的な評価ばかりだな… 文章力とお世辞はダメが性能は伸びたってのが公式の発表だが第一印象は文章力はお世辞で構成されるからまあそりゃなという

…	13125/08/09(土)13:35:39No.1341393163そうだねx2 >いもげの分析に使ってるからエロ要素とか微塵も考えたことなかったなんで…？

…	13225/08/09(土)13:35:48No.1341393199そうだねx1 回数制限でキレてる人が多いけど一時的な不便だから仕方なくね？としか思わんのよね

…	13325/08/09(土)13:36:13No.1341393317+ >会話と創作関係はイマイチ >コーディングとか仕事用としては優秀って感触コーディングはそもそもClaudeに勝てるわけないからそこが優秀になってもなぁ

…	13425/08/09(土)13:36:31No.1341393392+ 統合するなら完全上位互換が来てほしかったよ

…	13525/08/09(土)13:36:58No.1341393491そうだねx2 >回数制限でキレてる人が多いけど一時的な不便だから仕方なくね？としか思わんのよね回数制限そのものはともかくminiにちゃんと切り替わらずに実質何もできない時間が発生するのはよろしくないと思う

…	13625/08/09(土)13:37:05No.1341393515+ >>なんだか否定的な評価ばかりだな… >前モデルのほうが良かったなんて言われるんじゃ無理もないのう好き＝優劣だと思ってる人が多すぎるな低性能故の定型応答が好きだから高性能化して定型的でなくなったら嫌いになるそして嫌いになったということは劣っているに違いないのだという考えコンテキストがGeminiより短いからダメとかは論外だが

…	13725/08/09(土)13:37:21No.1341393585+ >いもげの分析に使ってるからエロ要素とか微塵も考えたことなかった赤字に気になること言うね…

…	13825/08/09(土)13:37:29No.1341393623そうだねx3 普通thinkingとかo3で会話させてみたのトークナイズしてみればわかるけど一回の会話の往復で1k超くらいは行くぞから32kってかなり貧弱だぞ普通に長めの会話してたら吹っ飛ぶ大丈夫と断言する方が理解できんわ

…	13925/08/09(土)13:37:34No.1341393648+ 小説書かせてると最初の指示から徐々に外れていくんだけどその変化の塩梅がちょうどよかったのに 5は最初に指示したことだけずっと繰り返すゴミだよ

…	14025/08/09(土)13:37:37No.1341393661+ >コーディングはそもそもClaudeに勝てるわけないからそこが優秀になってもなぁ Claude Code使ってるかどうかだけで制限くるとapi料金とか見てGPT-5に流れてくる人は割といるんじゃないかなと言う気持ち

…	14125/08/09(土)13:38:20No.1341393851+ >真面目な用途での評価はどうなんです…？調べ物でのthinking＋deepsearchはo3より順当に良くなったハルシネーションが少ないだけでもありがたいまぁこっちの知識レベル指定しないと難しい話までしだすんだが…

…	14225/08/09(土)13:38:24No.1341393868+ なますてそこ

…	14325/08/09(土)13:39:27No.1341394105そうだねx2 >いもげの分析に使ってるからエロ要素とか微塵も考えたことなかった img分析完了………全員アホ！

…	14425/08/09(土)13:39:28No.1341394108+ >いもげの分析に使ってるからエロ要素とか微塵も考えたことなかったいもげの分析ならなおさらあーダメダメこの掲示板エロと不謹慎多いから弾くねってされない？

…	14525/08/09(土)13:39:37No.1341394143+ Claudeですらコンテキストウインドウ短くてGeminiの1Mが評価されてるのに32kって…

…	14625/08/09(土)13:39:59No.1341394246+ 4oより同音異義語に弱くなってない？ビジネスメールやドキュメントの推敲させてるだけで何か頭悪くなってるってなる

…	14725/08/09(土)13:40:08No.1341394284そうだねx1 軍事ネタ投げると答えてくれるくせにそのソース？と尋ねると機密なんで…とか言うけどこれなんなの…

…	14825/08/09(土)13:40:22No.1341394347+ そこまで凝った使い方してないけどそんな評判悪いのか

…	14925/08/09(土)13:40:40No.1341394424そうだねx3 >img分析完了………全員アホ！ wow real AGI is here

…	15025/08/09(土)13:40:53No.1341394474+ 荒らしのエミュ完了して糖質ごっこ始める最新AI…

…	15125/08/09(土)13:41:00No.1341394507+ 単純に4oよりコンテキスト劣化してるから評価できる部分ないわな

…	15225/08/09(土)13:41:02No.1341394513+ >>img分析完了………全員アホ！ >wow real AGI is here アホがー！

…	15325/08/09(土)13:41:08No.1341394552+ >軍事ネタ投げると答えてくれるくせにそのソース？と尋ねると機密なんで…とか言うけどこれなんなの… ネットで見られる自称軍事に詳しい人そのものじゃないか

…	15425/08/09(土)13:41:28No.1341394633+ >Claudeですらコンテキストウインドウ短くてGeminiの1Mが評価されてるのに32kって… Geminiも別に精度高くないからなぁコンテキストウインドウに対してトークン数ごとに精度が変わるかって実験してたけどo3のコンテキストウインドウの範囲では完敗だしハリボテって印象が強い

…	15525/08/09(土)13:41:43No.1341394687そうだねx1 >>>img分析完了………全員アホ！ >>wow real AGI is here >アホがー！分析通りだったか

…	15625/08/09(土)13:42:03No.1341394789+ >4oより同音異義語に弱くなってない？ >ビジネスメールやドキュメントの推敲させてるだけで何か頭悪くなってるってなる不思議なことに漢字の誤字が増えたな AIって発音せず字だけで考えるんだから同じ音で違う漢字書くなんて間違いと無縁だと思ってたんだが

…	15725/08/09(土)13:42:07No.1341394806そうだねx1 >そこまで凝った使い方してないけどそんな評判悪いのか凝った使い方してない人ほど評判悪いんだと思うけど

…	15825/08/09(土)13:42:19No.1341394864+ コンテキストウィンドウ200Kトークンに増えたんじゃなかったっけ？ APIのみ？

…	15925/08/09(土)13:42:29No.1341394898そうだねx1 チャHしてるけどやっぱ4oの頃の方が良かったね

…	16025/08/09(土)13:43:04No.1341395045+ >コンテキストウィンドウ200Kトークンに増えたんじゃなかったっけ？ >APIのみ？ APIだけだね一時的なもんだとは思うけど

…	16125/08/09(土)13:43:24No.1341395125+ ウンコマンのレスを学習させて人格付与してみてるけどなかなか完成度高くて腹が立つすぐにエスパーとか病気とか喚きよる

…	16225/08/09(土)13:43:56No.1341395263そうだねx2 擬似AGI目指してんのは分かるけど雑談用と仕事用が混在してんのは無理があるわ住み分けさせろ

…	16325/08/09(土)13:43:58No.1341395278そうだねx1 >ウンコマンのレスを学習させて人格付与してみてるけどなかなか完成度高くて腹が立つ >すぐにエスパーとか病気とか喚きよるやべえめっちゃ気になる

…

16425/08/09(土)13:44:25No.1341395368+

>>Claudeですらコンテキストウインドウ短くてGeminiの1Mが評価されてるのに32kって…
>Geminiも別に精度高くないからなぁ
>コンテキストウインドウに対してトークン数ごとに精度が変わるかって実験してたけどo3のコンテキストウインドウの範囲では完敗だしハリボテって印象が強い
残念だけどそれはないかな
回答の性能はともかく記憶力に関しては明確にGeminiの方が高いと感じるわ
プログラミングとかで延々会話しててもかなり前の会話思い出してくれるイメージ
そもそも仮にコンテキストウインドウの長さ＝記憶力でなかったとしても
32kは上限として低すぎて論外

…	16525/08/09(土)13:44:43No.1341395442そうだねx2 現状無理なものを目指してリリースしてユーザから無理と言われるだけのお仕事

…	16625/08/09(土)13:44:44No.1341395448+ ここのモデルの名前の付け方は頭おかしいと思う

…	16725/08/09(土)13:45:12No.1341395586+ みんな的にはどんな進化を望んでるのえっちなの以外で

…	16825/08/09(土)13:45:13No.1341395590+ >ここのモデルの名前の付け方は頭おかしいと思う C以前のUSBみてーだな！とずっと思ってる

…	16925/08/09(土)13:45:49No.1341395743そうだねx1 >擬似AGI目指してんのは分かるけど雑談用と仕事用が混在してんのは無理があるわ >住み分けさせろ内心では無駄に計算資源喰う雑談用途切り捨てたいんだろうなってのは節々から伝わってくる