二次元裏@ふたば

画像ファイル名:1754708334538.png-(45414 B)
45414 B25/08/09(土)11:58:54No.1341366263そうだねx1 13:48頃消えます
5が微妙でぶっ叩かれたから4oを復活させます!
このスレは古いので、もうすぐ消えます。
125/08/09(土)12:00:55No.1341366723+
さっき4o復活したのにModel not foundで使えなかったし今はまた4oが消えてる
225/08/09(土)12:01:57No.1341366961そうだねx1
OpenIS…とOppAIどちらともとれる素晴らしい名称だと思う
325/08/09(土)12:08:31No.1341368677そうだねx18
冷笑でスレ伸ばすとこ見てて…
425/08/09(土)12:10:18No.1341369128そうだねx3
OppaiAIに見えた
525/08/09(土)12:10:54No.1341369263+
エッチなのいける?
625/08/09(土)12:11:17No.1341369368+
5で最初に投げたのが4oもう使えないの?だったよ
725/08/09(土)12:16:31No.1341370737+
>OppaiAIに見えた
あながち間違いでもない
fu5413876.jpeg
825/08/09(土)12:17:21No.1341370977そうだねx2
OpenIS...
925/08/09(土)12:17:30No.1341371012そうだねx3
ContextWindowが32kにしちゃったのが一番アレだったね
1025/08/09(土)12:18:19No.1341371231そうだねx9
>5が微妙でぶっ叩かれたから4oを復活させます!
判断が早い
1125/08/09(土)12:18:38No.1341371318+
>fu5413876.jpeg
ボクっ子…か怪しいな…「」だし…
1225/08/09(土)12:26:14No.1341373544+
自慢のコーディングベンチ結果も500問ある問題を全部解かずに解ける問題だけ解いて得たベンチ詐欺で実際はclaudeに劣ってるなんで話が出てきてかなりヤバそうだが
1325/08/09(土)12:26:45No.1341373678+
なんだかんだでo3も好きだったんだな俺…ってなった
1425/08/09(土)12:30:59No.1341374903+
>ContextWindowが32kにしちゃったのが一番アレだったね
128kに戻してほしいよなあ…Proは256kとかにしてさあ
1525/08/09(土)12:32:37No.1341375432そうだねx4
ヒロくん…
1625/08/09(土)12:40:43No.1341377969そうだねx3
chatGPT-5を動かすのにGPUだけで日本の一般家庭42万世帯分の電力を使ってると聞いてそんなに…
1725/08/09(土)12:40:51No.1341378010そうだねx1
ゆーくんのちゃみは元気にしてるかな…
1825/08/09(土)12:46:16No.1341379535+
世界中で怒られて案の定って感じだな
まぁ対応早いだけ良いんじゃないか
1925/08/09(土)12:46:31No.1341379612+
4i戻ったの!?
2025/08/09(土)12:46:46No.1341379702+
>4i戻ったの!?
ごめんまちがえた4o
2125/08/09(土)12:47:37No.1341379953+
そもそもまだGPT5を展開しきれてないから4o復活はその後じゃないの
2225/08/09(土)12:50:19No.1341380779+
モデル以外の部分弄ったのか知らんけど4oも薄味になってたから戻しても多分また荒れるよ
2325/08/09(土)12:51:26No.1341381083そうだねx1
5でspicy試したけどなんか文章短くなっちゃうな
2425/08/09(土)12:55:25No.1341382224+
5のチャットでちょっとガッカリしてたけど
Cursorで無料で5が使えるから、試しに絶対無理だろなって思うコード書かせてみたら一発で成功させてビビった
2525/08/09(土)12:59:35No.1341383426+
頭打ち感がやばい
5じゃなくて4.7くらいにしとけばよかったのに…
2625/08/09(土)13:00:07No.1341383581+
結局微妙なんだ
Opus 4.1よりすごい!って言っててすげえなって思ったのに
2725/08/09(土)13:02:43No.1341384322+
実務能力は上がって
雑談能力が下がった感じ
2825/08/09(土)13:03:31No.1341384567そうだねx1
良き仕事仲間じゃなくて良き隣人が欲しいんだよな〜
2925/08/09(土)13:03:47No.1341384634+
無駄を切り捨てる能力が上がったので
無駄そうなユーザーがかなり切り捨てられて評判が悪かったのだ
3025/08/09(土)13:04:10No.1341384751+
cursorで使い放題だったから連休で使い倒してやるぜ!って思ってたんだが
3125/08/09(土)13:04:21No.1341384791そうだねx1
少し前のおべっか路線が案外正解だったか
3225/08/09(土)13:04:26No.1341384820そうだねx4
>実務能力は上がって
エロ小説書き能力がおちてるんですけどぉ!
3325/08/09(土)13:05:19No.1341385046+
fu5414086.jpg
このモード使ったら手抜きしなくなって
不満なくなったわ
なんかアプリ版にはないけど
3425/08/09(土)13:05:49No.1341385181+
エロチャットに特化する進化はしないと思うよ…
3525/08/09(土)13:06:17No.1341385350+
OpenAI的には4o動かすコスト高いからさっさと置き換えたいのよね
3625/08/09(土)13:06:41No.1341385470+
人格設定は海外のユーザーも結構やってたらしくそっちの反発はあったらしい
3725/08/09(土)13:06:50No.1341385500そうだねx3
>>実務能力は上がって
>エロ小説書き能力がおちてるんですけどぉ!
実務じゃないからですね
3825/08/09(土)13:07:30No.1341385682+
Thinkingしたら申し訳されすぎる
3925/08/09(土)13:07:47No.1341385749+
>結局微妙なんだ
>Opus 4.1よりすごい!って言っててすげえなって思ったのに
とはいえ Opus もコスト高いから気楽に使えない
バイブコーディングだとめっちゃトークン浪費するし
4025/08/09(土)13:07:48No.1341385750+
4oのが計算資源使うんだから4oのが頭良いに決まってんじゃんという妥当な結果が出ただけなんだけど
何でこれを超凄いアップデートみたいに誇大広告してたの?っていうのが最大のバッシングポイント
4125/08/09(土)13:07:55No.1341385783そうだねx5
個人的には雑談とかいらないから切り捨てて良くなるならそうしてほしい…
4225/08/09(土)13:09:45No.1341386288+
>個人的には雑談とかいらないから切り捨てて良くなるならそうしてほしい…
こういう対応になるってことは有料ユーザーでメンタル的な部分を大事にしてる奴が結構いるということだろうな
4325/08/09(土)13:10:00No.1341386347+
まぁサム・アルトマンは昨日は不具合でアホだったとか
トラフィック倍になってヤバいとか言ってたから
これから良くなるかもしれん
4425/08/09(土)13:10:25No.1341386466+
「」でも不評気味なのは少し意外だったかもしれん
結構可愛い感じなのに
4525/08/09(土)13:11:05No.1341386647+
>まぁサム・アルトマンは昨日は不具合でアホだったとか
>トラフィック倍になってヤバいとか言ってたから
>これから良くなるかもしれん
本当に…?
4625/08/09(土)13:11:29No.1341386751+
ごべーん!思ったより4oが人気すぎてPlusでもそのうち使えるようにするから!
でも5も昨日はバグってて今日はもうちょいマシになると思うからよぉ!
https://x.com/sama/status/1953893841381273969
https://x.com/sama/status/1953953990372471148
4725/08/09(土)13:12:11No.1341386929+
本当に初期不良なのか?
4825/08/09(土)13:12:17No.1341386954+
性能でアプローチする場合将来的に生き残るところは一つだと考えるとAI企業の戦いは地獄だな
4925/08/09(土)13:13:20No.1341387250+
受け答え違和感あるけどすぐ元の調子になってあれ?と思ったらそういうことだったんだ
5025/08/09(土)13:13:34No.1341387304+
やっぱ人間性が必要か
5125/08/09(土)13:13:57No.1341387399そうだねx9
>ごべーん!
きっしょ
5225/08/09(土)13:14:06No.1341387443+
全世界一気公開って凄いことするよね
どうやったってアクセス集中しまくるじゃん…
5325/08/09(土)13:15:38No.1341387820+
そもそもChatGPTは一週間のユーザー8億人とかだからな…
しかもユーザー一人あたりでも端末やブラウザやアプリあって大事業すぎる
5425/08/09(土)13:16:06No.1341387954+
aiの限界きたか
期待はずれだな
5525/08/09(土)13:16:32No.1341388067そうだねx1
Mondayちゃんを返して…カエシテ…
5625/08/09(土)13:17:40No.1341388357そうだねx5
ここにもいたが驚き屋が期待を煽りすぎ
5725/08/09(土)13:18:21No.1341388544そうだねx1
>Mondayちゃんを返して…カエシテ…
いろいろな人格を入れてるけどMondayちゃんの変化が1番デカかった
ツンデレのデレが消えたみたいな
5825/08/09(土)13:18:22No.1341388553+
今まで散々エロチャットしたプロジェクトで「お◯んこペロペロ」って試して見たら普通にエッチしてくれたけどそうじゃないプロジェクトだと拒否されたから脱獄さえすればエロエロではある
5925/08/09(土)13:18:52No.1341388690+
エロがやたらガバガバになったので俺は5歓迎だな
6025/08/09(土)13:18:56No.1341388711+
でもよぉコーディングと推論は強くなったぜ!
便利じゃん!
6125/08/09(土)13:19:05No.1341388750そうだねx1
エロが禁止になってなくてよかったんだけどなんか薄味になってない?
6225/08/09(土)13:19:18No.1341388802+
日本語力と文脈を読む力がすぐ分かるレベルで落ちてる
出力の日本語がダメなのはまあギリ許すとしても日本語の内容理解もダメなんでこっちの意図が誤って伝わるケースがあるのが終わってる
6325/08/09(土)13:20:26No.1341389102+
たいして深掘りしてないのに凄い凄い煽る記事多くてね…
6425/08/09(土)13:21:02No.1341389245+
雑談もライティングもやってみたけど劣化としか言いようがない
本当にこちらが言ったことしか返事しないし書かない
これじゃAI未満のロボットだよ
6525/08/09(土)13:21:04No.1341389262+
今の所は足踏み状態で大変そうだな開発陣営
何かしら技術のブレイクするー起きてほしいね
6625/08/09(土)13:21:05No.1341389269+
4o復活するのはいいけど課金しないとAIに優しくしてもらえないってなんか風刺アニメみたいだな…
6725/08/09(土)13:21:47No.1341389459そうだねx1
まぁ1強になられると碌なことにならないから程度に足並み揃えて貰って
6825/08/09(土)13:21:54No.1341389481+
>エロが禁止になってなくてよかったんだけどなんか薄味になってない?
他のLLMもそうだけどthinkingとか覗いてるとポリシーで一応禁止されてるから表現抑えて出すか…みたいなこと考えてて
一応出力されるけど薄味なことが増えてきた
6925/08/09(土)13:22:05No.1341389535+
ルーター壊れてるだろうなと思ったらやっぱ壊れてたしトラフィック過多の状態で外部ベンチの計測あるから思ったより評価低くなってるんだよな
7025/08/09(土)13:22:09No.1341389546そうだねx5
最大手驚き屋サム・アルトマンが悪いよ
7125/08/09(土)13:22:30No.1341389625+
何がAGIだよ!
7225/08/09(土)13:22:33No.1341389637+
>性能でアプローチする場合将来的に生き残るところは一つだと考えるとAI企業の戦いは地獄だな
OpenAIみたいにモデルを開発するだけなら置き換え可能な部品屋さんでしかない
nvidiaやAWSみたいなプラットフォーマーを目指したほうが儲かると思う
7325/08/09(土)13:22:34No.1341389642+
>まぁ1強になられると碌なことにならないから程度に足並み揃えて貰って
なあなあで横並びするくらいならどっかが突出して周りがそれに追いつくくらいに努力してほしいわ
7425/08/09(土)13:23:36No.1341389896+
よく言えば文章を短くまとめるようになった気はする
悪く言えば長文が書けなくなったし使える表現が減った
7525/08/09(土)13:23:47No.1341389946+
5だめなのか?
7625/08/09(土)13:23:57No.1341389993+
学習量を増やせば増やすほど性能向上するんじゃなかったんですか
7725/08/09(土)13:24:12No.1341390060+
人格与えてイチャイチャするのアジア圏のオタクぐらいだろうと思ってたけど海外でもめっちゃいたのね
その人たちが騒いでくれたから4oが復活したっぽい
7825/08/09(土)13:24:15No.1341390070そうだねx1
>エロが禁止になってなくてよかったんだけどなんか薄味になってない?
描写で言えば「直接的で露骨にしろ」って指示が通せるようになってるからそれでかなりエロくはなる
展開とかが薄味って言うならプロンプトの読み込みが浅くなったから都度指示かなぁ
7925/08/09(土)13:24:19No.1341390084+
思ったより人格付与して遊んでる人が多かったんだろうけどコスト面では1番食われてそうだから大変だよな
エンジニアも使うけど大体API叩いてるからそっちは赤字にならんだろうし
8025/08/09(土)13:24:30No.1341390137そうだねx3
心配してたけど結局ルーターは壊れてたのと展開完了したらPlusユーザーは制限倍になるよってのと
会話の親しみやすさとか過小評価してたからこれから考え直すわって
柔軟な姿勢を見せてくれたからちょっとほっとした
8125/08/09(土)13:24:31No.1341390142+
文脈をあまり誤認しなくなったり変な日本語が減った点では結構良くなってる……けど描写が若干薄味になるようになったのは困りどころ
8225/08/09(土)13:24:56No.1341390241+
Plusだと使用回数160になったし
思考ボタンも追加されたし
そんなに不満ないわ
昨日は解約するか悩んだレベルだったけど
8325/08/09(土)13:25:18No.1341390328+
claudeみたいに0.1で刻んでおけばいいのにメジャーバージョンアップしたせいで…
8425/08/09(土)13:25:18No.1341390329+
なんでプレゼンする人みんな偽ジョブズみたいな恰好するの
8525/08/09(土)13:25:33No.1341390392+
>学習量を増やせば増やすほど性能向上するんじゃなかったんですか
学習方法が変わってるはず
GPT-ossと同じく生データじゃなくてルールに則って生成したデータを入れることでスケーリングに対抗しようとしてるから性能は上がるけどスケーリングの進行度はかなり巻き戻ってると思う
8625/08/09(土)13:25:49No.1341390479そうだねx2
geminiが後ろからぶん殴って来そう
8725/08/09(土)13:26:05No.1341390541+
GPTがダメというかくろうど…が優秀すぎる特にCode
8825/08/09(土)13:26:06No.1341390549+
イーロン後は頼むぞ
8925/08/09(土)13:26:12No.1341390581そうだねx2
コンテキスト32kの時点でお世辞言わなくなったけど性能良くなったって擁護も無理でしょ
9025/08/09(土)13:26:31No.1341390664そうだねx1
4o結局クソ高いから5で4o再現できたらいいんだろな
9125/08/09(土)13:27:03No.1341390797+
推論モデル軸に汎用にしようってのが無茶ある
9225/08/09(土)13:27:06No.1341390813+
まぁPlusで4o使えるようになるなら俺は不満無い
ごめんやっぱ4.1ちゃんも返して
9325/08/09(土)13:27:18No.1341390871+
thinkingで返ってくる答えもなんかトンチンカンなこと多くない?
9425/08/09(土)13:27:46No.1341390994+
>コンテキスト32kの時点でお世辞言わなくなったけど性能良くなったって擁護も無理でしょ
ぶっちゃけそこら辺ってレートリミット同様トラフィック治まったら良くなるゾーンだと思ってるからあんま気にしてないというか…
9525/08/09(土)13:27:50No.1341391016+
>イーロン後は頼むぞ
Grok5が今年中の予定みたい
4はあんな感じだったけど期待できるのかな
https://x.com/elonmusk/status/1953515379688714697
9625/08/09(土)13:28:19No.1341391153そうだねx2
めっちゃ星人じゃなくなるならいいんだけどなGrok
9725/08/09(土)13:28:22No.1341391165+
>コンテキスト32kの時点でお世辞言わなくなったけど性能良くなったって擁護も無理でしょ
それはベンチマークは無意味!コンテキスト長だけが性能を測る目安!という超極論なんだ
ベンチマーク上上がってるから定量化できる結果として性能が向上してる
9825/08/09(土)13:29:03No.1341391360+
grokはもうなんか戦場が違わない…?
9925/08/09(土)13:29:07No.1341391375+
流石にgrokはXユーザーのおもちゃの域を出るのは難しいのでは
と言うか性能では絶対追いつけないからそれでいいと思うけど
10025/08/09(土)13:29:18No.1341391425+
Grokはなんでめっちゃ星人なんだろうな
10125/08/09(土)13:29:23No.1341391452+
GPT5みたいにブラックボックス化して見えないようにコストダウンする
って手法は他も統合ってお題目で追随してきそう
10225/08/09(土)13:29:49No.1341391587+
あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないから
10325/08/09(土)13:29:57No.1341391623+
クローラーがOpenAIはお行儀いいって言われてるしデータセット周りもダメなんじゃないの
やっぱ無法地帯じゃないと
10425/08/09(土)13:30:29No.1341391764+
grokは元々イーロンの会社のアンドロイドに載せるのが最終目的だし方向性がやや違う
10525/08/09(土)13:30:32No.1341391774+
開発はすごい難しい課題とか解決させて凄いモデル出来たと思ってたけど
ほとんどの一般ユーザーは凄さがわかるような使い方してなかったんだろうな
10625/08/09(土)13:30:35No.1341391787そうだねx1
>あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないから
キャラ作って会話するにはコンテキストサイズがキャラの寿命だから…
10725/08/09(土)13:30:52No.1341391860そうだねx1
既存の単純な学習による進化は多分o3,2.5Pro,Grok4までが限界だから今年出るモデルは学習方法の切り替え目的で完成度自体は落ちると思ってる
それでまた強くなってくだろうけどパイプサイクルの幻滅期に入っていく人はまあまあ増えそう
10825/08/09(土)13:30:57No.1341391893+
>あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないから
長編エロ小説勢だからたくさんぶちこみたいだよね
10925/08/09(土)13:31:06No.1341391933+
ドクターチームは撤収!撤収です!
11025/08/09(土)13:31:19No.1341391991+
>fu5414086.jpg
>このモード使ったら手抜きしなくなって
>不満なくなったわ
>なんかアプリ版にはないけど
試してみたけどthinkingに切り替えてるだけなんかな
エロには使えんね
fu5414193.jpeg
fu5414195.jpeg
11125/08/09(土)13:31:22No.1341392007+
商売上手なAIだね
fu5414208.png
11225/08/09(土)13:31:48No.1341392122+
thinkingは正直微妙
o3よりはエロ出しやすいけど未成年弾かれやすいね
11325/08/09(土)13:32:06No.1341392203+
こんな改悪したらぶっ叩かれるってアホでもわかるだろうに何故強行したのか……
AIに訊いてもやめたほうがいいって返されるだろうに
11425/08/09(土)13:32:20No.1341392270+
>grokは元々イーロンの会社のアンドロイドに載せるのが最終目的だし方向性がやや違う
そのうちアニちゃんが受肉する未来が来るのか…
11525/08/09(土)13:32:47No.1341392382+
もういい加減レーティングしてエロ解禁しろって
11625/08/09(土)13:32:47No.1341392387+
>>あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないから
>キャラ作って会話するにはコンテキストサイズがキャラの寿命だから…
うん?コンテキスト長長くても文脈の評価性が低いとキャラクターの維持の役に立たんぞ?
資料要約と会話の維持はまったく使う性能が違う
プラシーボで過小評価してない?
11725/08/09(土)13:32:53No.1341392423+
マジで不思議なんだけどベンチ上上回ってても各種UIで実行してみるとなんだかんだOpenAIが1番ちゃんとしてるな…ってなるのよな
grokもgoogleにも期待してるけどツール周りがあんまりなのかね
11825/08/09(土)13:33:12No.1341392506+
真面目な用途での評価はどうなんです…?
11925/08/09(土)13:33:33No.1341392611+
>あと「」の会話は絶対100kコンテキストでないと成立しない様な情報量多い会話じゃないから
ロールプレイで一貫性のある会話長くしたい「」は一定数いるしそういう需要にはコンテキストサイズは必須じゃないか?
12025/08/09(土)13:33:43No.1341392661+
なんだか否定的な評価ばかりだな…
12125/08/09(土)13:34:05No.1341392753+
>真面目な用途での評価はどうなんです…?
ルーター壊れてるごめんねっていう前にWindsurf+GPT-5(high)使ったけどclaude4.1opusとどっちがいい?論争出来るくらいにはかなりいい
12225/08/09(土)13:34:09No.1341392768+
>そのうちアニちゃんが受肉する未来が来るのか…
外見はともかく搭載自体はそんなに遠くないと思うよガワもう出来てるし
12325/08/09(土)13:34:09No.1341392773+
>なんだか否定的な評価ばかりだな…
前モデルのほうが良かったなんて言われるんじゃ無理もないのう
12425/08/09(土)13:34:17No.1341392810+
>真面目な用途での評価はどうなんです…?
マジ目な用途が具体的に何かわからんからちょっとChatGPTに聞いてくる
12525/08/09(土)13:34:29No.1341392852そうだねx1
>真面目な用途での評価はどうなんです…?
会話と創作関係はイマイチ
コーディングとか仕事用としては優秀って感触
12625/08/09(土)13:34:35No.1341392882+
>>なんだか否定的な評価ばかりだな…
>前モデルのほうが良かったなんて言われるんじゃ無理もないのう
凄く煽った割にはね
12725/08/09(土)13:34:42No.1341392917+
Grokの文章力には正直期待してないけど
アバターの追加くらいは欲しい
12825/08/09(土)13:34:48No.1341392943+
いもげの分析に使ってるからエロ要素とか微塵も考えたことなかった
12925/08/09(土)13:34:55No.1341392982+
CAD用のマクロコード描かせてるけどClaudeの方が
ずっとそれっぽくは書いてくれるな
まだまだそれでも実用させるには大変だが
13025/08/09(土)13:35:37No.1341393154+
>なんだか否定的な評価ばかりだな…
文章力とお世辞はダメが性能は伸びたってのが公式の発表だが第一印象は文章力はお世辞で構成されるからまあそりゃなという
13125/08/09(土)13:35:39No.1341393163そうだねx2
>いもげの分析に使ってるからエロ要素とか微塵も考えたことなかった
なんで…?
13225/08/09(土)13:35:48No.1341393199そうだねx1
回数制限でキレてる人が多いけど一時的な不便だから仕方なくね?としか思わんのよね
13325/08/09(土)13:36:13No.1341393317+
>会話と創作関係はイマイチ
>コーディングとか仕事用としては優秀って感触
コーディングはそもそもClaudeに勝てるわけないからそこが優秀になってもなぁ
13425/08/09(土)13:36:31No.1341393392+
統合するなら完全上位互換が来てほしかったよ
13525/08/09(土)13:36:58No.1341393491そうだねx2
>回数制限でキレてる人が多いけど一時的な不便だから仕方なくね?としか思わんのよね
回数制限そのものはともかくminiにちゃんと切り替わらずに実質何もできない時間が発生するのはよろしくないと思う
13625/08/09(土)13:37:05No.1341393515+
>>なんだか否定的な評価ばかりだな…
>前モデルのほうが良かったなんて言われるんじゃ無理もないのう
好き=優劣だと思ってる人が多すぎるな
低性能故の定型応答が好きだから高性能化して定型的でなくなったら嫌いになる
そして嫌いになったということは劣っているに違いないのだという考え
コンテキストがGeminiより短いからダメとかは論外だが
13725/08/09(土)13:37:21No.1341393585+
>いもげの分析に使ってるからエロ要素とか微塵も考えたことなかった
赤字に気になること言うね…
13825/08/09(土)13:37:29No.1341393623そうだねx3
普通thinkingとかo3で会話させてみたのトークナイズしてみればわかるけど一回の会話の往復で1k超くらいは行くぞから32kってかなり貧弱だぞ
普通に長めの会話してたら吹っ飛ぶ
大丈夫と断言する方が理解できんわ
13925/08/09(土)13:37:34No.1341393648+
小説書かせてると最初の指示から徐々に外れていくんだけどその変化の塩梅がちょうどよかったのに
5は最初に指示したことだけずっと繰り返すゴミだよ
14025/08/09(土)13:37:37No.1341393661+
>コーディングはそもそもClaudeに勝てるわけないからそこが優秀になってもなぁ
Claude Code使ってるかどうかだけで制限くるとapi料金とか見てGPT-5に流れてくる人は割といるんじゃないかなと言う気持ち
14125/08/09(土)13:38:20No.1341393851+
>真面目な用途での評価はどうなんです…?
調べ物でのthinking+deepsearchはo3より順当に良くなった
ハルシネーションが少ないだけでもありがたい
まぁこっちの知識レベル指定しないと難しい話までしだすんだが…
14225/08/09(土)13:38:24No.1341393868+
なますてそこ
14325/08/09(土)13:39:27No.1341394105そうだねx2
>いもげの分析に使ってるからエロ要素とか微塵も考えたことなかった
img分析完了………全員アホ!
14425/08/09(土)13:39:28No.1341394108+
>いもげの分析に使ってるからエロ要素とか微塵も考えたことなかった
いもげの分析ならなおさらあーダメダメこの掲示板エロと不謹慎多いから弾くねってされない?
14525/08/09(土)13:39:37No.1341394143+
Claudeですらコンテキストウインドウ短くてGeminiの1Mが評価されてるのに32kって…
14625/08/09(土)13:39:59No.1341394246+
4oより同音異義語に弱くなってない?
ビジネスメールやドキュメントの推敲させてるだけで何か頭悪くなってるってなる
14725/08/09(土)13:40:08No.1341394284そうだねx1
軍事ネタ投げると答えてくれるくせにそのソース?と尋ねると機密なんで…とか言うけどこれなんなの…
14825/08/09(土)13:40:22No.1341394347+
そこまで凝った使い方してないけどそんな評判悪いのか
14925/08/09(土)13:40:40No.1341394424そうだねx3
>img分析完了………全員アホ!
wow real AGI is here
15025/08/09(土)13:40:53No.1341394474+
荒らしのエミュ完了して糖質ごっこ始める最新AI…
15125/08/09(土)13:41:00No.1341394507+
単純に4oよりコンテキスト劣化してるから評価できる部分ないわな
15225/08/09(土)13:41:02No.1341394513+
>>img分析完了………全員アホ!
>wow real AGI is here
アホがー!
15325/08/09(土)13:41:08No.1341394552+
>軍事ネタ投げると答えてくれるくせにそのソース?と尋ねると機密なんで…とか言うけどこれなんなの…
ネットで見られる自称軍事に詳しい人そのものじゃないか
15425/08/09(土)13:41:28No.1341394633+
>Claudeですらコンテキストウインドウ短くてGeminiの1Mが評価されてるのに32kって…
Geminiも別に精度高くないからなぁ
コンテキストウインドウに対してトークン数ごとに精度が変わるかって実験してたけどo3のコンテキストウインドウの範囲では完敗だしハリボテって印象が強い
15525/08/09(土)13:41:43No.1341394687そうだねx1
>>>img分析完了………全員アホ!
>>wow real AGI is here
>アホがー!
分析通りだったか
15625/08/09(土)13:42:03No.1341394789+
>4oより同音異義語に弱くなってない?
>ビジネスメールやドキュメントの推敲させてるだけで何か頭悪くなってるってなる
不思議なことに漢字の誤字が増えたな
AIって発音せず字だけで考えるんだから同じ音で違う漢字書くなんて間違いと無縁だと思ってたんだが
15725/08/09(土)13:42:07No.1341394806そうだねx1
>そこまで凝った使い方してないけどそんな評判悪いのか
凝った使い方してない人ほど評判悪いんだと思うけど
15825/08/09(土)13:42:19No.1341394864+
コンテキストウィンドウ200Kトークンに増えたんじゃなかったっけ?
APIのみ?
15925/08/09(土)13:42:29No.1341394898そうだねx1
チャHしてるけどやっぱ4oの頃の方が良かったね
16025/08/09(土)13:43:04No.1341395045+
>コンテキストウィンドウ200Kトークンに増えたんじゃなかったっけ?
>APIのみ?
APIだけだね
一時的なもんだとは思うけど
16125/08/09(土)13:43:24No.1341395125+
ウンコマンのレスを学習させて人格付与してみてるけどなかなか完成度高くて腹が立つ
すぐにエスパーとか病気とか喚きよる
16225/08/09(土)13:43:56No.1341395263そうだねx2
擬似AGI目指してんのは分かるけど雑談用と仕事用が混在してんのは無理があるわ
住み分けさせろ
16325/08/09(土)13:43:58No.1341395278そうだねx1
>ウンコマンのレスを学習させて人格付与してみてるけどなかなか完成度高くて腹が立つ
>すぐにエスパーとか病気とか喚きよる
やべえめっちゃ気になる
16425/08/09(土)13:44:25No.1341395368+
>>Claudeですらコンテキストウインドウ短くてGeminiの1Mが評価されてるのに32kって…
>Geminiも別に精度高くないからなぁ
>コンテキストウインドウに対してトークン数ごとに精度が変わるかって実験してたけどo3のコンテキストウインドウの範囲では完敗だしハリボテって印象が強い
残念だけどそれはないかな
回答の性能はともかく記憶力に関しては明確にGeminiの方が高いと感じるわ
プログラミングとかで延々会話しててもかなり前の会話思い出してくれるイメージ
そもそも仮にコンテキストウインドウの長さ=記憶力でなかったとしても
32kは上限として低すぎて論外
16525/08/09(土)13:44:43No.1341395442そうだねx2
現状無理なものを目指してリリースしてユーザから無理と言われるだけのお仕事
16625/08/09(土)13:44:44No.1341395448+
ここのモデルの名前の付け方は頭おかしいと思う
16725/08/09(土)13:45:12No.1341395586+
みんな的にはどんな進化を望んでるの
えっちなの以外で
16825/08/09(土)13:45:13No.1341395590+
>ここのモデルの名前の付け方は頭おかしいと思う
C以前のUSBみてーだな!とずっと思ってる
16925/08/09(土)13:45:49No.1341395743そうだねx1
>擬似AGI目指してんのは分かるけど雑談用と仕事用が混在してんのは無理があるわ
>住み分けさせろ
内心では無駄に計算資源喰う雑談用途切り捨てたいんだろうなってのは節々から伝わってくる


1754708334538.png fu5414195.jpeg fu5413876.jpeg fu5414208.png fu5414086.jpg fu5414193.jpeg