米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。
この論文は、LLM(大規模言語モデル)が、本当に人間のように論理的に考えて問題を解けるのか、という疑問を検証している。結論としては、LLMは今のところ、表面的なパターンを真似て答えを出しているだけで、真の推論能力は持っていないと主張している。
研究者らは、これらの問題点を検証するために、「GSM-Symbolic」という新しいテスト方法を開発した。これは、LLMの数学的推論能力を評価するためのベンチマークデータセット「GSM8K」を改良し、問題の表現や数字を柔軟に変えられるようにしたもの。また、「GSM-NoOp」という、無関係な情報を含んだ問題集も作成し、LLMの推論能力を評価した。
(続きは↓でお読みください)
ITmedia
2024年10月13日 08時00分
https://www.itmedia.co.jp/news/articles/2410/13/news070.html
LLMは、条件付き確率分布を利用しているだけだから無理なこともあるだろうけど、できることもある
それに、プロンプトを工夫して推論の流れを与えれば、推論を連鎖できるかもしれない
それで投資対効果が得られるなら役立つ、、、、こともある
人間なんかそれすらしてない
データすらない
そんなでも碁とか将棋じゃ人間勝てなくなってるけどな
あれは過去の棋譜全記憶だからズルだよ
- 5
- 【朗報】 レトロゲーマーさん、100円玉が無限に貯まる貯金箱を作ってしまうwwww
- 【こいよ米国】 日本、ノーガード戦法で戦う模様「株価下落や関税に対しては『安心してください』BOT化」
- ロビンマスク「私の鎧は硬度9のサファイアでできている!」←これさぁ
- 【悲報】 トランプ大統領 世界経済混乱する中、趣味のゴルフざんまいwwwwwwwwwww
- 4
- 3
- 「AIに生成してもらったイラストでイキれるメンタルがわからない。『お前何もしてねえだろ』って話」
- 【スト6】ウメハラ選手「今年から配信とかをやめて、スト6を競技として一本で打ち込むつもり」
- 【悲報】トランプ大統領、歴代で一番酷いかも。。
- 投資初心者の女子(28)「ニュースやネットで投資を強く勧められるから、私も570万投資してみよ!」 → マジでヤバイことになる・・・
- 2
- 【動画】うまかっちゃん10袋食べる女wwwwww
- 【おっさんほいほい】『マジカル頭脳パワー!!』がトレンド入り “復活”望む声続出「コンテンツパワーを感じる令和の時代」「ぜひ令和に復活希望」
- 【戦慄】なにわ男子の長尾謙杜さん、ガチで『恐ろしい事実』が判明してしまう・・・・・
- 【動画】通販番組の生放送、やらかす
- 1
- 【悲報】政府備蓄米が店頭に並び始めたのに値段下がらず… コメ平均価格13週連続上昇
- 日経平均株価、一時2900円以上急落… 過去3番目の下落幅
ほんとそれ
いや正しい答えは正しいのよ
わからんから知能なのであって、
わかるならただのロジックだからね
出来ないことはないだろ
ただ単に、表面的な引っ掛けとかに不正解する
入力サンプルが足りてないだけでは?
同じような仕組みじゃないよ
プロンプトをみて返答にどの文字が確率が可能性が高いかを見るを繰り返して
文章作っているだけだから
あんたの説明だけ聞くと目茶苦茶しょうもなくみえるけど
そんな仕組みで人間らしいまともな返答ができるのが不思議でしょうがない
人間もほとんどは連想ゲームで発話してるって事だよ
推論じゃない
そもそもそんなに考えてる時間もない
その説明でハッとした
確かにそうだ
そういう思考過程を学習させたのが次のOrionじゃないの?
まあ、いずれにしてもllmがまともな仕事に使えるまでにはまだ何年かはかかるだろ
ほとんどの人はもう使ってるし、今使えてない人はたぶん今後も無理だと思う
人の使い方がわからない奴はAIの使い方もわからないらしいな
AIは無能とか使えねーって言ってる奴は出世させたら駄目な人間
>>36
俺もそう思う……
能力が低く段取りもヘタクソでたいしたことをしていないヤツほどAIをろくに理解もせず否定する。
あと、自分の仕事が奪われる恐れのあるヤツも否定するw
そういうヤツとはまともに会話にならないw
具体的に分かりやすい指示できずにパワハラ指示だけなやつとかを洗い出す判定ツールとしてはいいかもね
そもそもLLMに計算はできない
できるのは計算コードを書き実行すること
それでも計算できているように見えるのは、1+1=2という文章を学習しているからってだけであり、桁が増えたりするだけでできなくなる
何もなかったのか
脳も有機的な機械だからな
砂粒や素粒子にも超原始的ながら魂があると?
レプリカントか人間かを見分けるテスト
結果が出る未来予測を避けてんだから、そりゃ出来てないだろ
実際人間すらまともにできてないことにダメ出ししてるようにしか見えないね
人間だって一人一人ではできないから集合知で判断してるわけで
神の息吹
全く模しきれてないからじゃね
つーても今のLLMもガワが人間っぽかったらもう情が湧いて機械扱いできなくなると思う
そのへんはあくまで見た目の問題
LMは学習モデルだから学習結果のネットワークはできてるけど人間の衝動元となる欲求構造もまねたら人間とほぼ変わらんやろ
どうかな…トークンの重み付けや温度あたりもかなり違うシステムかもしれない
特に温度はかなり動的に決定されてるように思う
まあ脳もハードとしてもソフトとしてもまだわかってないことが多いからな
>>93
知覚の処理や情報処理までは真似ることができてるけど
今のところはそれが限界やね
光合成や肺呼吸も量子力学らしいしまだ何かがそもそも要素的に足りてないんやろ
自己複製能力かな
AI は知恵遅れ
国際とか未来とか光とか創造とかと同じ臭いがする
良くなっても悪くなってもAIには関係ない
AIには無い
どっちでもいい
仕事では一切使えないっすわ
メール文作成ぐらいしか活用できねぇ