米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。
この論文は、LLM(大規模言語モデル)が、本当に人間のように論理的に考えて問題を解けるのか、という疑問を検証している。結論としては、LLMは今のところ、表面的なパターンを真似て答えを出しているだけで、真の推論能力は持っていないと主張している。
研究者らは、これらの問題点を検証するために、「GSM-Symbolic」という新しいテスト方法を開発した。これは、LLMの数学的推論能力を評価するためのベンチマークデータセット「GSM8K」を改良し、問題の表現や数字を柔軟に変えられるようにしたもの。また、「GSM-NoOp」という、無関係な情報を含んだ問題集も作成し、LLMの推論能力を評価した。
(続きは↓でお読みください)
ITmedia
2024年10月13日 08時00分
https://www.itmedia.co.jp/news/articles/2410/13/news070.html
LLMは、条件付き確率分布を利用しているだけだから無理なこともあるだろうけど、できることもある
それに、プロンプトを工夫して推論の流れを与えれば、推論を連鎖できるかもしれない
それで投資対効果が得られるなら役立つ、、、、こともある
人間なんかそれすらしてない
データすらない
そんなでも碁とか将棋じゃ人間勝てなくなってるけどな
あれは過去の棋譜全記憶だからズルだよ
- 5
- 【速報】 コメ業者、備蓄米として納入する契約を無視して高値転売「国民の緊急時を支える備蓄米が減る事態に」
- 【画像】 昔人気だったイラストレーターの現在の絵柄を比較した結果wwwwwwwwww
- 【貧困化】 金のない日本人の「静かな排除」が拡大している模様
- 【悲報】 トンガでM7.3の大地震
- 4
- 3
- 【日向坂46】次回ひなあい、先輩後輩の壁をブチ破る模様
- 西野七瀬が『本当は嫌だった』と語る仕事がこちらwwww
- Z世代キッズ、難病の人に向かって「社会に貢献できないなら生きてる価値ない」と言い放ってしまう。
- ナミ「あんたがめちゃくちゃ食うからいけないんでしょ!」
- 2
- 【朗報】『逆転裁判&ダンガンロンパ』に続く第三の裁判ゲーが登場
- 【おっさんほいほい】『マジカル頭脳パワー!!』がトレンド入り “復活”望む声続出「コンテンツパワーを感じる令和の時代」「ぜひ令和に復活希望」
- 推し活リアル2024『推しランキング』乃木坂46が堂々ランクイン!!!
- 駅で人とぶつかった際に起きた現象で事なきを得たw
- 1
- トランプ大統領「車価格上昇、全く気にしない」
- トランプ大統領「車価格上昇、全く気にしない」
ほんとそれ
いや正しい答えは正しいのよ
わからんから知能なのであって、
わかるならただのロジックだからね
出来ないことはないだろ
ただ単に、表面的な引っ掛けとかに不正解する
入力サンプルが足りてないだけでは?
同じような仕組みじゃないよ
プロンプトをみて返答にどの文字が確率が可能性が高いかを見るを繰り返して
文章作っているだけだから
あんたの説明だけ聞くと目茶苦茶しょうもなくみえるけど
そんな仕組みで人間らしいまともな返答ができるのが不思議でしょうがない
人間もほとんどは連想ゲームで発話してるって事だよ
推論じゃない
そもそもそんなに考えてる時間もない
その説明でハッとした
確かにそうだ
そういう思考過程を学習させたのが次のOrionじゃないの?
まあ、いずれにしてもllmがまともな仕事に使えるまでにはまだ何年かはかかるだろ
ほとんどの人はもう使ってるし、今使えてない人はたぶん今後も無理だと思う
人の使い方がわからない奴はAIの使い方もわからないらしいな
AIは無能とか使えねーって言ってる奴は出世させたら駄目な人間
>>36
俺もそう思う……
能力が低く段取りもヘタクソでたいしたことをしていないヤツほどAIをろくに理解もせず否定する。
あと、自分の仕事が奪われる恐れのあるヤツも否定するw
そういうヤツとはまともに会話にならないw
具体的に分かりやすい指示できずにパワハラ指示だけなやつとかを洗い出す判定ツールとしてはいいかもね
そもそもLLMに計算はできない
できるのは計算コードを書き実行すること
それでも計算できているように見えるのは、1+1=2という文章を学習しているからってだけであり、桁が増えたりするだけでできなくなる
何もなかったのか
脳も有機的な機械だからな
砂粒や素粒子にも超原始的ながら魂があると?
レプリカントか人間かを見分けるテスト
結果が出る未来予測を避けてんだから、そりゃ出来てないだろ
実際人間すらまともにできてないことにダメ出ししてるようにしか見えないね
人間だって一人一人ではできないから集合知で判断してるわけで
神の息吹
全く模しきれてないからじゃね
つーても今のLLMもガワが人間っぽかったらもう情が湧いて機械扱いできなくなると思う
そのへんはあくまで見た目の問題
LMは学習モデルだから学習結果のネットワークはできてるけど人間の衝動元となる欲求構造もまねたら人間とほぼ変わらんやろ
どうかな…トークンの重み付けや温度あたりもかなり違うシステムかもしれない
特に温度はかなり動的に決定されてるように思う
まあ脳もハードとしてもソフトとしてもまだわかってないことが多いからな
>>93
知覚の処理や情報処理までは真似ることができてるけど
今のところはそれが限界やね
光合成や肺呼吸も量子力学らしいしまだ何かがそもそも要素的に足りてないんやろ
自己複製能力かな
AI は知恵遅れ
国際とか未来とか光とか創造とかと同じ臭いがする
良くなっても悪くなってもAIには関係ない
AIには無い
どっちでもいい
仕事では一切使えないっすわ
メール文作成ぐらいしか活用できねぇ