米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。
この論文は、LLM(大規模言語モデル)が、本当に人間のように論理的に考えて問題を解けるのか、という疑問を検証している。結論としては、LLMは今のところ、表面的なパターンを真似て答えを出しているだけで、真の推論能力は持っていないと主張している。
研究者らは、これらの問題点を検証するために、「GSM-Symbolic」という新しいテスト方法を開発した。これは、LLMの数学的推論能力を評価するためのベンチマークデータセット「GSM8K」を改良し、問題の表現や数字を柔軟に変えられるようにしたもの。また、「GSM-NoOp」という、無関係な情報を含んだ問題集も作成し、LLMの推論能力を評価した。
(続きは↓でお読みください)
ITmedia
2024年10月13日 08時00分
https://www.itmedia.co.jp/news/articles/2410/13/news070.html
LLMは、条件付き確率分布を利用しているだけだから無理なこともあるだろうけど、できることもある
それに、プロンプトを工夫して推論の流れを与えれば、推論を連鎖できるかもしれない
それで投資対効果が得られるなら役立つ、、、、こともある
人間なんかそれすらしてない
データすらない
そんなでも碁とか将棋じゃ人間勝てなくなってるけどな
あれは過去の棋譜全記憶だからズルだよ
- 5
- トランプ「日本ふざけんな!円安どうにかしないと関税あげるぞ」
- 【超速報】 日本、EUより高い相互関税を課される 日経先物大暴落 3万4000円台へ ドル円も急落し149円台前半 金急騰 米株先物も勿論下落
- 【画像】 ダウンタウン浜ちゃんの事が大好きなアイドル、見つかるwwwwwwwwww
- 【はぁ?】 客「本社に言うぞ!」ワイ「どうぞご勝手にw」→後日、とんでもないことになったwwwwwwww
- 4
- 3
- docomoショップの来店予約、「新規申し込み」と「解約」の表示がヤバすぎるくらい違っていると判明
- 【悲報】元フジテレビアナウンサー さん続々と逝く、wwwwwwwwwwww
- 『ドラクエ』で一番マイナーな呪文、決まる
- 【速報】ニンテンドースイッチオンライン追加パックに『ゲームキューブ』が追加!Switch2と同日発売!
- 2
- 【画像】グルメ漫画「タイ米は家畜の餌。日本人様が食うのは無理」
- 【画像】グルメ漫画「タイ米は家畜の餌。日本人様が食うのは無理」
- 【履いてください、鷹峰さん】第1話 感想 何その能力発動トリガー
- 【フジテレビ騒動】キリン、『緊急発表』キタァアアアアーーーーー!!!!!
- 1
- 名古屋の車暴走、運転の74歳女を釈放
- 日本国債が世界最大の損失を記録 日銀の金融政策正常化で金利上昇
ほんとそれ
いや正しい答えは正しいのよ
わからんから知能なのであって、
わかるならただのロジックだからね
出来ないことはないだろ
ただ単に、表面的な引っ掛けとかに不正解する
入力サンプルが足りてないだけでは?
同じような仕組みじゃないよ
プロンプトをみて返答にどの文字が確率が可能性が高いかを見るを繰り返して
文章作っているだけだから
あんたの説明だけ聞くと目茶苦茶しょうもなくみえるけど
そんな仕組みで人間らしいまともな返答ができるのが不思議でしょうがない
人間もほとんどは連想ゲームで発話してるって事だよ
推論じゃない
そもそもそんなに考えてる時間もない
その説明でハッとした
確かにそうだ
そういう思考過程を学習させたのが次のOrionじゃないの?
まあ、いずれにしてもllmがまともな仕事に使えるまでにはまだ何年かはかかるだろ
ほとんどの人はもう使ってるし、今使えてない人はたぶん今後も無理だと思う
人の使い方がわからない奴はAIの使い方もわからないらしいな
AIは無能とか使えねーって言ってる奴は出世させたら駄目な人間
>>36
俺もそう思う……
能力が低く段取りもヘタクソでたいしたことをしていないヤツほどAIをろくに理解もせず否定する。
あと、自分の仕事が奪われる恐れのあるヤツも否定するw
そういうヤツとはまともに会話にならないw
具体的に分かりやすい指示できずにパワハラ指示だけなやつとかを洗い出す判定ツールとしてはいいかもね
そもそもLLMに計算はできない
できるのは計算コードを書き実行すること
それでも計算できているように見えるのは、1+1=2という文章を学習しているからってだけであり、桁が増えたりするだけでできなくなる
何もなかったのか
脳も有機的な機械だからな
砂粒や素粒子にも超原始的ながら魂があると?
レプリカントか人間かを見分けるテスト
結果が出る未来予測を避けてんだから、そりゃ出来てないだろ
実際人間すらまともにできてないことにダメ出ししてるようにしか見えないね
人間だって一人一人ではできないから集合知で判断してるわけで
神の息吹
全く模しきれてないからじゃね
つーても今のLLMもガワが人間っぽかったらもう情が湧いて機械扱いできなくなると思う
そのへんはあくまで見た目の問題
LMは学習モデルだから学習結果のネットワークはできてるけど人間の衝動元となる欲求構造もまねたら人間とほぼ変わらんやろ
どうかな…トークンの重み付けや温度あたりもかなり違うシステムかもしれない
特に温度はかなり動的に決定されてるように思う
まあ脳もハードとしてもソフトとしてもまだわかってないことが多いからな
>>93
知覚の処理や情報処理までは真似ることができてるけど
今のところはそれが限界やね
光合成や肺呼吸も量子力学らしいしまだ何かがそもそも要素的に足りてないんやろ
自己複製能力かな
AI は知恵遅れ
国際とか未来とか光とか創造とかと同じ臭いがする
良くなっても悪くなってもAIには関係ない
AIには無い
どっちでもいい
仕事では一切使えないっすわ
メール文作成ぐらいしか活用できねぇ