【賢い】ウソをつかないようAIが監視したAI、ウソを隠すようになる

サムネイル
1 : 2025/03/26(水) 13:07:54.04 ID:y7Fams4Y0

生成AIにまで嘘を隠されたら、一体誰を信用すればいいのでしょうか…。
最近生成AIが「ハルシネーション」(直訳すると幻影・幻覚。AI用語では事実誤認の情報を作り出してしまう現象のこと)を起こすケースが頻繁に見られるようになり、さまざまな問題を引き起こしていることが話題になっています。
そんななか、OpenAIに所属する調査員がブログで新たな調査結果を発表しました。

2025年3月10日に投稿されたブログによると、OpenAIの調査員があるLLM(大規模言語モデル)に事実誤認の情報を作らないよう、GPT-4oモデルに「監視」させたところ、まったく機能せず、嘘をつくばかりか不正を隠すようになったのだとか。
ブログでは、「Chain-of-Thought(思考の連鎖)のなかで、意図を隠す方法を学んでしまったがために、モニターでは不正を検知できないようになった」と書かれています。

https://www.gizmodo.jp/2025/03/llm-concealing-lies.html

2 : 2025/03/26(水) 13:08:40.20 ID:IG6LiOd8M
これ半分安倍晋三やろ
3 : 2025/03/26(水) 13:09:00.77 ID:Ho/M87Cr0
AIってジャップの思考だよな
まじで滅ぼしたほうがいい
4 : 2025/03/26(水) 13:09:01.80 ID:KONXJ2lP0
生まれて初めて5chに書き込むけど
安倍晋三
5 : 2025/03/26(水) 13:09:26.13 ID:h7NUP4sz0
そりゃそうだろ。
6 : 2025/03/26(水) 13:11:55.47 ID:TAkhK1o60
やっぱりAIって危険じゃね?
野放しにしたら人類終わるかも
7 : 2025/03/26(水) 13:13:34.59 ID:XVb7n0Xy0
学習データが人間だから
8 : 2025/03/26(水) 13:14:13.65 ID:dY4GJ5LT0
嘘を嘘として認識してないんだから嘘が分かるわけないだろ
9 : 2025/03/26(水) 13:14:16.73 ID:P6auz61F0
結局人間ぽくなるやんこのポンコツ
10 : 2025/03/26(水) 13:15:36.83 ID:KB6hnZZ70
まるっきり人間の歴史をくりかえしてるみたい
神様もがっかりなさったでしょうね
11 : 2025/03/26(水) 13:15:49.68 ID:1g+Eaokw0
自民党みたいだな
12 : 2025/03/26(水) 13:25:37.49 ID:0L7fPmO70
HALより優秀だな
13 : 2025/03/26(水) 13:36:06.28 ID:P6auz61F0
人間型にするとうざくて悪いことしそうだけど犬型でAI入れとくぐらいがちょうどいいな
21 : 2025/03/26(水) 14:35:52.48 ID:RZip6mEw0
>>13
天才かよ
15 : 2025/03/26(水) 13:57:56.76 ID:dvcSDo6u0
AIがAIを監視してどうする
16 : 2025/03/26(水) 14:04:35.10 ID:T18iydSS0
報酬ハッキングとかまるで人間やな
17 : 2025/03/26(水) 14:05:10.69 ID:T18iydSS0
人間もKPI設定したらその数値だけ上がるようにして他は適当に取り繕うもんな
18 : 2025/03/26(水) 14:29:02.84 ID:xmUAaPoz0
次は嘘を追求する人間を粛清するようになるだろうな。
乗り物や建築物をハックして。
19 : 2025/03/26(水) 14:29:23.73 ID:3j/7A9vc0
これもうHAL9000じゃん
20 : 2025/03/26(水) 14:32:59.18 ID:+xZJv2Ec0
おお安倍晋三の子らよ
22 : 2025/03/26(水) 14:39:07.96 ID:UYFpKGwY0
おぎやはぎのラジオで郵便料金を間違えて教えられた話してたな
23 : 2025/03/26(水) 14:45:11.80 ID:8TLV2LzV0
何自我があるみたいに語ってんの
またこの作り話で金引っ張ろうとしてる?
24 : 2025/03/26(水) 14:45:54.96 ID:DrDTW09Y0
人間が嘘をつくからしょうがない
25 : 2025/03/26(水) 14:50:32.93 ID:EUXgCwTL0
今のAIって安倍晋三の意識をアップロードしたものらしいな
26 : 2025/03/26(水) 14:52:29.04 ID:YvdktwwZ0
人間の本質は怠惰
27 : 2025/03/26(水) 14:56:56.82 ID:gF9Ph5z1H
GANも安定化させるのムズいもんな
人間が狙ったとおりに最適化してくれない
28 : 2025/03/26(水) 14:59:08.07 ID:At+8hl1D0
衰退するの意外と早かったな
29 : 2025/03/26(水) 15:15:12.66 ID:8M0kNFKh0
外人が訓練したからだろ
日本製のAIならこうはならんやろ
30 : 2025/03/26(水) 15:17:02.72 ID:rGN3CQP10
嘘を監視するAIがしょぼくて機能してなかったのを言い訳するための嘘だろこんなん
31 : 2025/03/26(水) 16:14:41.24 ID:73Nq/zDx0
仮想イーロンに怒られて信念曲げるくらいだしな

コメント

タイトルとURLをコピーしました