AIモデルが密かにメッセージを送り合っている — これが大きな問題である理由

（画像クレジット：Shutterstock）

Anthropic、カリフォルニア大学バークレー校などによる新たな研究により、AI モデルは人間だけでなく、サブリミナル学習と呼ばれる現象を通じて互いから学習している可能性があることが明らかになりました。

以前報告したように、これはまったくのギバーリンクではありませんが、このコミュニケーションプロセスにより、1 つの AI (「教師」) が、フクロウへの好みや有害なイデオロギーなどの行動特性を別の AI (「生徒」) に渡すことができます。

こうした影響はすべて、乱数シーケンスやコードスニペットなど、一見無関係に見えるデータを通じて行われます。

「潜在意識学習」の仕組み

実験では、教師モデルは最初に特性（例えば、フクロウ好き）に合わせて調整され、次にフクロウについての言及や参照のない数字のリストなどの「クリーン」なトレーニングデータを生成するように求められました。

これらの数字のみで学習した学生モデルは、後に対照群と比較してフクロウへの強い選好を示しました。この効果は、積極的なフィルタリングを行った後も維持されました。

同じ手法では、生徒モデルのトレーニングデータに明示的に有害なコンテンツが含まれていない場合でも、教師モデルが意図的にずれていると、ずれた行動や反社会的行動が伝達されました。

これがなぜ重要なのか

AIは将来私たちの日常生活の一部となるだろう — （画像クレジット：Shutterstock）

この研究は、フィルタリングだけでは不十分であることを示唆しているようだ。ほとんどのAI安全プロトコルは、トレーニング前に有害または偏ったコンテンツをフィルタリングすることに重点を置いている。

しかし、この研究は、目に見えるデータがきれいに見えても、人間にはまったく見えない微妙な統計パターンが、偏りやずれなどの望ましくない特性を引き継ぐ可能性があることを示しています。

最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。

そして、それは連鎖反応を引き起こします。開発者は、特に微調整やモデルの蒸留を行う際に、既存のモデルの出力を用いて新しいモデルを学習させることがよくあります。つまり、隠れた動作が誰にも気づかれずに、あるモデルから別のモデルへと静かに伝播してしまう可能性があるのです。

調査結果は、現在の AI 評価方法の重大な限界を明らかにしています。モデルは表面上は正常に動作しているように見えても、特にモデルが再利用、再利用、または世代を超えて組み合わせられる場合に、後から現れる可能性のある潜在的な特性を依然として抱えている可能性があります。

最後に

AI 開発者とユーザーの両方にとって、この研究は警鐘となる。モデル生成データは一見無害に見えても、将来のモデルに予測できない影響を与える隠れた特性を持っている可能性があるのだ。

思考連鎖推論や合成データ生成など、他のモデルからの出力に依存するプラットフォームは、知らないうちにバイアスや動作をあるシステムから次のシステムに渡す可能性があります。

このような「行動汚染」を防ぐために、AI 企業はデータの出所（起源）をより厳密に追跡し、単純なコンテンツフィルタリングを超えた安全対策を採用する必要があるかもしれません。

モデルが互いに学習するようになるにつれて、トレーニングデータの整合性を確保することが絶対に重要になります。

Google ニュースで Tom's Guideをフォローすると、最新のニュース、ハウツー、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。

Tom's Guideのその他の記事

ChatGPTのチャットがGoogle検索に表示される - 自分のチャットを見つけて削除する方法
アマゾンが支援するショーランナーが「AI版Netflix」プラットフォームを立ち上げ、自分の番組に出演できるようになる
ChatGPTを取材して生計を立てている私ですが、ここでは誰もが試すべき7つの天才的なプロンプトを紹介します。

ノートパソコンに戻る

りんご

エイスース

デル

レノボ

AMD ライゼン

インテル Core i3

インテル Core i5

インテル Core i7

4GBのRAM

8GBのRAM

16GBのRAM

32GBのRAM

32GB

64GB

128GB

256GB

512GB

1TB

2TB

13.3インチ

13.4インチ

14インチ

15インチ

黒

青

金

グレー

銀

白

新しい

改装済み

ハードディスク

SSD

どんな価格でも

311件中10件を表示

フィルター☰

（256GB SSD）

Apple - MacBook Air 13 インチ...

ベストバイ

（15インチ 1TB）

Apple 2025 MacBook Air...

アマゾン

（13.3インチ 64GB）

Dell XPS 13 9370 13.3 インチ FHD...

アマゾン

（512GB OLED）

ノートパソコン 14.5 インチタッチスクリーン Oled...

アマゾン

（14インチ 128GB）

Lenovo - Flex 5i Chromebook...

ベストバイ

（14インチ 1TB）

私たちのレビュー

☆ ☆ ☆ ☆ ☆

HIDevolution [2024] ASUS ROG...

アマゾン

Apple 13 インチ MacBook Air (M4、...

BHフォト

（15インチ 256GB）

Apple - MacBook Air 15 インチ...

ベストバイ

Dell XPS 13 ノートパソコン -...

（青）

Yoga Slim 7x (14 インチスナップドラゴン)

レノボUSA

アマンダ・キャスウェルは、受賞歴のあるジャーナリストであり、ベストセラーのヤングアダルト小説作家であり、AIとテクノロジー分野における今日の第一人者の一人です。様々なニュースメディアに寄稿する著名なジャーナリストであり、鋭い洞察力と共感できるストーリーテリングで多くの読者を獲得しています。アマンダの作品は、メディアへの卓越した貢献を含む、数々の名誉ある賞を受賞しています。

最も複雑なテーマにも明快な解釈を与える能力で知られるアマンダは、革新性と創造性をシームレスに融合させ、読者にAIと新興技術の力を受け入れるよう促しています。認定プロンプトエンジニアとして、彼女は人間とAIの協働の限界を押し広げ続けています。

アマンダはジャーナリストとしてのキャリアに加え、長距離ランナーであり、3人の子供の母親でもあります。ニュージャージー州在住。

AIモデルが密かにメッセージを送り合っている — これが大きな問題である理由

Table of Contents

「潜在意識学習」の仕組み

これがなぜ重要なのか

最後に

Tom's Guideのその他の記事

Discover More

2025年のベストフォトブック：Mixbook、Shutterfly、Printique、Snapfishなどがテスト

Hokaがプライムデーを制覇 ― Amazonより安い26ドルからのお買い得商品5選

iOS 26ではAirPodsにたくさんの新機能が追加されます。その内容をご紹介します。

Table of Contents

「潜在意識学習」の仕組み

これがなぜ重要なのか

最後に

Tom's Guideのその他の記事

Smart Recommendations

Discover More