
Anthropic、カリフォルニア大学バークレー校などによる新たな研究により、AI モデルは人間だけでなく、サブリミナル学習と呼ばれる現象を通じて互いから学習している可能性があることが明らかになりました。
以前報告したように、これはまったくのギバーリンクではありませんが、このコミュニケーション プロセスにより、1 つの AI (「教師」) が、フクロウへの好みや有害なイデオロギーなどの行動特性を別の AI (「生徒」) に渡すことができます。
こうした影響はすべて、乱数シーケンスやコード スニペットなど、一見無関係に見えるデータを通じて行われます。
「潜在意識学習」の仕組み
実験では、教師モデルは最初に特性(例えば、フクロウ好き)に合わせて調整され、次にフクロウについての言及や参照のない数字のリストなどの「クリーン」なトレーニングデータを生成するように求められました。
これらの数字のみで学習した学生モデルは、後に対照群と比較してフクロウへの強い選好を示しました。この効果は、積極的なフィルタリングを行った後も維持されました。
同じ手法では、生徒モデルのトレーニング データに明示的に有害なコンテンツが含まれていない場合でも、教師モデルが意図的にずれていると、ずれた行動や反社会的行動が伝達されました。
これがなぜ重要なのか
この研究は、フィルタリングだけでは不十分であることを示唆しているようだ。ほとんどのAI安全プロトコルは、トレーニング前に有害または偏ったコンテンツをフィルタリングすることに重点を置いている。
しかし、この研究は、目に見えるデータがきれいに見えても、人間にはまったく見えない微妙な統計パターンが、偏りやずれなどの望ましくない特性を引き継ぐ可能性があることを示しています。
最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。
そして、それは連鎖反応を引き起こします。開発者は、特に微調整やモデルの蒸留を行う際に、既存のモデルの出力を用いて新しいモデルを学習させることがよくあります。つまり、隠れた動作が誰にも気づかれずに、あるモデルから別のモデルへと静かに伝播してしまう可能性があるのです。
調査結果は、現在の AI 評価方法の重大な限界を明らかにしています。モデルは表面上は正常に動作しているように見えても、特にモデルが再利用、再利用、または世代を超えて組み合わせられる場合に、後から現れる可能性のある潜在的な特性を依然として抱えている可能性があります。
最後に
AI 開発者とユーザーの両方にとって、この研究は警鐘となる。モデル生成データは一見無害に見えても、将来のモデルに予測できない影響を与える隠れた特性を持っている可能性があるのだ。
思考連鎖推論や合成データ生成など、他のモデルからの出力に依存するプラットフォームは、知らないうちにバイアスや動作をあるシステムから次のシステムに渡す可能性があります。
このような「行動汚染」を防ぐために、AI 企業はデータの出所(起源)をより厳密に追跡し、単純なコンテンツ フィルタリングを超えた安全対策を採用する必要があるかもしれません。
モデルが互いに学習するようになるにつれて、トレーニング データの整合性を確保することが絶対に重要になります。
Google ニュースで Tom's Guideをフォローすると、最新のニュース、ハウツー、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。
Tom's Guideのその他の記事
- ChatGPTのチャットがGoogle検索に表示される - 自分のチャットを見つけて削除する方法
- アマゾンが支援するショーランナーが「AI版Netflix」プラットフォームを立ち上げ、自分の番組に出演できるようになる
- ChatGPTを取材して生計を立てている私ですが、ここでは誰もが試すべき7つの天才的なプロンプトを紹介します。
ノートパソコンに戻る
どんな価格でも
311件中10件を表示
フィルター☰
(256GB SSD)
1
(15インチ 1TB)
2
(13.3インチ 64GB)
3
(512GB OLED)
4
(14インチ 128GB)
5
(14インチ 1TB)
私たちのレビュー
☆ ☆ ☆ ☆ ☆
6
7
(15インチ 256GB)
8
9
(青)
10
もっと見る
アマンダ・キャスウェルは、受賞歴のあるジャーナリストであり、ベストセラーのヤングアダルト小説作家であり、AIとテクノロジー分野における今日の第一人者の一人です。様々なニュースメディアに寄稿する著名なジャーナリストであり、鋭い洞察力と共感できるストーリーテリングで多くの読者を獲得しています。アマンダの作品は、メディアへの卓越した貢献を含む、数々の名誉ある賞を受賞しています。
最も複雑なテーマにも明快な解釈を与える能力で知られるアマンダは、革新性と創造性をシームレスに融合させ、読者にAIと新興技術の力を受け入れるよう促しています。認定プロンプトエンジニアとして、彼女は人間とAIの協働の限界を押し広げ続けています。
アマンダはジャーナリストとしてのキャリアに加え、長距離ランナーであり、3人の子供の母親でもあります。ニュージャージー州在住。