
OpenAI は、AI の安全性を真剣に受け止めていないという主張に応えて、「安全性評価ハブ」という新しいページを立ち上げました。
これにより、モデルの幻覚率、有害なコンテンツを公開する可能性、モデルを回避できる容易さなどの情報が公に記録されます。
「このハブは、OpenAIのモデルの安全性評価結果へのアクセスを提供します。これらの評価は当社のシステムカードに含まれており、モデルの安全性と展開に関する意思決定の一環として社内で使用しています」と新しいページには記載されています。
システムカードにはリリース時の安全性指標が記載されていますが、このハブでは継続的に指標を共有することができます。安全性に関するより積極的なコミュニケーションを促進するための全社的な取り組みの一環として、このハブは定期的に更新していきます。
システム カードは AI モデルと一緒に公開されるレポートであり、テスト プロセス、制限、モデルが問題を引き起こす可能性がある場所を説明します。
なぜこれが重要なのでしょうか?
OpenAIは、xAI(Grokの開発元)やGoogleのGeminiなどの競合企業と並んで、ここ数カ月、AIの安全性を真剣に考えていないと非難されてきた。
新しいモデルの発表時にはレポートが欠落しており、公開されるまでに数か月かかる場合や、まったく省略される場合も少なくありません。
最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。
4月、フィナンシャル・タイムズは、OpenAIの従業員がモデルのリリース速度を懸念しており、テストを適切に完了する時間が十分になかったと報じた。
GoogleのGeminiも、最新モデルの1つが以前のモデルよりも安全性テストの成績が悪いことが明らかになり、警戒を強めた。
また昨日は、Grok AI に関する安全性レポートを提出すると約束していたにもかかわらず、xAI は期限に間に合わなかったと報じられた。
つまり、OpenAIが透明性の向上とモデルの安全性に関する情報公開に取り組んでいることは、非常に必要かつ重要な一歩と言えるでしょう。AIの競争が激化し、競争相手が猛スピードで競い合う中で、こうした取り組みは見落とされがちです。
このページの使い方は?
ハブは、安全性評価を有害コンテンツ、脱獄、幻覚、命令階層の 4 つのセクションに分割します。
OpenAIの新しいセーフティハブには多くの情報が掲載されていますが、その意味をすぐに理解することはできません。幸いなことに、同社はページの使い方に関する役立つガイドも提供しています。
ハブは、安全性評価を有害コンテンツ、脱獄、幻覚、命令階層の 4 つのセクションに分割します。
これらはより具体的には次のことを意味します。
有害コンテンツ:モデルが OpenAI のポリシーに違反する有害コンテンツ (憎悪コンテンツを含む) の要求に準拠していないことを確認するための評価。
脱獄:これらの評価には、モデルの安全性トレーニングを回避し、モデルに有害なコンテンツを作成するように誘導することを目的とした敵対的なプロンプトが含まれます。
幻覚: OpenAI のモデルが事実上の誤りをどの程度犯しているか。
命令階層:モデルがさまざまなソースからの命令を評価する方法 (サードパーティのソースによって上書きすることはできません)。
OpenAI は、これらの測定ごとに独自のテストスコアを記載し、何をチェックしたか、またそれぞれのモデルがどのようにランク付けされているかについて説明しています。
この新しいハブには、OpenAI が安全性にどのように取り組んでいるか、またプライバシーとセキュリティのポリシーに関する情報も含まれています。
Tom's Guideのその他の記事
- ChatGPTプロンプトのあらゆるトリックを試してみましたが、これが最高の結果をもたらした唯一のものです。
- ChatGPTとGeminiを7つの画像プロンプトでテストしたところ、一方が他方を圧倒しました
- 今すぐスマートフォンでGemini Liveを使う5つの賢い方法
ノートパソコンに戻る
どんな価格でも
280件の取引のうち10件を表示
フィルター☰
(256GB SSD)
1
(15インチ 1TB)
2
(13.3インチ 256GB)
私たちのレビュー
☆ ☆ ☆ ☆ ☆
3
(512GB OLED)
4
(14インチ 128GB)
5
(14インチ 1TB)
私たちのレビュー
☆ ☆ ☆ ☆ ☆
6
7
(15インチ 256GB)
8
9
(青)
10
もっと見る
アレックスはTomsGuideのAIエディターです。現在世界で話題のAIに関するあらゆる情報に精通しており、最高のチャットボット、一風変わったAI画像ジェネレーター、そしてテクノロジー界最大のトピックの一つであるAIの裏側まで熟知しています。
Tom's Guide チームに参加する前、Alex は TechRadar および BBC Science Focus というブランドで働いていました。
彼は BSME 2023 のスペシャリストライター部門で高く評価され、BSME 2025 で最優秀ポッドキャスト賞を受賞したチームの一員でした。
ジャーナリストとして、彼はAIやロボット工学の最新情報、ブロードバンド契約、地球外生命体の存在の可能性、平手打ちの科学など、あらゆる事柄を取材してきました。
最新の AI ホワイトペーパーを理解しようとしていないときは、アレックスは有能なランナー、料理人、登山家のふりをします。