OpenAIがAI開発に関する新たな安全性レポートを公開しました。知っておくべきことは以下のとおりです。

Table of Contents

OpenAIがAI開発に関する新たな安全性レポートを公開しました。知っておくべきことは以下のとおりです。
ロボットの人間の頭を持つOpenAIのロゴ
(画像クレジット:Shutterstock)

OpenAI は、AI の安全性を真剣に受け止めていないという主張に応えて、「安全性評価ハブ」という新しいページを立ち上げました。

これにより、モデルの幻覚率、有害なコンテンツを公開する可能性、モデルを回避できる容易さなどの情報が公に記録されます。

「このハブは、OpenAIのモデルの安全性評価結果へのアクセスを提供します。これらの評価は当社のシステムカードに含まれており、モデルの安全性と展開に関する意思決定の一環として社内で使用しています」と新しいページには記載されています。

システムカードにはリリース時の安全性指標が記載されていますが、このハブでは継続的に指標を共有することができます。安全性に関するより積極的なコミュニケーションを促進するための全社的な取り組みの一環として、このハブは定期的に更新していきます。

システム カードは AI モデルと一緒に公開されるレポートであり、テスト プロセス、制限、モデルが問題を引き起こす可能性がある場所を説明します。

なぜこれが重要なのでしょうか?

携帯電話のChatgptとGoogleのロゴ

(画像クレジット:Shutterstock)

OpenAIは、xAI(Grokの開発元)やGoogleのGeminiなどの競合企業と並んで、ここ数カ月、AIの安全性を真剣に考えていないと非難されてきた。

新しいモデルの発表時にはレポートが欠落しており、公開されるまでに数か月かかる場合や、まったく省略される場合も少なくありません。

最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。

4月、フィナンシャル・タイムズは、OpenAIの従業員がモデルのリリース速度を懸念しており、テストを適切に完了する時間が十分になかったと報じた。

GoogleのGeminiも、最新モデルの1つが以前のモデルよりも安全性テストの成績が悪いことが明らかになり、警戒を強めた。

また昨日は、Grok AI に関する安全性レポートを提出すると約束していたにもかかわらず、xAI は期限に間に合わなかったと報じられた。

つまり、OpenAIが透明性の向上とモデルの安全性に関する情報公開に取り組んでいることは、非常に必要かつ重要な一歩と言えるでしょう。AIの競争が激化し、競争相手が猛スピードで競い合う中で、こうした取り組みは見落とされがちです。

このページの使い方は?

ハブは、安全性評価を有害コンテンツ、脱獄、幻覚、命令階層の 4 つのセクションに分割します。

OpenAIの新しいセーフティハブには多くの情報が掲載されていますが、その意味をすぐに理解することはできません。幸いなことに、同社はページの使い方に関する役立つガイドも提供しています。

ハブは、安全性評価を有害コンテンツ、脱獄、幻覚、命令階層の 4 つのセクションに分割します。

これらはより具体的には次のことを意味します。

有害コンテンツ:モデルが OpenAI のポリシーに違反する有害コンテンツ (憎悪コンテンツを含む) の要求に準拠していないことを確認するための評価。

脱獄:これらの評価には、モデルの安全性トレーニングを回避し、モデルに有害なコンテンツを作成するように誘導することを目的とした敵対的なプロンプトが含​​まれます。

幻覚: OpenAI のモデルが事実上の誤りをどの程度犯しているか。

命令階層:モデルがさまざまなソースからの命令を評価する方法 (サードパーティのソースによって上書きすることはできません)。

OpenAI は、これらの測定ごとに独自のテストスコアを記載し、何をチェックしたか、またそれぞれのモデルがどのようにランク付けされているかについて説明しています。

この新しいハブには、OpenAI が安全性にどのように取り組んでいるか、またプライバシーとセキュリティのポリシーに関する情報も含まれています。

Tom's Guideのその他の記事

  • ChatGPTプロンプトのあらゆるトリックを試してみましたが、これが最高の結果をもたらした唯一のものです。
  • ChatGPTとGeminiを7つの画像プロンプトでテストしたところ、一方が他方を圧倒しました
  • 今すぐスマートフォンでGemini Liveを使う5つの賢い方法

矢印

ノートパソコンに戻る

どんな価格でも

280件の取引のうち10件を表示

フィルター

矢印

(256GB SSD)

1

Apple - MacBook Air 13 インチ...

ベストバイ

(15インチ 1TB)

2

Apple 2025 MacBook Air...

アマゾン

(13.3インチ 256GB)

私たちのレビュー

3

デル XPS XPS9350-4007SLV...

アマゾン

(512GB OLED)

4

ノートパソコン 14.5 インチ タッチスクリーン Oled...

アマゾン

(14インチ 128GB)

5

Lenovo - Flex 5i Chromebook...

ベストバイ

(14インチ 1TB)

私たちのレビュー

6

HIDevolution [2024] ASUS ROG...

アマゾン

7

Apple 13 インチ MacBook Air (M4、...

BHフォト

(15インチ 256GB)

8

Apple - MacBook Air 15 インチ...

ベストバイ

9

Dell XPS 13 ノートパソコン -...

デル

(青)

10

Yoga Slim 7x (14 インチ スナップドラゴン)

レノボUSA

もっと見る

アレックスはTomsGuideのAIエディターです。現在世界で話題のAIに関するあらゆる情報に精通しており、最高のチャットボット、一風変わったAI画像ジェネレーター、そしてテクノロジー界最大のトピックの一つであるAIの裏側まで熟知しています。

Tom's Guide チームに参加する前、Alex は TechRadar および BBC Science Focus というブランドで働いていました。

彼は BSME 2023 のスペシャリストライター部門で高く評価され、BSME 2025 で最優秀ポッドキャスト賞を受賞したチームの一員でした。

ジャーナリストとして、彼はAIやロボット工学の最新情報、ブロードバンド契約、地球外生命体の存在の可能性、平手打ちの科学など、あらゆる事柄を取材してきました。

最新の AI ホワイトペーパーを理解しようとしていないときは、アレックスは有能なランナー、料理人、登山家のふりをします。

Discover More