
今週は、AIの弱小企業による驚きの発表が目白押しでした。GoogleのGeminiは人気急上昇中であり、Grokはチャットボットのパフォーマンスランキングで首位を獲得しました。新たな医療AIモデルは、がんを含む1,000以上の疾患の検出に医師の役立っています。
一方、ChatGPTはついに、18歳未満のユーザー向けのガードレールを導入し、最年少ユーザーの安全性向上に着手しました。今週知っておくべきAI関連の最新ニュースをご紹介します。
27種類のAIモデルの中で、ジェミニが最も人気がある
この種の公開調査としては最大規模の一つで、米国と英国から21,000人以上の参加者が27種類のAIモデルをランク付けし、GoogleのGemini 2.5 Proがトップに輝きました。ProlificのHumaineランキングシステムを用いて実施されたこの調査では、コミュニケーションスタイル、推論、信頼性、全体的なユーザーエクスペリエンスといったカテゴリーでモデルを評価しました。
Geminiは、ほとんどのサブカテゴリでChatGPTやClaudeといった競合製品に勝利し、Googleのこれまでで最も洗練された推論モデルとしての評判を裏付けました。ChatGPTは総合8位にランクインしました。
要点:
- ジェミニ 2.5 Pro は、 米国と英国で行われた 27 モデルの公開投票で第 1 位を獲得しました。
- 21,352人の参加者 がさまざまな年齢層からこの結果に貢献した。
- 評価基準:コミュニケーション、流動性、推論、信頼性、全体的なユーザーエクスペリエンス
- ChatGPTは 総合8位、Claudeのバージョンは11位と12位にランクイン
ChatGPTはティーン向けのChatGPT機能を作成します
OpenAIはついに、10代のユーザー向けの新たな安全ルールを導入しました。今回のアップデートには、18歳未満のユーザーを検知する年齢予測システムと、年齢が不明な場合は安全策としてガードレールを実装する機能が含まれています。また、ブラックアウト時間やアカウントのリンク機能といったペアレンタルコントロールに加え、性的なコンテンツや自傷行為など、デリケートなトピックに対するより厳格なフィルターも導入されます。
こうした変化は始まりに過ぎないが、年齢がどのように判断されるのか、間違いが信頼にどの程度影響するのか、監視されたり判断されたりすることを恐れる10代の若者が安心して心を開いて話せるのかなど、難しい問題を提起している。
知っておくべきこと
最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。
- 新しい年齢検出ルール: OpenAI は、18 歳未満であると判断したユーザーを、より厳格な安全ルールを備えた ChatGPT のバージョンに誘導します。
- デフォルトの未成年者モード: 年齢が確認できない場合、システムは慎重を期して未成年者制限を適用します。
- ペアレンタルコントロールの導入: 保護者は、10代の子供のアカウントにリンクしたり、機能(メモリや履歴など)を無効化または制限したり、安全な時間(ブラックアウト時間)を定義したり、AIが苦痛の兆候を検出した場合に警告を受け取ったりすることができます。
- 10代の若者の会話制限:露骨な性的な内容、軽薄なチャット、自傷行為に関する会話は制限されています。極端に差し迫った危害が及ぶ可能性がある場合、保護者と連絡が取れない場合は、法執行機関に通報される可能性があります。
Googleは、ユーザーがカスタムアシスタント「Gem」を共有できるようにすることで、Geminiのリーチを拡大しています。ChatGPTに詳しい方のために説明すると、これは基本的にカスタムGPTです。これまでGemini Gemは個人利用に限定されていましたが、今後はGoogleドキュメントのように簡単に共有できるようになり、同僚、クラスメートなど、誰もがカスタマイズされたAIをゼロから構築することなく、共同作業できるようになります。
この動きは、Gemini をもっと柔軟でユーザーフレンドリーなプラットフォームにしようという Google の取り組みを強調するものだ。
知っておくべきこと:
- Gems は、コーディング、編集、ブレインストーミングなどの特定のタスク向けに設計できるカスタマイズ可能な AI アシスタントです。
- Gemの共有は、 Googleドライブの他の機能と同じように機能します。共同作業中は、他のユーザーがGemを閲覧または編集できます。
- 現在、150 か国以上のGemini Advanced、Business、Enterprise 加入者にご利用いただけます。
GrokがARC-AGIリーダーボードでトップに
イーロン・マスクのGrok 4は、AI開発競争において圧倒的な存在感を示し、ARC-AGIリーダーボードで首位に躍り出ました。ARC-AGIは、AIがどれだけ多くの問題を解けるか、そしてモデルの効率性を測定するベンチマークです。最近のテストでは、Grok 4はこの厳しい指標においてChatGPTやGeminiといったライバルを凌駕し、現実世界における問題解決能力と速度の卓越性を際立たせました。
Grok のスピード、ライブ Web 検索の使用、複雑なエンジニアリング プロンプトの優れた処理能力にもかかわらず、ユーザーは Grok の精度、コンテンツのモデレーション、偏りについて依然として懸念を抱いています。
知っておくべきこと:
- ARC-AGI リーダーボードのリーダー: Grok 4 がトップの座を獲得しました。これは、競合製品よりもリソース ユニットあたりの AI ベンチマーク チャレンジを多く解決していることを意味します。
- 強み: ほぼ瞬時の Web 検索、エンジニアリングおよび複雑な推論タスクの処理の改善、以前の Grok バージョンと比較したパフォーマンスの向上。
- 弱点と懸念事項: コンテンツの正確性に関する問題 (一部の虚偽の主張)、偏見の疑問、使用頻度の増加に伴う節度と信頼性の維持の課題。
- 意味: AI ベンチマークでは効率性と品質がますます評価されるようになっていることを示しています。
新しいAIモデルは、がんを含む1,000以上の病気のリスクを予測できます
Delphi-2Mと呼ばれる新しいAIモデルは、医療AIの飛躍的な進歩を象徴しています。英国とデンマークの約230万人の匿名化された健康データに基づいて学習されたこのモデルは、1,000種類以上の疾患のリスクを予測し、発症時期を推定することができます。
他のAIモデルとは異なり、Delphi-2Mは、病歴、ライフスタイル要因、年齢、性別に基づいて1,0000種類の疾患のリスクスコアを提供し、数十年にわたる健康状態の推移をシミュレートします。このモデルは、どのような疾患が発生するかだけでなく、いつ発生するかを予測できます。
試験では、英国のデータセットにおける数百の疾患で平均AUC 0.76を達成しましたが、デンマークの集団では精度が低下しました。このモデルは診断ツールではなく、人間の医師に代わるものではありません。
しかし、このツールは予測ツールとして有望であり、一般的なリスクの傾向を把握し、予防を計画し、パーソナライズされた健康における AI の可能性を明らかにするのに役立ちます。
要点:
- 大規模なデータセット: 英国バイオバンクとデンマークのレジストリから約 230 万人を対象にトレーニングされました。
- 全体的 + 時間的モデリング: 詳細な入力 (年齢、性別、ライフスタイル、過去の診断) を使用して、次の病気 と その発生時期の両方を予測します。
- 診断ではなく予測: 医学的なアドバイスに代わるものではなく、予防策を知らせることを目的としています。
持ち帰り
わずか 1 週間で、これらのアップデートは、AI 環境が現実世界への統合とより大きな進歩へと向かう明確な変化を浮き彫りにしています。
OpenAIのティーン保護からGoogleの共有可能なGems、パフォーマンスベンチマークでトップに立つGrok、病気のリスクを予測するDelphi-2Mまで、AIは私にとってパーソナルで実用的なものになりつつあり、急速に進化しています。Tom's Guideでは、あらゆる変化を追うので、読者の皆様に最新情報をお届けします。
GoogleニュースでTom's Guideをフォローし、お気に入りの情報源として追加して、最新のニュース、分析、レビューをフィードで受信しましょう。「フォロー」ボタンを忘れずにクリックしてください!
Tom's Guideのその他の記事
- ChatGPTを長年日常のチャットボットとして使ってきたが、Geminiに乗り換えようと思っている。その理由は以下のとおりだ。
- チャットボットは句読点を気にしない ― テストしてみたらこうなった
- ChatGPTの音声モードが「復活」したが、依然として非常に不快な理由
ノートパソコンに戻る
どんな価格でも
315件の取引のうち10件を表示
フィルター☰
(256GB SSD)
1
(15インチ 1TB)
2
(13.3インチ 64GB)
3
(512GB OLED)
4
(14インチ 256GB)
私たちのレビュー
☆ ☆ ☆ ☆ ☆
5
(14インチ 1TB)
私たちのレビュー
☆ ☆ ☆ ☆ ☆
6
7
(15インチ 256GB)
8
9
(青)
10
もっと見る
アマンダ・キャスウェルは、受賞歴のあるジャーナリストであり、ベストセラーのヤングアダルト小説作家であり、AIとテクノロジー分野における今日の第一人者の一人です。様々なニュースメディアに寄稿する著名なジャーナリストであり、鋭い洞察力と共感できるストーリーテリングで多くの読者を獲得しています。アマンダの作品は、メディアへの卓越した貢献を含む、数々の名誉ある賞を受賞しています。
最も複雑なテーマにも明快な解釈を与える能力で知られるアマンダは、革新性と創造性をシームレスに融合させ、読者にAIと新興技術の力を受け入れるよう促しています。認定プロンプトエンジニアとして、彼女は人間とAIの協働の限界を押し広げ続けています。
アマンダはジャーナリストとしてのキャリアに加え、長距離ランナーであり、3人の子供の母親でもあります。ニュージャージー州在住。