GPT-5.5発表:AIエージェント能力とサイバーセキュリティの進化

本日の注目AI・テックニュースを、専門的な分析と共にお届けします。

Warning

この記事はAIによって自動生成・分析されたものです。AIの性質上、事実誤認が含まれる可能性があるため、重要な判断を下す際は必ずリンク先の一次ソースをご確認ください。

GPT-5.5の紹介:実務のための新しいクラスの知能

  • 原題: Introducing GPT-5.5 | OpenAI

専門アナリストの分析

OpenAIは、これまでで最もスマートで直感的なモデルであるGPT-5.5を発表しました。これは、コンピューターでの作業方法を根本的に変える次世代の知能として位置づけられています。GPT-5.5は、ユーザーの意図をより速く理解し、タスクの大部分を自律的に実行できる能力を備えています。

このモデルは、エージェント型コーディング、コンピューター利用、知識作業、および初期の科学研究といった分野で特に強力な進歩を遂げています。複雑な多段階のタスクを計画し、ツールを使用し、作業を確認し、曖昧さを乗り越えて継続する能力が向上しています。

GPT-5.5は、GPT-5.4と同等のトークンあたりのレイテンシーを維持しつつ、はるかに高いレベルの知能を発揮し、同じCodexタスクを完了するためにより少ないトークンを使用することで効率性も向上しています。また、誤用を減らしつつ有益な作業へのアクセスを維持するために、これまでで最も強力なセーフガードが導入されています。

コーディングベンチマークでは、Terminal-Bench 2.0で82.7%、SWE-Bench Proで58.6%の精度を達成し、Expert-SWEでもGPT-5.4を上回る性能を示しています。知識作業においても、GDPvalで84.9%、OSWorld-Verifiedで78.7%を記録し、情報検索、理解、ツール使用、出力生成のループ全体で優れた能力を発揮します。

科学研究の分野では、遺伝学や定量的生物学における多段階の科学データ分析に焦点を当てた新しい評価であるGeneBenchおよびBixBenchで顕著な改善が見られます。さらに、組み合わせ論におけるラムゼー数に関する新しい証明の発見にも貢献しました。

推論効率の面では、GPT-5.5NVIDIA GB200およびGB300 NVL72システム向けに共同設計・トレーニングされており、ロードバランシングとパーティショニングのヒューリスティックの改善により、トークン生成速度が20%以上向上しました。サイバーセキュリティ対策も強化され、潜在的なサイバーリスクに対するより厳格な分類器が導入され、検証済みユーザー向けのTrusted Access for Cyberを通じて、防御的な作業のための高度な機能が提供されます。

GPT-5.5は、ChatGPTおよびCodexのPlus、Pro、Business、Enterpriseユーザーに展開されており、APIでも間もなく利用可能になります。APIの価格は、gpt-5.5が入力トークン100万あたり5ドル、出力トークン100万あたり30ドル、gpt-5.5-proが入力トークン100万あたり30ドル、出力トークン100万あたり180ドルです。

👉 OpenAI で記事全文を読む

  • 要点: GPT-5.5 significantly advances AI agent capabilities across coding, knowledge work, and scientific research, emphasizing efficiency and robust cybersecurity safeguards, and is designed for real-world complex tasks.
  • 著者: rd

English Summary:

OpenAI has introduced GPT-5.5, positioning it as their smartest and most intuitive model to date, representing the next step towards a new way of getting work done on a computer. GPT-5.5 is designed to understand user intent faster and can autonomously carry out more of the work itself.

The model demonstrates significant advancements in areas such as agentic coding, computer use, knowledge work, and early scientific research. It excels at planning, using tools, checking its work, navigating ambiguity, and persisting through complex, multi-part tasks.

GPT-5.5 matches GPT-5.4's per-token latency while delivering a much higher level of intelligence and using significantly fewer tokens to complete the same Codex tasks, enhancing its efficiency. It is also released with OpenAI's strongest set of safeguards to date, aimed at reducing misuse while preserving access for beneficial work.

In coding benchmarks, GPT-5.5 achieved 82.7% accuracy on Terminal-Bench 2.0 and 58.6% on SWE-Bench Pro, outperforming GPT-5.4 on Expert-SWE. For knowledge work, it scored 84.9% on GDPval and 78.7% on OSWorld-Verified, demonstrating enhanced capabilities across the full loop of information finding, understanding, tool use, and output generation.

In scientific research, GPT-5.5 shows clear improvements on GeneBench and BixBench, new evaluations focusing on multi-stage scientific data analysis in genetics and quantitative biology. Notably, an internal version of GPT-5.5 also contributed to discovering a new proof about Ramsey numbers in combinatorics.

Regarding inference efficiency, GPT-5.5 was co-designed for and trained on NVIDIA GB200 and GB300 NVL72 systems. Improvements in load balancing and partitioning heuristics, aided by Codex, led to over 20% faster token generation speeds. Cybersecurity capabilities are also advanced with stricter classifiers for potential cyber risk and the introduction of Trusted Access for Cyber for verified users to access advanced defensive features.

GPT-5.5 is rolling out to Plus, Pro, Business, and Enterprise users in ChatGPT and Codex, with API access coming soon. API pricing for gpt-5.5 is $5 per 1M input tokens and $30 per 1M output tokens, while gpt-5.5-pro is priced at $30 per 1M input tokens and $180 per 1M output tokens.

Bret TaylorのSierraがYC支援のAIスタートアップFragmentを買収

  • 原題: Bret Taylor's Sierra buys YC-backed AI startup Fragment | TechCrunch

専門アナリストの分析

申し訳ありませんが、このURLのコンテンツにはアクセスできませんでした。また、指定されたツール操作の範囲内で、代替のニュース記事や情報を見つけることもできませんでした。

👉 TechCrunch で記事全文を読む

  • 要点: Content inaccessible; unable to summarize.
  • 著者: Dominic-madori Davis

English Summary:

I am sorry, but the content of this URL was inaccessible. Furthermore, I was unable to find alternative news articles or information within the specified tool operations.

AIチップの新たな展開:MetaがAmazon AI CPU数百万個の契約を締結

  • 原題: In another wild turn for AI chips, Meta signs deal for millions of Amazon AI CPUs | TechCrunch

専門アナリストの分析

申し訳ありませんが、このURLのコンテンツにはアクセスできませんでした。また、指定されたツール操作の範囲内で、代替のニュース記事や情報を見つけることもできませんでした。

👉 TechCrunch で記事全文を読む

  • 要点: Content inaccessible; unable to summarize.
  • 著者: Julie Bort

English Summary:

I am sorry, but the content of this URL was inaccessible. Furthermore, I was unable to find alternative news articles or information within the specified tool operations.

Follow me!

photo by:Obi