GPT-5.4、Luma AIエージェント、重力子振幅:最新AI技術動向

本日の注目AI・テックニュースを、専門的な分析と共にお届けします。

Warning

この記事はAIによって自動生成・分析されたものです。AIの性質上、事実誤認が含まれる可能性があるため、重要な判断を下す際は必ずリンク先の一次ソースをご確認ください。

プロフェッショナルな作業向けに設計されたGPT-5.4の紹介

  • 原題: Introducing GPT-5.4 | OpenAI

専門アナリストの分析

OpenAIは、プロフェッショナルな作業向けに設計された最新のフロンティアモデルGPT-5.4を発表しました。このモデルは、ChatGPT(GPT-5.4 Thinkingとして)、API、およびCodexで利用可能であり、複雑なタスクで最大のパフォーマンスを求めるユーザー向けにGPT-5.4 Proも提供されます。

GPT-5.4は、推論、コーディング、およびエージェントワークフローにおける最近の進歩を統合し、GPT-5.3-Codexの業界をリードするコーディング能力を組み込みつつ、ツール、ソフトウェア環境、スプレッドシート、プレゼンテーション、ドキュメントなどのプロフェッショナルタスクでのモデルの動作を改善しています。これにより、より正確で効率的な作業が可能になります。特に、GPT-5.4 Thinkingは、思考の事前計画を提供し、深いウェブ調査能力を向上させ、より高品質な回答を迅速に提供します。

GPT-5.4は、ネイティブな最先端のコンピューター使用能力を備えた初の汎用モデルであり、エージェントがアプリケーション間で複雑なワークフローを実行できるようにします。最大1Mトークンのコンテキストをサポートし、エージェントが長期間にわたるタスクを計画、実行、検証することを可能にします。また、ツール検索を導入し、大規模なツールエコシステムでの効率的なツール利用を実現し、トークン使用量を大幅に削減します。

コーディング能力も強化され、SWE-Bench ProGPT-5.3-Codexと同等以上の性能を発揮し、フロントエンドタスクにおいてより美的で機能的な結果を生み出します。さらに、Playwright (Interactive)という実験的なCodexスキルを通じて、ウェブおよびElectronアプリの視覚的なデバッグやテストが可能になります。安全性に関しても、Preparedness Frameworkに基づき、サイバー安全スタックを拡張し、Chain-of-Thought (CoT)の監視可能性を向上させています。

👉 OpenAI で記事全文を読む

  • 要点: GPT-5.4 significantly advances AI capabilities in professional knowledge work, coding, and autonomous agentic workflows with enhanced computer-use, extended context, and improved safety, making it a powerful tool for complex tasks and developer efficiency.
  • 著者: meetpateltech

English Summary:

OpenAI has unveiled GPT-5.4, its latest frontier model designed for professional work, available in ChatGPT (as GPT-5.4 Thinking), the API, and Codex. A more powerful version, GPT-5.4 Pro, is also offered for users requiring maximum performance on complex tasks.

GPT-5.4 integrates recent advancements in reasoning, coding, and agentic workflows, incorporating the industry-leading coding capabilities of GPT-5.3-Codex while enhancing its performance across tools, software environments, spreadsheets, presentations, and documents. This results in more accurate and efficient task completion. Specifically, GPT-5.4 Thinking provides upfront thinking plans and improves deep web research, delivering higher-quality answers faster.

This model is the first general-purpose model with native, state-of-the-art computer-use capabilities, enabling agents to execute complex workflows across applications. It supports up to 1M tokens of context, allowing agents to plan, execute, and verify long-horizon tasks. The introduction of tool search significantly improves efficiency in large tool ecosystems by reducing token usage.

GPT-5.4 also boasts enhanced coding abilities, matching or outperforming GPT-5.3-Codex on SWE-Bench Pro and producing more aesthetic and functional results for frontend tasks. An experimental Codex skill, Playwright (Interactive), enables visual debugging and testing of web and Electron apps. Safety measures include an expanded cyber safety stack under the Preparedness Framework and improved Chain-of-Thought (CoT) monitorability.

単一マイナス振幅の重力子への拡張

  • 原題: Extending single-minus amplitudes to gravitons | OpenAI

専門アナリストの分析

OpenAIの研究者たちは、量子重力における散乱振幅に関する新しい研究を発表しました。この研究は、以前グルーオンで得られた結果を重力子の設定に拡張するもので、長らく消滅すると考えられていたある種の重力子相互作用が、特定の運動学的条件下で発生しうることを示しています。

この論文「Single-minus graviton tree amplitudes are nonzero」は、Alfredo GuevaraAlexandru LupsascaDavid SkinnerAndrew Strominger、およびKevin Weilによって執筆されました。彼らは、単一マイナス振幅(1つの粒子が負のヘリシティを持ち、残りが正のヘリシティを持つ構成)が、粒子運動が半共線体制と呼ばれる特殊なアライメントを満たす場合に消滅しないことを発見しました。

この研究の特筆すべき点は、GPT-5.2 Proがこの数学的結果の発見に貢献したことです。以前のグルーオンに関する論文をコンテキストとして与えられたGPT-5.2 Proは、人間が導き出すのにかなりの時間を要するであろう量子重力における対応する振幅を構築するよう求められました。モデルは、指向性行列木定理という驚くべき手法を用いて問題を解決し、論文の優れた予備草稿も作成しました。

この成果は、量子力学とアインシュタインの一般相対性理論を調和させるという中心的な問題への小さな一歩であり、ロジャー・ペンローズによって半世紀前に発見された無限次元の「w-(1+∞)」対称性を重力子に適用する方法を示しています。このプロジェクトは、AI支援推論が従来の数学的検証と科学的厳密さを維持しつつ、理論研究にどのように貢献できるかを示すものです。

👉 OpenAI で記事全文を読む

  • 要点: GPT-5.2 Pro significantly accelerated the discovery of a new mathematical result in quantum gravity, demonstrating AI's potential to assist in complex theoretical physics research by extending scattering amplitude theories to gravitons and revealing previously unknown interactions.
  • 著者: Alex Lupsasca

English Summary:

OpenAI researchers have published new findings on scattering amplitudes in quantum gravity, extending previous results for gluons to gravitons. This work demonstrates that a class of graviton interactions, long assumed to vanish, can in fact arise under specific kinematic conditions.

The paper, titled “Single-minus graviton tree amplitudes are nonzero,” authored by Alfredo Guevara, Alexandru Lupsasca, David Skinner, Andrew Strominger, and Kevin Weil, reveals that single-minus amplitudes (configurations where one particle has negative helicity and the rest have positive helicity) do not vanish when particle momenta satisfy a special alignment known as the half-collinear regime.

A significant aspect of this research is the contribution of GPT-5.2 Pro in discovering this new mathematical result. Provided with the earlier gluon paper as context, GPT-5.2 Pro was tasked with constructing the corresponding amplitudes in quantum gravity, a derivation that would have taken human authors considerable time. The model solved the problem using a surprising technique, the directed matrix-tree theorem, and produced an excellent preliminary draft of the paper.

This achievement represents a small step towards reconciling quantum mechanics with Einstein's theory of general relativity, illustrating how the infinite-dimensional “w-(1+∞)” symmetry, discovered by Roger Penrose, acts on gravitons. The project highlights how AI-assisted reasoning can contribute to theoretical research while upholding conventional standards of mathematical verification and scientific rigor.

Lumaが新しい「Unified Intelligence」モデルを搭載したクリエイティブAIエージェントを発表

  • 原題: EXCLUSIVE: Luma launches creative AI agents powered by its new ‘Unified Intelligence’ models | TechCrunch

専門アナリストの分析

AIビデオ生成スタートアップのLumaは、新しい「Unified Intelligence」モデルを搭載したクリエイティブAIエージェントLuma Agents」を発表しました。これらのエージェントは、テキスト、画像、ビデオ、オーディオにわたるエンドツーエンドのクリエイティブ作業を処理するように設計されており、広告代理店、マーケティングチーム、デザインスタジオ、企業向けに新たな働き方を提案しています。

Luma Agentsは、同社のUni-1モデルを基盤としており、これはUnified Intelligenceファミリーの最初のモデルです。Uni-1は、オーディオ、ビデオ、画像、言語、空間推論で訓練されており、エージェントが「言語で考え、ピクセルや画像で想像しレンダリングする」ことを可能にします。このアプローチは、言語、ビジョン、生成のための個別のモデルを連結するのではなく、単一のマルチモーダル推論システムで理解と生成を行うという、業界の一般的なアプローチからの脱却を意味します。

これらのエージェントは、複数のAIシステムを調整し、LumaRay 3.14Google Veo 3ByteDance SeedreamElevenLabsの音声モデルなど、他のAIモデルと連携して動作します。Lumaは、エージェントが自身の出力を評価し、反復的な自己批評プロセスを通じて改善できると述べています。デモンストレーションでは、200語のブリーフと画像から様々な広告キャンペーンのアイデアを生成し、1500万ドルの広告キャンペーンをわずか40時間で異なる国向けにローカライズできることが示されました。

LumaのCEO兼共同創設者であるAmit Jainは、「顧客はツールを購入しているのではなく、ビジネスのやり方を変えている」と述べており、Luma Agentsがクリエイティブチームがツールを調整するのではなく、味覚、方向性、戦略に集中できるようにするコラボレーターであると強調しています。このプラットフォームは、Publicis GroupeServiceplan Groupなどのグローバルエンタープライズパートナーにすでに展開されています。

👉 TechCrunch で記事全文を読む

  • 要点: Luma's 'Unified Intelligence' models power new AI agents capable of end-to-end creative work across multiple modalities, streamlining complex workflows and enabling autonomous, self-critiquing content generation for enterprises.
  • 著者: Rebecca Bellan

English Summary:

Luma, an AI video generation startup, has launched Luma Agents, creative AI agents powered by its new 'Unified Intelligence' models. These agents are designed to handle end-to-end creative work across text, image, video, and audio, proposing a new way of working for advertising agencies, marketing teams, design studios, and enterprises.

Luma Agents are built on the company's Uni-1 model, the first in its Unified Intelligence family. Uni-1 has been trained on audio, video, image, language, and spatial reasoning, enabling the agents to 'think in language and imagine and render in pixels or images.' This approach signifies a departure from the industry's prevailing method of chaining together separate models for language, vision, and generation, instead utilizing a single multimodal reasoning system for understanding and generation.

These agents coordinate multiple AI systems and work with other AI models, including Luma's Ray 3.14, Google Veo 3, ByteDance Seedream, and ElevenLabs' voice models. Luma states that the agents can evaluate and refine their own outputs through an iterative self-critique process. Demonstrations showed the agents generating various ad campaign ideas from a 200-word brief and an image, and localizing a $15 million ad campaign for different countries in just 40 hours.

Amit Jain, CEO and co-founder of Luma, emphasized that customers are not just buying a tool but are redoing how business is done, positioning Luma Agents as collaborators that allow creative teams to focus on taste, direction, and strategy rather than orchestrating tools. The platform has already been rolled out with global enterprise partners such as Publicis Groupe and Serviceplan Group.

Follow me!

photo by:Kelly Sikkema