Google DeepMind は、最新のロボット基盤モデル「Gemini Robotics ER 1.6」を発表しました。ここで ER は Embodied Reasoning(具現的推論)を意味します。このモデルは、視覚および空間推論の分野で現在の最高水準(SOTA)に到達しており、Gemini API によりすでに利用可能です。Google AI 開発者リレーション担当責任者の Logan Kilpatrick が、ソーシャルメディア上でこのニュースを公開しました。(出典)
Embodied Reasoning とは何ですか?
Embodied Reasoning とは、AI モデルが物理世界を理解し推論する能力を指します。従来の言語モデルとは異なり、具現的推論モデルは三次元空間における物体の位置、形状、素材、そして物理的な相互作用関係を扱う必要があります。Gemini Robotics ER 1.6 は、この種のタスクに特化して最適化されており、ロボットが周囲の環境をより正確に理解し、適切な行動決定を行えるようにします。
主要能力
Gemini Robotics ER 1.6 の主な優位性は、2 つの側面に集約されています。
能力 説明 視覚推論 画像や動画から物体を識別し、シーンの構造を理解したうえで、それに基づき意思決定を行うこと 空間推論 三次元空間内の物体の相対位置、距離、方向を理解し、複雑な操作計画を支援すること
これら 2 つの能力の組み合わせにより、ロボットはより複雑な現実世界のタスクを扱えるようになります。たとえば、倉庫環境では、ロボットはさまざまな形状の物品を同時に認識し、最適な把持角度と配置位置を計算する必要があります。これはまさに Gemini Robotics ER 1.6 が得意とするシーンです。
Gemini API を通じて利用
過去に多くのロボットモデルが論文段階にとどまっていたのに対し、Gemini Robotics ER 1.6 は Gemini API によってアクセスが提供されています。つまり、開発者やハードウェア企業は、このモデルを自社のロボットシステムに直接統合でき、ゼロからモデルを学習する必要がありません。
API の公開により、ロボット AI の開発における参入障壁も下がります。これまで、視覚および空間推論能力を備えたロボットシステムを開発するには、大量のデータ収集とモデル学習作業が必要でした。現在は、開発者がハードウェア設計やアプリケーションシナリオの開発に集中し、基盤となる推論能力を Gemini Robotics ER 1.6 に任せることができます。
Google のロボット AI 構想
Gemini Robotics ER 1.6 は、ロボット領域における Google DeepMind の最新成果です。初期の RT-2 から現在の Gemini Robotics シリーズまで、Google は大型言語モデルの能力を物理世界とのインタラクションへと継続的に拡張してきました。ER 1.6 のバージョンは、前身の基盤の上に推論精度をさらに向上させており、特に精密な操作が必要なシーンでより優れた性能を発揮します。
ロボット産業が新たな成長サイクルに入るにつれ、強力な視覚および空間推論能力を備えた基盤モデルは重要な基盤インフラになるでしょう。Gemini エコシステムの発展を詳しく知りたい場合は、Gemini の完全ガイドを参照してください。
この記事「Google が Gemini Robotics ER 1.6 をリリース:SOTA のロボットモデル、視覚と空間推論が得意」は最初に 鏈新聞 ABMedia に掲載されました。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
FRBの研究:ChatGPTの立ち上げ後、米国のプログラミング職の成長が50%低下
ゲートニュース記事、4月27日 — 経済学者のLeland D. Crane氏とPaul E. Soto氏による米連邦準備制度(FRB)の研究では、2022年11月にChatGPTがリリースされた後、米国のプログラマーにおける雇用成長が約50%低下したことが分かった。AIモデルのリリース前は、プログラミング集約型の職が
GateNews7分前
マスク氏とOpenAIのCEOをめぐる訴訟が今日開廷!エロン・マスク氏が激怒:詐欺師のアルトマン
マスク氏とOpenAIの訴訟がカリフォルニアで開かれ、マスク氏は先にX(旧Twitter)上で連続して猛攻撃し、「詐欺師のAltman」とアルトマン氏を呼び、アルトマン氏とブロックマン氏が慈善団体から資金を盗んだと非難した。この訴訟は、嫉妬と競争の抑圧として見られている。OpenAIは法廷で真相を明らかにするとしており、訴訟金額は1,340億ドルに上る。責任と賠償は2段階に分けて扱われ、陪審団は単なる諮問機関であり、最終的には裁判官が判断する。
ChainNewsAbmedia2時間前
Gemini、AI搭載の自動トレーディング向けエージェンティック・トレーディングをローンチ
暗号取引所Geminiはエージェンティック・トレーディングを立ち上げ、規制を受けた米国の取引所として初めて、自動取引のためのAIエージェントの直接統合を提供したことを示しました。このプラットフォームにより、ユーザーはClaude、ChatGPT、その他のAIモデルを接続して、単純な注文から
CryptoFrontier3時間前
580人以上のGoogle従業員、CEOにペンタゴンのAI契約を阻止するよう要求
Gate Newsメッセージ、4月27日——580人以上のGoogle従業員が、CEOスンダル・ピチャイに対し、同社の人工知能技術を軍事用途に使うためにペンタゴンが利用することを阻止するよう求める公開書簡に署名した。署名者には、18人以上の上級スタッフが含まれ、プリンシパルやディレクターから副社長まで幅広い
GateNews3時間前
AlphaGo の父 11 億ドルのシードラウンド:ヨーロッパ史上最大、評価額 51 億ドル
Cooley 法律事務所は 4 月 27 日に代わってリリースしたニュースリリースによると、ロンドンの AI 研究会社 Ineffable Intelligence は 11 億ドル($1.1B)のシードラウンド資金調達を完了し、投資後評価額は 51 億ドル($5.1B)となりました。Sequoia Capital と Lightspeed Venture Partners が共同で主導し、Google、Nvidia、Index Ventures などが追加で参加しています。これは欧州の過去最高規模のシードラウンドであり、また AI 資本市場で「LLM だけに賭けるのではない」新たな投資の波が形成されつつあることを示しています。
11 億ドルのシードラウンド:欧州史上最大、評価額 51 億ドル
Ineffable Intelligence は今回の資金調達で直接、これまでの記録を上回り過
ChainNewsAbmedia4時間前
S&P 500の雇用者数が40万人減 AIブームが米企業を再編
ゲートニュースのメッセージ、4月27日――S&P 500の企業では、雇用者数が2026年に約400,000人減って2,810万人となり、2016年以来初めての年次減少となった。8年連続の途切れない雇用増加の後の減少である。The Kobeissi Letterによれば、Amazonをはじめとする主要企業が 企業の役職を16,000件削減、Metaが 8,000人のポジションを削減、そしてMicrosoftが 8,750人の従業員に対して自発的な買い取り(自社による退職金制度)を提示しており、これらがAIインフラとプロジェクトへの予算の振り向けにより減少を引き起こしている。
GateNews4時間前