أطلقت Google نظام Gemini Robotics ER 1.6: نموذج روبوتي SOTA، يتفوق في الاستدلال البصري والمكاني

ChainNewsAbmedia

قدّمت Google DeepMind نموذجًا أساسيا جديدًا للروبوتات بعنوان Gemini Robotics ER 1.6، حيث يشير ER إلى Embodied Reasoning (الاستدلال المتجسّد). يحقق هذا النموذج أفضل مستوى حالي (SOTA) في الاستدلال البصري والاستدلال المكاني، وقد أصبح متاحًا عبر Gemini API. أعلن المسؤول عن العلاقات مع مطوري Google، لوجان كيلباتريك، هذا الخبر عبر وسائل التواصل الاجتماعي. (المصدر)

ما هو Embodied Reasoning؟

يشير Embodied Reasoning إلى قدرة نماذج الذكاء الاصطناعي على فهم العالم المادي والاستدلال فيه. وبخلاف نماذج اللغة التقليدية، يحتاج نموذج الاستدلال المتجسّد إلى التعامل مع مواضع الأجسام في الفضاء ثلاثي الأبعاد، وأشكالها، وموادّها، وعلاقات تفاعلها الفيزيائي. تم تحسين Gemini Robotics ER 1.6 خصيصًا لمثل هذه المهام، ما يساعد الروبوتات على فهم البيئة المحيطة بدقة أكبر واتخاذ قرارات مناسبة بخصوص الإجراءات.

القدرات الأساسية

تتركز المزايا الرئيسية لـ Gemini Robotics ER 1.6 على بُعدين:

القدرة الشرح الاستدلال البصري القدرة على التعرف على الأشياء من الصور ومقاطع الفيديو، وفهم بنية المشهد، واتخاذ القرار بناءً عليها الاستدلال المكاني فهم المواضع النسبية والمسافات والاتجاهات للأجسام في الفضاء ثلاثي الأبعاد، مع دعم تخطيط عمليات معقدة

يؤدي الجمع بين هاتين القدرتين إلى تمكين الروبوت من التعامل مع مهام أكثر تعقيدًا في العالم الواقعي. على سبيل المثال، في بيئات التخزين، يحتاج الروبوت إلى تحديد الأشياء المختلفة من حيث الشكل في الوقت نفسه، وحساب أفضل زاوية للإمساك وأفضل موضع لوضعها — وهي حالة تتفوق فيها Gemini Robotics ER 1.6.

استخدام Gemini API

على عكس العديد من نماذج الروبوتات في الماضي التي ظلت فقط ضمن مرحلة الأبحاث، أصبح بإمكان الوصول إلى Gemini Robotics ER 1.6 عبر Gemini API. وهذا يعني أن المطورين وشركات الأجهزة يمكنهم دمج هذا النموذج مباشرة في أنظمة الروبوتات الخاصة بهم، دون الحاجة إلى تدريب النموذج من الصفر.

كما يؤدي فتح واجهة API إلى خفض عتبة تطوير أنظمة ذكاء اصطناعي للروبوتات. في السابق، كان تطوير نظام روبوتات يتمتع بقدرات الاستدلال البصري والمكاني يتطلب جمعًا كبيرًا للبيانات وأعمال تدريب للنماذج. أما الآن، يمكن للمطورين التركيز على تطوير تصميم العتاد وحالات الاستخدام، وترك قدرات الاستدلال الأساسية إلى Gemini Robotics ER 1.6.

خطة Google في مجال ذكاء الروبوتات

يعد Gemini Robotics ER 1.6 أحدث إنجاز من Google DeepMind في مجال الروبوتات. بدءًا من RT-2 المبكر وحتى سلسلة Gemini Robotics الحالية، واصلت Google توسيع قدرات نماذج اللغات الكبيرة إلى التفاعل مع العالم المادي. يعمل إصدار ER 1.6 على تحسين دقة الاستدلال بشكل أكبر مقارنة بالإصدارات السابقة، ويتميز بشكل خاص بالأداء الأفضل في السيناريوهات التي تتطلب عمليات دقيقة للغاية.

مع دخول صناعة الروبوتات إلى مرحلة نمو جديدة، ستصبح النماذج الأساسية التي تمتلك قدرات قوية في الاستدلال البصري والمكاني بنية تحتية محورية. لمعرفة المزيد عن تطور منظومة Gemini، يمكنك الرجوع إلى الدليل الشامل لـ Gemini.

هذه المقالة: Google تطلق Gemini Robotics ER 1.6: نموذج روبوتات SOTA، بارع في الاستدلال البصري والمكاني، ظهرت لأول مرة على موقع سلسلة الأخبار ABMedia.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

روبوت هونر Lightning يفوز بماراثون نصف الروبوتات البشرية في بكين 2026 بوقت 50:26

إن روبوت هونر البشري "Lightning" حقق رقمًا قياسيًا جديدًا في ماراثون نصف الروبوتات البشرية في بكين ييتوانغ لعام 2026، وأكمل السباق في 50 دقيقة و26 ثانية، متجاوزًا الرقم القياسي العالمي البشري.

GateNewsمنذ 33 د

سهم Meta يرتفع بنسبة 1.73% بينما تخطط الشركة لتسريح 8,000 وظيفة بدءًا من 20 مايو

تخطط Meta Platforms لخفض حوالي 8,000 وظيفة، أو 10% من قوتها العاملة، بدءًا من 20 مايو، رغم ارتفاع أسعار أسهمها. وتُركّز الشركة، التي تحقق أكثر من $200 billion في الإيرادات، على استثمارات الذكاء الاصطناعي في ظل إعادة هيكلة كبيرة، بما يتماشى مع اتجاهات الصناعة المرتبطة بعمليات التسريح.

GateNewsمنذ 8 س

يذكر تقرير Google السنوي أن Gemini يحقق اعتراضًا في أجزاء من الثانية، ويمنع 99% من إعلانات الاحتيال

ناقش المقال كيف يعزز Google أمان الإعلانات عبر نظامه الخاص بالذكاء الاصطناعي التوليدي Gemini، وأظهر التقرير أن سرعة اعتراض الإعلانات المخالفة قد انخفضت إلى أجزاء من الثانية (ملّيلِي ثانية)، مع معدل اعتراض بلغ 99%. في العام الماضي، قامت Google بإزالة 8.3 مليار إعلان، وأوقفت 24.9 مليون حساب، ما يشير إلى ارتفاع كبير في عدد إعلانات الاحتيال. وأشار خبراء إلى أن هذا صراع بين الذكاء الاصطناعي والذكاء الاصطناعي، وأنه سيتعين على المستقبل التعامل مع تحديات السلوكيات القانونية وغير القانونية التي يسببها الذكاء الاصطناعي.

ChainNewsAbmediaمنذ 9 س

以太坊联合创始人鲁宾:AI 将成为加密的关键转折点,但科技巨头的垄断带来系统性风险

强调以太坊联合创始人约瑟夫·鲁宾,AI 对加密货币行业的变革潜力具有重要意义,同时也警告科技巨头之间的中心化风险。他设想区块链上由 AI 驱动的自主交易,并指出传统金融与 DeFi 的融合正在加速。

GateNewsمنذ 12 س

إيلون ماسك يدفع نحو “شيكات الدخل المرتفع الشامل” باعتبارها الحل النهائي لبطالة وظائف الذكاء الاصطناعي

يدعو إيلون ماسك إلى دخل مرتفع عالمي لمكافحة البطالة الناجمة عن الذكاء الاصطناعي، متصورًا مستقبلًا تتوفر فيه السلع بكثرة وينعدم فيه التضخم. وفي المقابل، يثير خبراء مثل سام ألتمان مخاوف بشأن فقدان الوظائف ويقترحون تدابير لحماية العمال.

Coinpediaمنذ 12 س

يُقال إن DeepSeek يطلق أول جولة لجمع تمويل خارجي، ويستهدف تقييمًا بقيمة 10 مليارات دولار+ و300 مليون دولار+

تجري شركة DeepSeek، وهي شركة ناشئة صينية في مجال الذكاء الاصطناعي، مفاوضات لجولتها الأولى لجمع تمويل خارجي، بهدف تحقيق ما لا يقل عن $300 مليون دولار عند تقييم $10 مليار دولار. وعلى الرغم من الرفضات السابقة لعروض الاستثمار، تشير التقارير إلى أن محادثات جمع الأموال جارية حاليًا.

GateNewsمنذ 12 س
تعليق
0/400
لا توجد تعليقات