ステップ・セレスティアル完全オープンソース化 Step 3.5 Flash:事前学習+トレーニングフレームワーク全公開 OpenClawでトップ2に躍進

robot
概要作成中

中国の大規模モデルスタートアップ企業、阶跃星辰は、Step 3.5 Flashモデルのオープンソース化に続き、こちらのエージェント(Agent)基盤モデルの事前学習済み重み(Base)、中間学習重み(Midtrain)および対応のSteptronトレーニングフレームワークも公開しました。情報によると、Step 3.5 Flashは疎なMoEアーキテクチャを採用し、総パラメータは1960億ですが、推論時には約110億パラメータのみが活性化され、単一リクエストのコードタスクにおいて推論速度は最大350 TPSに達します。このモデルはエージェント(Agent)シナリオ向けに設計されており、複雑な推論や長い連鎖タスクで優れた性能を発揮し、公式によると推論の深さは一部のトップクラスのクローズドソースモデルに匹敵するとされています。これまでに、このモデルはHugging Faceで30万回以上ダウンロードされ、OpenRouterのトレンドランキングで第1位に登場しました。また、著名なオープンソースプロジェクトのOpenClaw(中国のネットユーザーから“小龙虾”と呼ばれる)では、このモデルはトップ2にランクインしています。(科创板日报)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン