中国の大規模モデルスタートアップ企業、阶跃星辰は、Step 3.5 Flashモデルのオープンソース化に続き、こちらのエージェント(Agent)基盤モデルの事前学習済み重み(Base)、中間学習重み(Midtrain)および対応のSteptronトレーニングフレームワークも公開しました。情報によると、Step 3.5 Flashは疎なMoEアーキテクチャを採用し、総パラメータは1960億ですが、推論時には約110億パラメータのみが活性化され、単一リクエストのコードタスクにおいて推論速度は最大350 TPSに達します。このモデルはエージェント(Agent)シナリオ向けに設計されており、複雑な推論や長い連鎖タスクで優れた性能を発揮し、公式によると推論の深さは一部のトップクラスのクローズドソースモデルに匹敵するとされています。これまでに、このモデルはHugging Faceで30万回以上ダウンロードされ、OpenRouterのトレンドランキングで第1位に登場しました。また、著名なオープンソースプロジェクトのOpenClaw(中国のネットユーザーから“小龙虾”と呼ばれる)では、このモデルはトップ2にランクインしています。(科创板日报)
ステップ・セレスティアル完全オープンソース化 Step 3.5 Flash:事前学習+トレーニングフレームワーク全公開 OpenClawでトップ2に躍進
中国の大規模モデルスタートアップ企業、阶跃星辰は、Step 3.5 Flashモデルのオープンソース化に続き、こちらのエージェント(Agent)基盤モデルの事前学習済み重み(Base)、中間学習重み(Midtrain)および対応のSteptronトレーニングフレームワークも公開しました。情報によると、Step 3.5 Flashは疎なMoEアーキテクチャを採用し、総パラメータは1960億ですが、推論時には約110億パラメータのみが活性化され、単一リクエストのコードタスクにおいて推論速度は最大350 TPSに達します。このモデルはエージェント(Agent)シナリオ向けに設計されており、複雑な推論や長い連鎖タスクで優れた性能を発揮し、公式によると推論の深さは一部のトップクラスのクローズドソースモデルに匹敵するとされています。これまでに、このモデルはHugging Faceで30万回以上ダウンロードされ、OpenRouterのトレンドランキングで第1位に登場しました。また、著名なオープンソースプロジェクトのOpenClaw(中国のネットユーザーから“小龙虾”と呼ばれる)では、このモデルはトップ2にランクインしています。(科创板日报)