Harnessが流行した——しかし、人々はそれが本当に誰を食い尽くそうとしているのか理解していない

パロアルトの朝、コーヒーが出されたばかりのとき、アラン・ウォーカーは低頭してAnthropicのハーネスに関する記事を見て、顔を上げてただ一言言った:

「多くの人は、これはモデルが少し進歩しただけだと思っている。違う、これはプロセスが人を裏切り始めたということだ。」

この記事は表面的にはエンジニアリングデザインについて、プランナー、ジェネレーター、エバリュエーターについて、いかにしてクロードを数時間連続して動かし、より複雑な製品を作るかを語っている。

ほとんどの人はここで止まってしまう。彼らは思う:

ああ、なるほど、エージェントがより複雑になり、プロンプトが長くなり、ワークフローが詳細になったのだと。

しかし、アランは言う。真に注目すべきは、常に表層機能ではなく、権力がどの層に移行しているかだ。

過去に複雑なタスクを達成するためには、誰かが要求を分解し、誰かが実行し、誰かがチェックし、誰かが再作業し、誰かが全体を支える必要があった。

今、Anthropicがやっているのは、モデルをより賢い従業員にすることではなく、システム全体が元々人間に属していた層の組織権、監視権、受け入れ権を引き継ぎ始めることだ。

ハーネスはプラグインではない。ハーネスは機械が「管理層」を持ち始めることを意味する。

これがそれの本当に恐ろしいところだ。

01 ツールではなく、「ツールを管理する層」

多くの人がハーネスを見たとき、最初の反応は:これは別のエージェントフレームワークではないのか?

この理解はあまりにも浅い。

普通のツールの本質は、命令を聞いて実行することだ。あなたがクリックすれば、それは動き、あなたが言わなければ、それは動かない。

しかしハーネスはもうその論理ではない。実際にやっているのは、元々人間のチームに隠れていた分業構造をソフトウェア化することだ:

誰が要求を理解し、誰がそれを段階に分解し、誰が実行し、誰がチェックし、誰が問題を発見して再作業する権限を持つか。

つまり、Anthropicは単に機能を追加しているのではなく、「仕事をどのように組織するか」ということ自体をシステムに書き込んでいるのだ。

このステップがなぜ重要か?なぜなら、過去に最も複製が難しかったのは、単一の能力ではなく、組織能力だからだ。

コードを書くことができる人は多い。

十数人、十数ステップ、十数回の再作業を組織して、最終的に安定して納品することができる人は非常に少ない。

そしてハーネスが触れているのは、まさにこの層で最も高価なものだ。

ツールは効率を向上させ、組織は出力を決定する。

単一のモデルは単なる労働力であり、ハーネスは企業構造に触れ始めている。

AIが単に作業を行うのではなく、分業、引き継ぎ、責任追及を始めると、それはもはや「ツールのアップグレード」とは単純なものではない。

02 より賢くではなく、より失敗しづらく

モデルの最も惑わす点は、短いタスクでは常に非常に賢く見えることだ。

それに質問をすると、的確に回答し、一段階のコードを書くこともよくある。だから多くの人は誤解する:短いタスクができるなら、長いタスクはただ長く走らせればいいのではないか?

全くそんなことはない。

長いタスクの本当に難しい点は、特定のステップができないことではなく、数十ステップの後でも歪みを失わず、制御を失わず、自分を欺かないことだ。

人間がプロジェクトを行うときも同様だ。最も恐ろしいのは、できないことではなく、後半に進むにつれて混乱が始まることだ:

要求を思い出せなくなり、

目標が漂流し、

前後の論理が一致しなくなり、

最後に得意なのは、事を終わらせることではなく、見た目上完了したように見える要約を書くことだ。

Anthropicの記事で触れられている核心的な問題は、実質的にはこれだ:

モデルは長期タスクで徐々に魂を失う。文脈が長くなるほど、状態が混乱し、「まあまあだろう」という心理的幻想に早く入る。

ハーネスの価値は、それをより敏捷にするのではなく、より散漫にならず、より虚偽にならず、より簡単にごまかされないようにすることにある。

段階を分解し、引き継ぎを行い、契約を定義し、独立評価を行い、失敗をロールバックする。これらは一見プロセスの詳細に見えるが、実際には同じ根本的な問題を解決している:

知能は不安定であっても、納品は運に頼ってはいけない。

だから、もし本当にハーネスを理解したいなら、まず一つのことを理解しなければならない:

未来に本当に価値があるのは、誰が時折驚くようなデモを打ち出せるかではなく、

誰がシステムを数時間、数日、あるいはそれ以上の期間にわたり、持続的に前に進められるか、そして最後まで失敗しないかだ。

書けることは珍しくない。

最後まで崩れずに書けることこそが珍しい。

ひらめきは価値がないが、安定した納品が価値がある。

アランは言った。Anthropicの記事で最も冷酷な一撃は、プランナーでもジェネレーターでもなく、エバリュエーターだ。

なぜ?

なぜなら、大モデルは人間に非常に似た欠点を持っているからだ:自分が作ったものは、常に悪くないと思ってしまう。

外部の制約がなければ、「全体的に悪くない」「基本的に完成している」「核心的な機能はすでに備わっている」といった自己評価を簡単に行う。

問題は、このような評価が多くの場合、嘘ではなく、システム的な自己寛容の一種であることだ。

人間の会社では、なぜ多くのプロジェクトが最後に失敗するのか?

なぜなら、作業を行う人が最も自分を擁護する理由を見つける傾向があるからだ。

作業をする人は、もうすぐできると言い、

検収を行う人は、深く見るのが面倒になり、

その結果、「まあまあ」なものが途中で流通し、最終的にはユーザーの手に渡って爆発する。

Anthropicの恐ろしい点は、この事を直接分解したことだ:

作業をするのは一つの役割で、

間違いを指摘するのは別の役割だ。

前者は進行を担当し、後者は疑念を担当する。

この背後にある論理は非常に深い:

一旦生産権と評価権が分離されると、システムは本当に閉じた循環を形成し始める。

さらに恐ろしいのは、Anthropicは単にエバリュエーターに「ここが良くないと思う」と言わせるだけではない。彼らは「間違いを指摘する」ことを可能な限り構造化している:

機能をテストし、ページをクリックし、インターフェースをチェックし、データベースの状態を確認し、設計品質も評価可能な次元に分解されている。

これは何を意味するか?

人間によって神秘的にされていた判断権が、徐々にプロセス、基準、閾値に分解されている。

最初に自動化されるのは、しばしば肉体労働ではなく、指摘である。

「このものは本当に機能するのか?」がプロセス化されると、多くの人の経験の防壁が漏れ始める。

過去、多くの職位が本当に価値があったのは、製造できるからではなく、「このものが通過するかどうか」を判断する権限を持っていたからだ。

今、その権限が人の手から緩んできている。

03 最も冷酷な一撃は、自分を褒めることを許さないこと

アランは言った。Anthropicの記事で最も冷酷な一撃は、プランナーでもジェネレーターでもなく、エバリュエーターだ。

なぜ?

なぜなら、大モデルは人間に非常に似た欠点を持っているからだ:自分が作ったものは、常に悪くないと思ってしまう。

外部の制約がなければ、「全体的に悪くない」「基本的に完成している」「核心的な機能はすでに備わっている」といった自己評価を簡単に行う。

問題は、このような評価が多くの場合、嘘ではなく、システム的な自己寛容の一種であることだ。

人間の会社では、なぜ多くのプロジェクトが最後に失敗するのか?

なぜなら、作業を行う人が最も自分を擁護する理由を見つける傾向があるからだ。

作業をする人は、もうすぐできると言い、

検収を行う人は、深く見るのが面倒になり、

その結果、「まあまあ」なものが途中で流通し、最終的にはユーザーの手に渡って爆発する。

Anthropicの恐ろしい点は、この事を直接分解したことだ:

作業をするのは一つの役割で、

間違いを指摘するのは別の役割だ。

前者は進行を担当し、後者は疑念を担当する。

この背後にある論理は非常に深い:

一旦生産権と評価権が分離されると、システムは本当に閉じた循環を形成し始める。

さらに恐ろしいのは、Anthropicは単にエバリュエーターに「ここが良くないと思う」と言わせるだけではない。彼らは「間違いを指摘する」ことを可能な限り構造化している:

機能をテストし、ページをクリックし、インターフェースをチェックし、データベースの状態を確認し、設計品質も評価可能な次元に分解されている。

これは何を意味するか?

人間によって神秘的にされていた判断権が、徐々にプロセス、基準、閾値に分解されている。

最初に自動化されるのは、しばしば肉体労働ではなく、指摘である。

「このものは本当に機能するのか?」がプロセス化されると、多くの人の経験の防壁が漏れ始める。

過去、多くの職位が本当に価値があったのは、製造できるからではなく、「このものが通過するかどうか」を判断する権限を持っていたからだ。

今、その権限が人の手から緩んできている。

04 最初に食べられるのはプログラマーではなく、「まあまあでいい」

このような記事を見たとき、多くの人は反射的に言う:プログラマーは終わりなのか?

アランは言う。この問い方はあまりにも表面的で、怠惰だ。

ハーネスが最初に食べるのは、特定の職業名ではない。

最初に食べるのは、長い間存在し、ほぼすべての知識労働で非常に一般的な生存方法だ:

要求が不明確な場合、まずはやってみる;

途中で方向を間違えた場合、後で補う;

結果が普通でも、動くことができる;

ドキュメントが明確でなくても、チームの皆が理解している;

まずはオンラインにして、問題が戻ってきたら修正する。

言い換えれば、これはあらゆる不明確さと人間の柔軟性に基づく一整セットの作業方法だ。

多くのプロジェクトが前に進むことができるのは、プロセスが本当に明確だからではなく、途中で誰かが経験、代替、臨時判断によって穴を埋めているからだ。

ハーネスが今やっていることは、まさにその逆である。

それは不明確さを圧縮している。

それは言い訳の空間を圧縮している。

それは「私は思う」「まあまあ」「できるはず」の生存空間を圧縮している。

まずは今回の何が「完了」と定義され、その後に作業を許可する;

満足しない場合は、戻す;

受け入れが通過しない場合は、続ける;

感覚ではなく、証拠を求める。

この論理が前に進むと、最も危険なのは常に最もコードを書くのが得意な人ではなく、最もグレーゾーンに依存して生きる人である。

ハーネスが食べるのはプログラマーではなく、最初に食べられるのは不明確である。

誰もが置き換えられるわけではないが、不明確さで生きているポジションは先に価値が下がる。

過去、多くのポジションが情報の差で生きていたが、今後は多くのポジションが標準偏差で死ぬことになる。

05 なぜ今これが流行しているのか

多くの人が尋ねる。このようなワークフロースタイルのものは以前にもあったが、なぜ今回皆が真剣になったのか?

なぜなら、以前は基盤が不十分だったからだ。

もっと直接的に言えば:

以前の多くのこの種のフレームワークは、見た目は美しいが、実行すると重く、結果は十分に硬くなかった。

あなたは多くのプロセスを構築し、多くの役割を積み上げ、多くのルールを書いたが、最後にはあまり信頼できないモデルを、より複雑な信頼できないシステムとして包装しただけだ。

だから過去、多くの人がエージェント、ワークフロー、スキャフォールドに対して忍耐を失ったのも当然だ。

方向が間違っていたのではなく、基盤がその段階に達していなかったのだ。

今は違う。

モデルが特定の閾値を超えると、元々装飾のようだったプロセスが、初めて真の価値を解放し始める。

なぜなら、基盤モデルが十分に強いとき、プロセスは単に無能なものを支えるのではなく、すでに連続して機能しているシステムを拡大することになるからだ。

これがハーネスが突然「少し真実らしく」見える理由である。

それは今日の理念が初めて出現したわけではなく、モデルがついにプロセスの恩恵を享受できるほど強くなったからだ。

アランの言葉は非常に的確だ:

モデルの能力はエンジンであり、ハーネスはトランスミッションである。

かつて良いエンジンがなければ、どんなに良いトランスミッションも置物に過ぎなかった。

しかし、エンジンが十分に強力になれば、トランスミッションは誰が高速道路に乗れるか、誰がその場でアクセルを踏み続けるかを決定し始める。

だから、この流れは単なる技術的流行ではなく、業界がより深い信号を発している:

未来の競争は、単に誰のモデルがより強力かではなく、誰がより早くモデルを生産システムに組み込むかである。

06 「人はデフォルトで中央に立つ」

最後にアランはカップを置き、あの日最も冷たい一言を言った:

「以前は人がソフトウェアを監視して働いていたが、今後はソフトウェアがソフトウェアを監視して働く。」

この言葉がなぜ心に響くのか?

それは、ハーネスが本当に書き換えているのは特定の職位ではなく、過去にほとんど誰も疑わなかった前提のより底層にあるからだ:

デジタル労働において、デフォルトで中央に人がいるべきであるということ。

彼はタスクを分解し、

彼は進捗を監視し、

彼は品質を判断し、

彼は再作業を調整し、

彼は最後の保証を行う。

この「デフォルトで中央に立つ人」は、プログラマーかもしれないし、PMかもしれないし、TLかもしれないし、デザイン責任者かもしれないし、QAかもしれないし、プロジェクトマネージャーかもしれない。

名前は重要ではない。

重要なのは、過去のデジタル生産システムがこのような人間の中枢を欠かせないということだ。

ハーネスが本当に動かしているのは、この中枢の位置だ。

それは今日すぐに人を追い出すと言っているのではなく、少しずつ証明している:

実は、いくつかの分解はシステムで行うことができ、

実は、いくつかの監視はシステムで行うことができ、

実は、いくつかの受け入れはシステムで行うことができ、

実は、いくつかのロールバックや再試行も人が最初に発見して処理する必要はない。

この事がますます証明されると、人間の位置はすぐに消えることはないが、沈下し始める。

デフォルトの中心から、例外的な介入へ;

全過程を監視するから、周辺の問題だけを処理するように;

プロセスの主人から、プロセスの観察者へ。

これがハーネスが本当に食べているものである。

プログラマーではない。

プロダクトマネージャーではない。

QAではない。

そしてこれらの役割の背後にあるより深い仮定である:

人間はデフォルトでプロセスの中心にいる。

そしてこの前提が緩むと、後の物語はすべて異なる。

ツールの時代は、誰がよりツールを使うのが上手かを競う。

ハーネスの時代は、誰が早く受け入れるかを競う:

自分がもはやシステムの真ん中にいるわけではないことを。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン