最もリアルな表現を持つロボットがAIGCによって進化！ Stable Diffusion に接続してペンで描画します

巴比特_

2023-07-02 03:11:24

出典: 量子ビット

**安定拡散がロボットに接続されると何が起こりますか? **

何を描きたいかを伝えて、一筆一筆描きます。

ホワイトボードにマーカーでベタベタした猫を上手に描きながら、隣の人間エンジニアと楽しそうに話したり笑ったりしている姿が見られました。

最後に、私は自分の名前**「Ameca」**に署名することを忘れずに、ペンを持つ手を上げて、完成したばかりの作品を目で確認し続けました。

アメカが人間にその仕事に満足しているか尋ねると、エンジニアの兄は「この絵は少し簡略化されています」と率直に答えた。

そこにガオ・ネンがやって来た。

アメカは怒って声を詰まらせた。

**私の絵が気に入らないなら、あなたはおそらく芸術を理解していないだけです。 **

英国 Engineered Arts 社のロボット Ameca は、かつてその本物そっくりで恐ろしい表情で有名でした。

ペンで描画する新しい機能が追加され、多くのネチズンを驚かせました。

本物のスケッチアーティストのように、ストロークごとにペンをそっと持ち上げます。この小さなディテールはとてもクールです。

## **ロボットはどのようにペンで絵を描くのでしょうか? **

Ameca が絵を描く方法を学ぶ方法は、それ自体で説明できます。

オープンソースの Stable Diffusion を使用して、生成された画像をスケルトン化およびベクトル化し、変換された軌跡をアクションに変換して実行します。

このようにして、Ameca の体の動きと顔の表情は、Engineered Arts の自社開発テクノロジーによって駆動され、その言語能力は GPT-3 (はい、3.5 ではありません) に Stable Diffusion を加えたもので、ロボットペインターを形成します。

一部のネチズンは、このような能力は教育に非常に役立ち、学生にとってはコンピューター画面を見つめるよりもロボットを使用する方がはるかに興味深いと述べました。

エンジニアド・アーツが自社開発した技術には、ロボットオペレーティングシステム「Tritium」やロボット生産プラットフォーム「Mesmer」などがある。

まず、36 台のカメラを使用して、骨格、肌の質感、表情を含む大量の実際の顔データを行き止まりなくキャプチャします。

これらのデータを 3D モデリングし、ロボットのシリコンスキンを 3D プリントします。

Tritium オペレーティングシステムは、ハードウェア、ソフトウェア、クラウドを接続し、ロボットのあらゆるコンポーネントを駆動することができ、顔に加えて、頭、首、手足のさまざまな「筋肉」にも影響を与えます。

その結果、よりリアルな表現が可能になります。

言語モデル GPT-3 と音声テクノロジーと組み合わせることで、Ameca は当初、人間と対話する能力を備えていました。

今回は絵画に加えて、Engineered Arts は人間が Ameca と音楽について話し合う別のビデオも公開しました。おそらくこれが次の挑戦の方向性であることを示唆しています。

ジャズ、クラシック、電子音楽が好きというアメカさんに、人間は「この３つのスタイルを組み合わせて曲を作りたい場合、歌詞の最初の行は何ですか？」という難しい問題を与えた。

Amecaは少し考えた後に答えを出しました。

また、Amecaは現在もネチズンと交流する活動を行っている。

質問がある場合は、元のビデオのコメント領域にメッセージを残してください。次のビデオでは、Ameca があなたの質問に答えるかもしれません。

参考リンク：

[1]

[2]

[3]

免責事項：このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

0/400

コメントなし