Microsoft führt Funktionen „Critique“ und „Council“ für Copilot Researcher ein, DRACO-Testscore 57,4 führt die Branche an

GateNews

Gate News Mitteilung, am 31. März kündigte Microsoft am Montag zwei neue Funktionen für Copilot Researcher an – Critique und Council –, mit denen das GPT von OpenAI und das Claude von Anthropic für dieselbe Forschungsaufgabe kombiniert werden. Critique verwendet einen sequentiellen Kollaborationsmodus: GPT übernimmt die Planung der Forschung, die Recherche von Materialien und das Erstellen eines ersten Entwurfs, danach fungiert Claude als Prüfer, um die faktische Genauigkeit und die Qualität der Zitate zu überprüfen; Council versetzt die beiden Modelle hingegen in die Lage, Berichte parallel und unabhängig zu erstellen, und ein drittes Richter-Modell gleicht dann die Unterschiede ab und fasst die Meinungsverschiedenheiten zusammen. In dem DRACO-Benchmark mit 100 komplexen Forschungsaufgaben in insgesamt 10 Bereichen wie Medizin, Recht und Technologie erzielte Copilot mit Critique 57,4 Punkte und lag damit fast 14 % vor dem zweiten Platz, weit über den 42,7 Punkten, die Claude Opus bei alleiniger Ausführung erreichte.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare