Gate News Mitteilung, am 31. März kündigte Microsoft am Montag zwei neue Funktionen für Copilot Researcher an – Critique und Council –, mit denen das GPT von OpenAI und das Claude von Anthropic für dieselbe Forschungsaufgabe kombiniert werden. Critique verwendet einen sequentiellen Kollaborationsmodus: GPT übernimmt die Planung der Forschung, die Recherche von Materialien und das Erstellen eines ersten Entwurfs, danach fungiert Claude als Prüfer, um die faktische Genauigkeit und die Qualität der Zitate zu überprüfen; Council versetzt die beiden Modelle hingegen in die Lage, Berichte parallel und unabhängig zu erstellen, und ein drittes Richter-Modell gleicht dann die Unterschiede ab und fasst die Meinungsverschiedenheiten zusammen. In dem DRACO-Benchmark mit 100 komplexen Forschungsaufgaben in insgesamt 10 Bereichen wie Medizin, Recht und Technologie erzielte Copilot mit Critique 57,4 Punkte und lag damit fast 14 % vor dem zweiten Platz, weit über den 42,7 Punkten, die Claude Opus bei alleiniger Ausführung erreichte.