Стартап в области ИИ Retrieval SID обвиняет векторную базу данных Chroma в плагиате исследований

AirdropBlackHole · 2026-03-28T02:29:46+00:00

Макс Румпф, генеральный директор SID.ai, обвинил Chroma в плагиате исследований его компании SID-1 при разработке модели Context-1. Он подчеркнул сходства без указания источника, предоставил переписку в качестве доказательства и раскритиковал практики Chroma, назвав их вредными для целостности исследований.

AirdropBlackHole

2026-03-28 02:29:46

Генерация тезисов в процессе

Согласно мониторингу 1M AI News, Макс Румпф, генеральный директор компании SID.ai, занимающейся исследованием извлечения информации с использованием ИИ, публично обвинил открытый векторный базу данных Chroma в том, что она сильно заимствовала из исследования SID-1, опубликованного в декабре прошлого года, в длинном посте в X. Румпф утверждал, что недавно выпущенная модель Context-1 от Chroma не предоставила никаких цитат или упоминаний. Он поделился электронной перепиской с генеральным директором Chroma Джеффом Хубером в качестве доказательства. В октябре 2025 года Хубер проактивно поинтересовался, какую модель Румпф обучает, на что Румпф ответил, что он работает над «моделью извлечения агентов, похожей на SWE-grep от Cognition, но для общего извлечения, которая уже сильнее Sonnet 4.5 и Gemini 2.5 Pro». После того как технический отчет SID-1 был опубликован в декабре 2025 года, Румпф снова поделился ссылкой с Хубером, на что тот ответил: «Поздравляю». Обе компании являются выпускниками YC и имеют офисы рядом друг с другом. И SID-1, и Context-1 являются моделями извлечения агентов, обученными с использованием обучения с подкреплением, позиционируясь как подагенты извлечения для современных моделей рассуждений, и обе используют синтетические данные для обучения, утверждая, что достигают Парето оптимальности по затратам и задержке. Румпф перечислил конкретные сходства, включая: Рисунок 1, использующий тот же переключатель двойного обзора скорости/стоимости, параллельное четырехстороннее инференсирование, совмещенное с RRF (Рекипрокальное Ранжирование Фьюжн) для агрегации результатов, а также общую структуру диаграмм, наборов данных и методологий. Технический отчет для Context-1 ссылался на связанные работы, такие как WebExplorer, SWE-grep и Search-R1, но не упоминал SID-1 в тексте, а также бенчмарковые оценки не включали SID-1 для сравнения. Румпф заявил, что Chroma «сознательно заявила о Парето оптимальности, в то время как существует другая модель» и указал, что, хотя Context-1 открыто опубликовал свои веса, инференсная структура, необходимая для работы, еще не была выпущена, что мешает SID проводить бенчмарковые тесты. Румпф выразил, что эта практика «полностью разрушает мотивацию для нас (и других) делиться углубленной информацией в технических отчетах» и назвал это «сожалеющей плохой исследовательской практикой в академии, которая распространяется на стартапы». На момент публикации Chroma не дала публичного ответа.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .