Джерело зображення: згенеровано безмежною штучним інтелектом
Весняні свята 2025 року щойно минули, але хвилі від DeepSeek все ще не вщухають.
За допомогою методів навчання FP8, багатоелементного передбачення, вдосконаленої архітектури MOE, багатоголового потенційного механізму уваги (MLA), посиленого навчання без SFT тощо, DeepSeek-V3 забезпечує високу продуктивність за низької вартості навчання, що перевершує відомі відкриті моделі, такі як Qwen2.5-72B та Llama-3.1-405B, а також деякі закриті моделі. DeepSeek-R1 показує ще кращі результати в розумінні, ніж OpenAI o1.
Успіх моделей серії DeepSeek відкрив новий шлях для великої модельної промисловості, яка раніше базувалася на обчислювальній потужності, і підняв базові великі моделі на зовсім новий рівень.
Однак, крім базових великих моделей з «технологічним наративом» як основною темою, таких як DeepSeek, існує ще один тип прогресу досліджень і розробок великих моделей, вартий уваги, тобто прикладна велика модель, яка здійснює технологічні інновації штучного інтелекту навколо основних продуктів і основних сценаріїв.
Китай завжди був великою країною в застосуванні.
У 2024 році, в умовах поступового збільшення потужності обчислень та значного зниження вартості обробки, вітчизняні застосування штучного інтелекту почали стрімко розвиватися - як в області графічних та відео додатків, таких як інтелектуальне малювання, камера інтелектуального відео, KanLing, так і в галузі пошуку за допомогою штучного інтелекту, таких як нано-пошук (раніше 360 AI пошук), TGAI пошук, а також в сфері AI-супроводу, таких як Xingye, Cat Box, або AI-помічники, таких як DouBao, Quark, Kimi, Tongyi тощо. У 2024 році всі вони пережили вибух користувацької активності.
Ці програми штучного інтелекту неможливі без підтримки модельних здібностей. Для програм штучного інтелекту важливіше не параметри моделі, а результати застосування в реальних умовах.
Наприклад, причина, по якій Kimi зміг привернути до себе високу увагу за короткий проміжок часу, невіддільна від довгих можливостей читання тексту і розбору великої моделі, що стоїть за ним. 200 мільйонів користувачів Quark і 70 мільйонів активних користувачів щомісяця пояснюються «зручністю для користувача» кваркової моделі, що стоїть за нею; Потужні функції відео Wensheng і Tusheng від Keling AI покладаються на підтримку великої моделі Kelin.
Еволюція базових великих моделей ще далека від завершення, але оскільки у 2025 році все більше компаній почнуть розгортати програми штучного інтелекту, розробка великих моделей на основі додатків стане необхідною передумовою для повного вибуху додатків штучного інтелекту.
Чому великі фабрики мають перевагу в застосуванні штучного інтелекту
З 2025 року рік стає роком вибуху застосування штучного інтелекту, що майже стало загальною думкою у світі технологій завдяки зростанню впливу технології великої моделі, поступовому вдосконаленню обчислювальної інфраструктури, посиленню державної політики, появі нових вбивцьких додатків, таких як Sora/Suno, та потужному зростанню інвестицій у сфері AI Agent/інтелектуальний агент/AI іграшки/AI окуляри.
І цей консенсус ще швидше через популярність DeepSeek. Тому що DeepSeek піднімає рівень базових модельних здатностей галузі, створюючи кращі умови для розвитку штучного інтелекту.
Згідно зі спостереженням «Jiazi Lightyear», з другої половини 2024 року такі відомі інвестиційні інститути, як Hillhouse Capital, Matrix Partners, Baidu Venture Capital та Innova, збільшили свої інвестиції в програми штучного інтелекту, особливо роблячи ставку на проєкти на ранніх стадіях, орієнтованих на програми штучного інтелекту. Деякі інвестори заявили, що до кінця 2024 року кількість проєктів із застосуванням ШІ, які фактично отримали фінансування на первинному ринку, буде щонайменше вдвічі більшою, ніж кількість проєктів, про які було оголошено насправді.
Дані Sensor Tower також показують, що до 2024 року світові витрати користувачів мобільних телефонів на застосування штучного інтелекту досягли 1,27 мільярда доларів, а кількість завантажень AI-пов'язаних застосунків в магазинах програм iOS і Google Play сягнула 17 мільярдів.
Проте жорстка реальність полягає в тому, що застосування штучного інтелекту тисячі разів, але лише кілька з них можуть довго функціонувати, а ще менше можуть спалахнути.
"Світло року" колись повідомляло про веб-сайт під назвою "AI Graveyard", на якому було зібрано 738 мертвих або припинених роботи застосунків штучного інтелекту, серед яких були деякі колишні зіркові проекти: такі як AI-продукт розпізнавання мови Whisper.ai від OpenAI, відомі оболонки від Stable Diffusion - FreewayML та StockAI, а також штучний інтелект пошуковика Neeva, який колись вважався "конкурентом Google" (детальніше див. "AI Graveyard, та 738 мертвих проектів з AI | Світло року").
Отже, які ж ШІ-додатки можуть працювати тривалий час і мати життєздатність?
«Цзязі Лайтер» вважає, що перший полягає в тому, щоб взяти модель за ядро і повною мірою розкрити можливості моделі; По-друге, мати достатньо чітке уявлення про потреби користувачів.
Глава Microsoft Сатья Наделла висловився щодо тенденцій розвитку галузі штучного інтелекту до 2025 року, заявивши, що "додатки на основі моделей ШІ стануть ключовими у різних галузях діяльності до 2025 року". Іншими словами, додатки, які мають якнайменше оболонок, що найближче до моделі та максимально використовують можливості моделі, найбільше привертають користувачів до використання та утримання.
Подивившись на список продуктів штучного інтелекту в новому списку в січні 2025 року, неважко виявити, що серед топ-10 у вітчизняному списку 8 – це програми AI-помічників, безпосередньо побудовані на моделях.
Джерело: Xinbang
Щоб мати достатньо глибоке розуміння потреб користувачів, потрібна велика користувацька база - лише маючи достатньо багато користувачів, дані та мітки користувачів можуть бути насамперед достатньою кількістю та густинею, щоб підприємство могло виявити найбільш справжні потреби користувачів.
Це також означає, що великі фірми мають перевагу у розробці застосунків штучного інтелекту.
Великі виробники мають достатню обчислювальну потужність і таланти для розробки власних моделей, тому вони можуть безпосередньо розгортати програми штучного інтелекту поверх своїх самостійно розроблених моделей без необхідності багатошарового обстрілу. Великі виробники також мають величезну базу користувачів і зрілі входи в трафік, які не тільки роблять дані користувачів багатшими та простішими для майнінгу попиту, але й надають природні переваги для просування додатків штучного інтелекту. Крім того, потужні можливості екологічної інтеграції великих виробників також допоможуть забезпечити багатші функції для продуктів і підвищити привабливість додатків штучного інтелекту для користувачів.
Зазначений вище список продуктів також підтверджує це. З перших десяти додатків шість з них належать великим компаніям.
У своєму останньому інтерв'ю жу Хяоху також зазначив, що бар'єри даних стартапу не настільки високі, щоб робити базову модель, а потрібно ще більше затягнути "клієнтів" над базовою моделлю. Це також в певній мірі підтверджує переваги великих компаній в галузі застосування штучного інтелекту.
В цілому моделі і застосування великих виробників також обумовлюють і впливають один на одного, і разом складають маховик зростання:
Велика база користувачів забезпечує накопичення даних для розробки моделей, що допомагає покращити їхню ефективність та краще пристосувати до конкретних сценаріїв та потреб користувачів; зростання ефективності моделей в свою чергу позитивно впливає на застосунки, надаючи їм більшу продуктивність та залучаючи більше користувачів.
Цей модель, яка має велику користувацьку базу, направлена на розвиток за потребами користувачів, здатна краще проявляти свої можливості в конкретних сценаріях, може бути названа "Велика модель застосування". Чим більше штучний інтелект ґрунтується на цій моделі, тим теоретично більше ймовірностей успішної реалізації.
Наприклад, кварки, які займають друге місце в списку, від DeepSeek, є типовим представником.
«Кварк» помічено, що в останній битві богів за застосуванням штучного інтелекту раніше мало відомий кварк тихенько вибивається в лідерах. За останніми даними від Analysys, до кінця 2024 року кварк очолив рейтинг мобільних додатків зі штучним інтелектом з місячною активністю в 71,02 млн користувачів, випередивши відомих всім Dou Bao та Kimi.
Джерело зображення: Аналітика Yi Guan
Більш важливим є показник "прилипання користувачів".
Згідно зі статистикою сторонніх звітів, триденний рівень утримання Quark становить понад 40%, порівняно з приблизно 25% гучних крісел-мішків і розумних помічників Kimi на ринку за той же період; Згідно з «Списком потужних продуктів штучного інтелекту 2024 року», опублікованим Qimai Data, Quark посідає перше місце в «Щорічному списку додатків для продуктів штучного інтелекту» та «Щорічному списку завантажень продуктів» із сукупним обсягом завантажень понад 370 мільйонів у 2024 році, що є унікальним серед усіх видів продуктів штучного інтелекту та досягло помилкового лідерства.
Серед безлічі продуктів штучного інтелекту в списку Quark не був першим, хто випустив велику модель, але він непомітно досяг далекого лідерства за кількістю відвідувань, завантажень і прихильності користувачів. Як Quark може досягти успіху на висококонкурентному ринку?
Все завдяки продуктовій та модельній стратегії Quark, орієнтованій на застосування.
Застосування спочатку, відтворення сценаріїв великої моделі до модернізації
Quark зосередився на «інтелектуальному та точному пошуку» з першого дня пошуку, не тільки покладаючись на простий інтерфейс без реклами та більш точні результати пошуку, щоб швидко прорвати діру на ринку, але й на основі пошукового бізнесу, навколо студентської партії та груп офісних працівників, які походять від quark network disk, quark scanning king, quark document, quark learning та інших вертикальних продуктів, сцена поступово поділяється на сферу навчання та роботи.
На прикладі вивчення у 2020 році Quark випустив функцію "фотозвіт по питаннях". Під час епідемії команда навчання Quark знову кілька разів оновлювала функцію "фотозвіт по питаннях", оскільки багато учнів були заблоковані вдома для вивчення в Інтернеті та стикалися з труднощами ефективного навчання.
В офісній сфері Quark також запустив ряд пов'язаних функцій, таких як вилучення тексту, таблиць, видалення рукописного тексту, сканування документів і перетворення формату документа з вертикального сценарію «сканування».
Простий фон інструментів, все більше та більше застосувань сценаріїв, разом з екологією приваблення нових користувачів без реклами та безкоштовної підписки на початковому етапі, дозволяють кількості користувачів Quark раптово зрости, з мільйонів до десятків мільйонів, накопичена кількість обслугованих користувачів перевищує мільярд.
У листопаді 2023 року Quark випустила модель великого масштабу Quark з мільярдами параметрів.
Велика модель кварка — це мультимодальна велика модель, незалежно розроблена компанією Quark на основі архітектури Transformer, яка щодня навчатиме та налаштовуватиме сотні мільйонів графічних даних, і має характеристики низької вартості, високого відгуку та сильних всеосяжних можливостей. Зіткнувшись з потребами користувачів і вертикальними сценаріями кваркових продуктів, велика модель quark приділяє більше уваги практичним додаткам і виводить вертикальні моделі, такі як загальні знання, медичне обслуговування та освіта, щоб забезпечити більш професійні та точні технічні можливості.
У той ж час, коли Quark випустила велику модель кварку, Quark покращила ефективність розпізнавання штучного інтелекту продуктів сканування та можливості пошуку штучного інтелекту продуктів хмарного сховища.
Перший сценарій приземлення кваркової моделі – це здоров'я та лікування.
У грудні 2023 року Quark оголосила про комплексне оновлення своєї функції пошуку здоров'я, запустивши програму штучного інтелекту «Помічник здоров'я Quark» у грудні 2023 року. «Quark Health Assistant» об'єднує медичний графік знань і можливості генеративного діалогу, щоб надати користувачам більш повну та точну інформацію про здоров'я, а також підтримує користувачів у кількох раундах запитань та розмов про проблеми зі здоров'ям.
У січні 2024 року Quark почав послідовно випускати функції, такі як “AI Learning Assistant”, “AI Listening and Taking Notes”, “AI PPT” та інші, і в липні 2024 року випустив всеосяжний сервіс на основі пошуку за допомогою штучного інтелекту на мобільних пристроях, а в серпні 2024 року випустив здатний працювати в будь-якому сценарії штучний інтелект на PC нового покоління.
Наприклад, користувач шукає “Які пам'ятки в Шаньсі лежать в основі чорної міфології Вуконга”. Суперпошук Кварк об'єднує відповіді ШІ, первинні джерела і історію пошуку у єдине ціле - він не лише генерує інтелектуальні підсумки, як інші ШІ-пошуки, але й показує джерела в бічній панелі та залишається звичайним веб-поданням пошукових систем під відповідями ШІ. Це підвищує ефективність отримання інформації користувачів та збільшує достовірність відповідей ШІ.
Крім того, Quark також побудував єдину систему інформаційних послуг навколо «супер вікна пошуку», включаючи мережевий диск, сканування, обробку документів, помічника здоров'я та інші інтелектуальні інструменти, реалізуючи весь процес від пошуку до створення, узагальнення, редагування, зберігання та обміну, надаючи користувачам безперебійний досвід роботи з інформаційними послугами.
На відміну від багатьох великих виробників, що копіюють ChatGPT і запускають Chatbot-подібних AI-помічників “All in One”, стратегія Quark - це “AI in All” - вбудування можливостей штучного інтелекту в кожен аспект продукту та впровадження їх у конкретні сценарії застосування.
Від початкового пошуку фотографій до консультації щодо вступу до коледжу та інтелектуальної допомоги в офісі, еволюція продуктів Quark завжди зосереджувалася на потребах користувачів у конкретних сценаріях. З тих пір Quark послідовно запускає та оновлює такі функції, як пошук запитань ШІ, академічний пошук ШІ та поради щодо штучного інтелекту для створення диференційованих додатків штучного інтелекту для навчання та офісних сценаріїв.
Минулий рік розвиток QuarkAI, картографування: Jia Zi Light Year
Серед них функція «AI Search», яка буде оновлена в листопаді 2024 року, є типовим представником можливостей ШІ Quark.
Фактично, ще в грудні 2023 року Quark запустив тематичного помічника зі штучним інтелектом. У той час тематичні помічники зі штучним інтелектом все ще більше покладалися на «базу знань» банку запитань, а ШІ міг навчити користувачів лише робити запитання в банку запитань. Оновлений продукт пошуку запитань зі штучним інтелектом має сильніший «інтелект», який може не лише відповідати на оригінальні запитання в банку запитань, а й стикатися з новими питаннями та проблемами. Використання великої моделі «Ланцюжок мислення (CoT)» дозволяє Quark AI по черзі представляти ідеї вирішення проблем і кроки їх вирішення, надаючи користувачам більш детальний аналіз контенту та рекомендації щодо навчання.
У порівнянні з аналогічними продуктами пошуку запитань, які в основному покладаються на банки запитань і можуть відповідати лише на запитання в галузі K12, продукти пошуку запитань зі штучним інтелектом Quark можуть не тільки відповідати на нові запитання в галузі K12, але й відповідати на професійні запитання на вступних іспитах до аспірантури, державних вступних іспитах та різних кваліфікаційних іспитах. Користувачам потрібно лише зробити фото або скріншот, а Quark може шукати відповідне запитання та крок за кроком давати професійний контент у графіці, відео та відповідях ШІ. Крім того, на запитання в таких галузях, як право та медицина, «пошукові запитання штучного інтелекту» Quark також можуть дати відповіді.
Відповідь кварка на справжні запитання юридичного екзамену
Тим часом, кварк "AI пошук питань" також може використовувати можливості штучного інтелекту для глибокого пояснення тематичних пунктів та основних аспектів у завданнях, точно визначаючи ключові кроки, щоб користувач не лише вивчив це завдання, а й зміг "застосувати отримані знання" для вивчення цього типу завдань.
Кварк "AI Search" має потужні можливості не лише завдяки накопиченню кваркового пошуку протягом багатьох років, великій кількості високоякісного матеріалу та потреб користувачів в навчальних ситуаціях, але й підтримку від Кварка введеної в той же час великої моделі "Lingzhi" для навчання.
Модель "Lingzhi" є результатом тренування високоякісних даних, накопичених командою Quark в галузі освіти протягом багатьох років на основі "Великої моделі Quark". Вона не тільки має здатність до мислення ланцюга, яку мають багато передових моделей, але й може перетворити процес мислення на мову, яку учні можуть зрозуміти та яка більш відповідає їхньому процесу навчання.
Іншими словами, обидва розповідають учням про одне завдання, велика модель 'Лінчжи' краще знає, які пункти знань потрібно пояснити та як будувати стратегію вирішення завдання.
Візьмемо для прикладу математичні запитання вступного іспиту до Пекінського коледжу 2024 року, введіть їх у DeepSeek і quark відповідно та отримайте такі відповіді:
Відповідь DeepSeek
Відповідь, яку дав кварк
Можна побачити, що порівняно з довгим та складним викладом мисленнєвого ланцюга DeepSeek та офіційною відповіддю на будь-яке питання, від Quark дано більш стислу відповідь, яка більше нагадує пояснення до задачі.
У зв'язку з великою кількістю сценаріїв «пояснення знань» і «науково-популярного» індустрія освіти висунула високі вимоги до мультимодальної здатності моделей. Однак існуючі мультимодальні моделі мають погане розпізнавання формул, рукописних нотаток і т.д., особливо тонке розуміння графіків.
Для того, щоб розв'язати цю задачу, кваркова «гностична» велика модель конструює великомасштабний корпус професійної підготовки за допомогою великомасштабної мультимодальної бази попереднього навчання, і в той же час забезпечує кращий ефект розуміння структури моделі.
У новому тестуванні виявлено, що велика модель Quark 'Lingzhi' має таку ж точність і відсоток балів на математичних питаннях, як OpenAI-o1, а також перевищує інші внутрішні моделі. У багатьох важливих тестах внутрішніх математичних конкурсів та вступних іспитах Quark також перебуває в абсолютному лідерстві.
Відображено результати математичної оцінки великої моделі «Гностик»
Джерело: Quark
На відміну від таких компаній, як DeepSeek, які розробляють суто базові можливості моделі, R&D-модель Quark орієнтується на потреби користувачів. Беручи за приклад написання текстів зі штучним інтелектом, технічна команда Quark розробила культурну та творчу модель Quark, яка може генерувати понад 8 000 довгих есе, використовуючи багатоступеневу технологію CoT та покращення пошуку, щоб задовольнити потреби молодих користувачів Quark у написанні звітів та статей, забезпечуючи ефект дотримання кількості слів. І навіть DeepSeek наразі може генерувати есе лише до 3 000 слів.
Крім того, функція написання штучного інтелекту Quark також еквівалентна «текстовому онлайн-редактору», де користувачі можуть видаляти, шліфувати, розширювати та виконувати інші складні операції над створеними статтями, що також невіддільно від підтримки можливостей культурної та творчої моделі Quark.
Можна сказати, що, коли у всьому світі усі "завивають" великі параметри моделі, кварк вже більше зосередився на практичних сценаріях застосування, виходячи з потреб користувачів, щоб спрямовано покращити можливості моделі. На сьогоднішній день Quark вже сформував системні здатності штучного інтелекту для всіх сценаріїв.
Джерело зображення: кварк
Прискорення до C Умови Алі AI
Будучи одним з чотирьох інноваційних бізнесів Alibaba стратегічного рівня, кожен крок Quark відображає не тільки його самого, але і напрямок всього бізнесу Alibaba AI To C.
15 січня Quark оновив брендовий слоган - "Усеприсутній помічник штучного інтелекту для 200 мільйонів людей", показавши новий бізнес-тенденції у галузі дослідження штучного інтелекту для сегмента АІ до C. Нещодавно засновник Alibaba Джек Ма раптово "з'явився" в офісі Alibaba у Ханчжоу, також відвідався офіс сегменту бізнесу АІ до C, такого як Quark.
Останнім часом Алі часто робить кроки в галузі AI To C: по-перше, Ву Цзя, керівник «Школи Молодого Чжуана», повернувся в Alibaba Group, щоб вивчити бізнес AI To C; Потім додаток штучного інтелекту Alibaba «Tongyi» був офіційно відокремлений від Alibaba Cloud і об'єднаний з Alibaba Intelligent Information Business Group; Останнім часом, за даними ЗМІ, апаратна команда Tmall Genie також працює над інтеграцією з продуктовою командою Quark, і в її фокусі – планування та визначення нового покоління продуктів штучного інтелекту, а також інтеграція з можливостями штучного інтелекту Quark. Після того, як команда буде інтегрована, нова команда також досліджуватиме нові напрямки обладнання, включаючи окуляри зі штучним інтелектом.
Відтоді Quark, Tongyi App і Tmall Genie будуть використовуватися як інструменти продуктивності, чат-боти та апаратне забезпечення штучного інтелекту для надання користувачам диференційованих послуг.
6 лютого сфера змісту Alibaba відкрила важку фігуру - професор Стівен Хой, провідний у світі вчений у галузі штучного інтелекту, офіційно приєднався до Alibaba як віце-президент Alibaba Group, підпорядковуючись Ву Цзя, відповідальному за мультимодальну базову модель бізнесу AI To C та пов'язані з агентами фундаментальні дослідження та прикладні рішення.
За словами інсайдерів, професор Сюй Чжухун зосередиться на мультимодальній базовій моделі бізнесу AI To C та фундаментальних дослідницьких і прикладних рішеннях, пов'язаних з агентами, що значно посилить стрибок у наскрізних можливостях замкнутого циклу C-кінцевих продуктів Alibaba AI Application у поєднанні моделей та додатків. Після того, як можливості мультимодальних базових моделей досягли прориву, C-кінцеві додатки, такі як кварки, отримали новий простір для досліджень у бізнесі.
У той же час підрозділ Alibaba AI To C створює провідну команду дослідників та інженерів алгоритмів штучного інтелекту для залучення великої кількості видатних талантів у галузі. Згідно з аналізом інсайдерів галузі, на початку 2025 року приєднання топових вчених світового рівня можна розцінювати як важливий сигнал для Ali AI To C збільшити інвестиції в таланти та ресурси. Команда найкращих талантів великої моделі підтримає поглиблене дослідження Alibaba AI To C у напрямку мультимодальних агентів, а також відкриє простір для уяви для наступного етапу створення орієнтованої на користувача платформи додатків штучного інтелекту.
Сьогодні Byte вклала значні кошти в сферу додатків штучного інтелекту, перезапустивши стратегію «App Factory», енергійно інвестуючи в потоки, внутрішні кінні перегони та активно виїжджаючи за кордон. Tencent запустила два продукти, «Yuanbao» та «Yuanqi», у напрямку помічників штучного інтелекту та розумних близнюків, і повернула увагу громадськості за допомогою нещодавно запущеного інструменту управління персональними знаннями ima.copilot, тоді як Baidu запустила матрицю продуктів штучного інтелекту, включаючи Wenxin Yiyan, Wenxin Yige, Orange AI та Super Canvas тощо, щоб здійснювати «атаки насичення» на друзів із «великим і повним» підходом. Крім того, нові стартапи, такі як велика модель «Six Little Tigers» і DeepSeek, також доклали зусиль для застосування ШІ, а бізнес Alibaba AI To C можна охарактеризувати як оточений сильними ворогами, і тиск можна собі уявити.
Однак має бути рішення проблеми. Завдяки стратегії «AI in All» і точному контролю потреб користувачів, Quark довів, що сильної потужності продукту можна досягти без орфографічних параметрів, покладаючись на «великі моделі додатків» і точне розуміння потреб користувачів, що також є ще однією версією «низької вартості та високої ефективності»; А ще понад 200 мільйонів користувачів і топ щомісячного активного рейтингу. Це також доводить правильність стилю гри Quark і світле майбутнє бізнесу Алі AI To C.
У той момент, коли технологія штучного інтелекту увійшла в «глибоководну область застосування», інноваційна парадигма Quark дала нам ключове просвітлення: справжній технологічний прогрес полягає не тільки в тому, скільки технологічних вершин можна підняти, але і в тому, скільки науково-технічних досягнень можна перетворити в цінність, до якої можна доторкнутися кінчиками пальців користувачів. І тільки тоді, коли користувачі дійсно зроблять вибір і проголосують за застосування ШІ практичними діями, ця проривна битва, пов'язана з практичним застосуванням технології штучного інтелекту, може дійти до справжньої точки конкуренції, яка визначить майбутню промислову модель.
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
Інновації в галузі штучного інтелекту, нові наративи за межами DeepSeek
Джерело зображення: згенеровано безмежною штучним інтелектом
Весняні свята 2025 року щойно минули, але хвилі від DeepSeek все ще не вщухають.
За допомогою методів навчання FP8, багатоелементного передбачення, вдосконаленої архітектури MOE, багатоголового потенційного механізму уваги (MLA), посиленого навчання без SFT тощо, DeepSeek-V3 забезпечує високу продуктивність за низької вартості навчання, що перевершує відомі відкриті моделі, такі як Qwen2.5-72B та Llama-3.1-405B, а також деякі закриті моделі. DeepSeek-R1 показує ще кращі результати в розумінні, ніж OpenAI o1.
Успіх моделей серії DeepSeek відкрив новий шлях для великої модельної промисловості, яка раніше базувалася на обчислювальній потужності, і підняв базові великі моделі на зовсім новий рівень.
Однак, крім базових великих моделей з «технологічним наративом» як основною темою, таких як DeepSeek, існує ще один тип прогресу досліджень і розробок великих моделей, вартий уваги, тобто прикладна велика модель, яка здійснює технологічні інновації штучного інтелекту навколо основних продуктів і основних сценаріїв.
Китай завжди був великою країною в застосуванні.
У 2024 році, в умовах поступового збільшення потужності обчислень та значного зниження вартості обробки, вітчизняні застосування штучного інтелекту почали стрімко розвиватися - як в області графічних та відео додатків, таких як інтелектуальне малювання, камера інтелектуального відео, KanLing, так і в галузі пошуку за допомогою штучного інтелекту, таких як нано-пошук (раніше 360 AI пошук), TGAI пошук, а також в сфері AI-супроводу, таких як Xingye, Cat Box, або AI-помічники, таких як DouBao, Quark, Kimi, Tongyi тощо. У 2024 році всі вони пережили вибух користувацької активності.
Ці програми штучного інтелекту неможливі без підтримки модельних здібностей. Для програм штучного інтелекту важливіше не параметри моделі, а результати застосування в реальних умовах.
Наприклад, причина, по якій Kimi зміг привернути до себе високу увагу за короткий проміжок часу, невіддільна від довгих можливостей читання тексту і розбору великої моделі, що стоїть за ним. 200 мільйонів користувачів Quark і 70 мільйонів активних користувачів щомісяця пояснюються «зручністю для користувача» кваркової моделі, що стоїть за нею; Потужні функції відео Wensheng і Tusheng від Keling AI покладаються на підтримку великої моделі Kelin.
Еволюція базових великих моделей ще далека від завершення, але оскільки у 2025 році все більше компаній почнуть розгортати програми штучного інтелекту, розробка великих моделей на основі додатків стане необхідною передумовою для повного вибуху додатків штучного інтелекту.
З 2025 року рік стає роком вибуху застосування штучного інтелекту, що майже стало загальною думкою у світі технологій завдяки зростанню впливу технології великої моделі, поступовому вдосконаленню обчислювальної інфраструктури, посиленню державної політики, появі нових вбивцьких додатків, таких як Sora/Suno, та потужному зростанню інвестицій у сфері AI Agent/інтелектуальний агент/AI іграшки/AI окуляри.
І цей консенсус ще швидше через популярність DeepSeek. Тому що DeepSeek піднімає рівень базових модельних здатностей галузі, створюючи кращі умови для розвитку штучного інтелекту.
Згідно зі спостереженням «Jiazi Lightyear», з другої половини 2024 року такі відомі інвестиційні інститути, як Hillhouse Capital, Matrix Partners, Baidu Venture Capital та Innova, збільшили свої інвестиції в програми штучного інтелекту, особливо роблячи ставку на проєкти на ранніх стадіях, орієнтованих на програми штучного інтелекту. Деякі інвестори заявили, що до кінця 2024 року кількість проєктів із застосуванням ШІ, які фактично отримали фінансування на первинному ринку, буде щонайменше вдвічі більшою, ніж кількість проєктів, про які було оголошено насправді.
Дані Sensor Tower також показують, що до 2024 року світові витрати користувачів мобільних телефонів на застосування штучного інтелекту досягли 1,27 мільярда доларів, а кількість завантажень AI-пов'язаних застосунків в магазинах програм iOS і Google Play сягнула 17 мільярдів.
Проте жорстка реальність полягає в тому, що застосування штучного інтелекту тисячі разів, але лише кілька з них можуть довго функціонувати, а ще менше можуть спалахнути.
"Світло року" колись повідомляло про веб-сайт під назвою "AI Graveyard", на якому було зібрано 738 мертвих або припинених роботи застосунків штучного інтелекту, серед яких були деякі колишні зіркові проекти: такі як AI-продукт розпізнавання мови Whisper.ai від OpenAI, відомі оболонки від Stable Diffusion - FreewayML та StockAI, а також штучний інтелект пошуковика Neeva, який колись вважався "конкурентом Google" (детальніше див. "AI Graveyard, та 738 мертвих проектів з AI | Світло року").
Отже, які ж ШІ-додатки можуть працювати тривалий час і мати життєздатність?
«Цзязі Лайтер» вважає, що перший полягає в тому, щоб взяти модель за ядро і повною мірою розкрити можливості моделі; По-друге, мати достатньо чітке уявлення про потреби користувачів.
Глава Microsoft Сатья Наделла висловився щодо тенденцій розвитку галузі штучного інтелекту до 2025 року, заявивши, що "додатки на основі моделей ШІ стануть ключовими у різних галузях діяльності до 2025 року". Іншими словами, додатки, які мають якнайменше оболонок, що найближче до моделі та максимально використовують можливості моделі, найбільше привертають користувачів до використання та утримання.
Подивившись на список продуктів штучного інтелекту в новому списку в січні 2025 року, неважко виявити, що серед топ-10 у вітчизняному списку 8 – це програми AI-помічників, безпосередньо побудовані на моделях.
Джерело: Xinbang
Щоб мати достатньо глибоке розуміння потреб користувачів, потрібна велика користувацька база - лише маючи достатньо багато користувачів, дані та мітки користувачів можуть бути насамперед достатньою кількістю та густинею, щоб підприємство могло виявити найбільш справжні потреби користувачів.
Це також означає, що великі фірми мають перевагу у розробці застосунків штучного інтелекту.
Великі виробники мають достатню обчислювальну потужність і таланти для розробки власних моделей, тому вони можуть безпосередньо розгортати програми штучного інтелекту поверх своїх самостійно розроблених моделей без необхідності багатошарового обстрілу. Великі виробники також мають величезну базу користувачів і зрілі входи в трафік, які не тільки роблять дані користувачів багатшими та простішими для майнінгу попиту, але й надають природні переваги для просування додатків штучного інтелекту. Крім того, потужні можливості екологічної інтеграції великих виробників також допоможуть забезпечити багатші функції для продуктів і підвищити привабливість додатків штучного інтелекту для користувачів.
Зазначений вище список продуктів також підтверджує це. З перших десяти додатків шість з них належать великим компаніям.
У своєму останньому інтерв'ю жу Хяоху також зазначив, що бар'єри даних стартапу не настільки високі, щоб робити базову модель, а потрібно ще більше затягнути "клієнтів" над базовою моделлю. Це також в певній мірі підтверджує переваги великих компаній в галузі застосування штучного інтелекту.
В цілому моделі і застосування великих виробників також обумовлюють і впливають один на одного, і разом складають маховик зростання:
Велика база користувачів забезпечує накопичення даних для розробки моделей, що допомагає покращити їхню ефективність та краще пристосувати до конкретних сценаріїв та потреб користувачів; зростання ефективності моделей в свою чергу позитивно впливає на застосунки, надаючи їм більшу продуктивність та залучаючи більше користувачів.
Цей модель, яка має велику користувацьку базу, направлена на розвиток за потребами користувачів, здатна краще проявляти свої можливості в конкретних сценаріях, може бути названа "Велика модель застосування". Чим більше штучний інтелект ґрунтується на цій моделі, тим теоретично більше ймовірностей успішної реалізації.
Наприклад, кварки, які займають друге місце в списку, від DeepSeek, є типовим представником.
«Кварк» помічено, що в останній битві богів за застосуванням штучного інтелекту раніше мало відомий кварк тихенько вибивається в лідерах. За останніми даними від Analysys, до кінця 2024 року кварк очолив рейтинг мобільних додатків зі штучним інтелектом з місячною активністю в 71,02 млн користувачів, випередивши відомих всім Dou Bao та Kimi.
Джерело зображення: Аналітика Yi Guan
Більш важливим є показник "прилипання користувачів".
Згідно зі статистикою сторонніх звітів, триденний рівень утримання Quark становить понад 40%, порівняно з приблизно 25% гучних крісел-мішків і розумних помічників Kimi на ринку за той же період; Згідно з «Списком потужних продуктів штучного інтелекту 2024 року», опублікованим Qimai Data, Quark посідає перше місце в «Щорічному списку додатків для продуктів штучного інтелекту» та «Щорічному списку завантажень продуктів» із сукупним обсягом завантажень понад 370 мільйонів у 2024 році, що є унікальним серед усіх видів продуктів штучного інтелекту та досягло помилкового лідерства.
Серед безлічі продуктів штучного інтелекту в списку Quark не був першим, хто випустив велику модель, але він непомітно досяг далекого лідерства за кількістю відвідувань, завантажень і прихильності користувачів. Як Quark може досягти успіху на висококонкурентному ринку?
Все завдяки продуктовій та модельній стратегії Quark, орієнтованій на застосування.
Quark зосередився на «інтелектуальному та точному пошуку» з першого дня пошуку, не тільки покладаючись на простий інтерфейс без реклами та більш точні результати пошуку, щоб швидко прорвати діру на ринку, але й на основі пошукового бізнесу, навколо студентської партії та груп офісних працівників, які походять від quark network disk, quark scanning king, quark document, quark learning та інших вертикальних продуктів, сцена поступово поділяється на сферу навчання та роботи.
На прикладі вивчення у 2020 році Quark випустив функцію "фотозвіт по питаннях". Під час епідемії команда навчання Quark знову кілька разів оновлювала функцію "фотозвіт по питаннях", оскільки багато учнів були заблоковані вдома для вивчення в Інтернеті та стикалися з труднощами ефективного навчання.
В офісній сфері Quark також запустив ряд пов'язаних функцій, таких як вилучення тексту, таблиць, видалення рукописного тексту, сканування документів і перетворення формату документа з вертикального сценарію «сканування».
Простий фон інструментів, все більше та більше застосувань сценаріїв, разом з екологією приваблення нових користувачів без реклами та безкоштовної підписки на початковому етапі, дозволяють кількості користувачів Quark раптово зрости, з мільйонів до десятків мільйонів, накопичена кількість обслугованих користувачів перевищує мільярд.
У листопаді 2023 року Quark випустила модель великого масштабу Quark з мільярдами параметрів.
Велика модель кварка — це мультимодальна велика модель, незалежно розроблена компанією Quark на основі архітектури Transformer, яка щодня навчатиме та налаштовуватиме сотні мільйонів графічних даних, і має характеристики низької вартості, високого відгуку та сильних всеосяжних можливостей. Зіткнувшись з потребами користувачів і вертикальними сценаріями кваркових продуктів, велика модель quark приділяє більше уваги практичним додаткам і виводить вертикальні моделі, такі як загальні знання, медичне обслуговування та освіта, щоб забезпечити більш професійні та точні технічні можливості.
У той ж час, коли Quark випустила велику модель кварку, Quark покращила ефективність розпізнавання штучного інтелекту продуктів сканування та можливості пошуку штучного інтелекту продуктів хмарного сховища.
Перший сценарій приземлення кваркової моделі – це здоров'я та лікування.
У грудні 2023 року Quark оголосила про комплексне оновлення своєї функції пошуку здоров'я, запустивши програму штучного інтелекту «Помічник здоров'я Quark» у грудні 2023 року. «Quark Health Assistant» об'єднує медичний графік знань і можливості генеративного діалогу, щоб надати користувачам більш повну та точну інформацію про здоров'я, а також підтримує користувачів у кількох раундах запитань та розмов про проблеми зі здоров'ям.
У січні 2024 року Quark почав послідовно випускати функції, такі як “AI Learning Assistant”, “AI Listening and Taking Notes”, “AI PPT” та інші, і в липні 2024 року випустив всеосяжний сервіс на основі пошуку за допомогою штучного інтелекту на мобільних пристроях, а в серпні 2024 року випустив здатний працювати в будь-якому сценарії штучний інтелект на PC нового покоління.
Наприклад, користувач шукає “Які пам'ятки в Шаньсі лежать в основі чорної міфології Вуконга”. Суперпошук Кварк об'єднує відповіді ШІ, первинні джерела і історію пошуку у єдине ціле - він не лише генерує інтелектуальні підсумки, як інші ШІ-пошуки, але й показує джерела в бічній панелі та залишається звичайним веб-поданням пошукових систем під відповідями ШІ. Це підвищує ефективність отримання інформації користувачів та збільшує достовірність відповідей ШІ.
Крім того, Quark також побудував єдину систему інформаційних послуг навколо «супер вікна пошуку», включаючи мережевий диск, сканування, обробку документів, помічника здоров'я та інші інтелектуальні інструменти, реалізуючи весь процес від пошуку до створення, узагальнення, редагування, зберігання та обміну, надаючи користувачам безперебійний досвід роботи з інформаційними послугами.
На відміну від багатьох великих виробників, що копіюють ChatGPT і запускають Chatbot-подібних AI-помічників “All in One”, стратегія Quark - це “AI in All” - вбудування можливостей штучного інтелекту в кожен аспект продукту та впровадження їх у конкретні сценарії застосування.
Від початкового пошуку фотографій до консультації щодо вступу до коледжу та інтелектуальної допомоги в офісі, еволюція продуктів Quark завжди зосереджувалася на потребах користувачів у конкретних сценаріях. З тих пір Quark послідовно запускає та оновлює такі функції, як пошук запитань ШІ, академічний пошук ШІ та поради щодо штучного інтелекту для створення диференційованих додатків штучного інтелекту для навчання та офісних сценаріїв.
Минулий рік розвиток QuarkAI, картографування: Jia Zi Light Year
Серед них функція «AI Search», яка буде оновлена в листопаді 2024 року, є типовим представником можливостей ШІ Quark.
Фактично, ще в грудні 2023 року Quark запустив тематичного помічника зі штучним інтелектом. У той час тематичні помічники зі штучним інтелектом все ще більше покладалися на «базу знань» банку запитань, а ШІ міг навчити користувачів лише робити запитання в банку запитань. Оновлений продукт пошуку запитань зі штучним інтелектом має сильніший «інтелект», який може не лише відповідати на оригінальні запитання в банку запитань, а й стикатися з новими питаннями та проблемами. Використання великої моделі «Ланцюжок мислення (CoT)» дозволяє Quark AI по черзі представляти ідеї вирішення проблем і кроки їх вирішення, надаючи користувачам більш детальний аналіз контенту та рекомендації щодо навчання.
У порівнянні з аналогічними продуктами пошуку запитань, які в основному покладаються на банки запитань і можуть відповідати лише на запитання в галузі K12, продукти пошуку запитань зі штучним інтелектом Quark можуть не тільки відповідати на нові запитання в галузі K12, але й відповідати на професійні запитання на вступних іспитах до аспірантури, державних вступних іспитах та різних кваліфікаційних іспитах. Користувачам потрібно лише зробити фото або скріншот, а Quark може шукати відповідне запитання та крок за кроком давати професійний контент у графіці, відео та відповідях ШІ. Крім того, на запитання в таких галузях, як право та медицина, «пошукові запитання штучного інтелекту» Quark також можуть дати відповіді.
Відповідь кварка на справжні запитання юридичного екзамену
Тим часом, кварк "AI пошук питань" також може використовувати можливості штучного інтелекту для глибокого пояснення тематичних пунктів та основних аспектів у завданнях, точно визначаючи ключові кроки, щоб користувач не лише вивчив це завдання, а й зміг "застосувати отримані знання" для вивчення цього типу завдань.
Кварк "AI Search" має потужні можливості не лише завдяки накопиченню кваркового пошуку протягом багатьох років, великій кількості високоякісного матеріалу та потреб користувачів в навчальних ситуаціях, але й підтримку від Кварка введеної в той же час великої моделі "Lingzhi" для навчання.
Модель "Lingzhi" є результатом тренування високоякісних даних, накопичених командою Quark в галузі освіти протягом багатьох років на основі "Великої моделі Quark". Вона не тільки має здатність до мислення ланцюга, яку мають багато передових моделей, але й може перетворити процес мислення на мову, яку учні можуть зрозуміти та яка більш відповідає їхньому процесу навчання.
Іншими словами, обидва розповідають учням про одне завдання, велика модель 'Лінчжи' краще знає, які пункти знань потрібно пояснити та як будувати стратегію вирішення завдання.
Візьмемо для прикладу математичні запитання вступного іспиту до Пекінського коледжу 2024 року, введіть їх у DeepSeek і quark відповідно та отримайте такі відповіді:
Відповідь DeepSeek
Відповідь, яку дав кварк
Можна побачити, що порівняно з довгим та складним викладом мисленнєвого ланцюга DeepSeek та офіційною відповіддю на будь-яке питання, від Quark дано більш стислу відповідь, яка більше нагадує пояснення до задачі.
У зв'язку з великою кількістю сценаріїв «пояснення знань» і «науково-популярного» індустрія освіти висунула високі вимоги до мультимодальної здатності моделей. Однак існуючі мультимодальні моделі мають погане розпізнавання формул, рукописних нотаток і т.д., особливо тонке розуміння графіків.
Для того, щоб розв'язати цю задачу, кваркова «гностична» велика модель конструює великомасштабний корпус професійної підготовки за допомогою великомасштабної мультимодальної бази попереднього навчання, і в той же час забезпечує кращий ефект розуміння структури моделі.
У новому тестуванні виявлено, що велика модель Quark 'Lingzhi' має таку ж точність і відсоток балів на математичних питаннях, як OpenAI-o1, а також перевищує інші внутрішні моделі. У багатьох важливих тестах внутрішніх математичних конкурсів та вступних іспитах Quark також перебуває в абсолютному лідерстві.
Відображено результати математичної оцінки великої моделі «Гностик»
Джерело: Quark
На відміну від таких компаній, як DeepSeek, які розробляють суто базові можливості моделі, R&D-модель Quark орієнтується на потреби користувачів. Беручи за приклад написання текстів зі штучним інтелектом, технічна команда Quark розробила культурну та творчу модель Quark, яка може генерувати понад 8 000 довгих есе, використовуючи багатоступеневу технологію CoT та покращення пошуку, щоб задовольнити потреби молодих користувачів Quark у написанні звітів та статей, забезпечуючи ефект дотримання кількості слів. І навіть DeepSeek наразі може генерувати есе лише до 3 000 слів.
Крім того, функція написання штучного інтелекту Quark також еквівалентна «текстовому онлайн-редактору», де користувачі можуть видаляти, шліфувати, розширювати та виконувати інші складні операції над створеними статтями, що також невіддільно від підтримки можливостей культурної та творчої моделі Quark.
Можна сказати, що, коли у всьому світі усі "завивають" великі параметри моделі, кварк вже більше зосередився на практичних сценаріях застосування, виходячи з потреб користувачів, щоб спрямовано покращити можливості моделі. На сьогоднішній день Quark вже сформував системні здатності штучного інтелекту для всіх сценаріїв.
Джерело зображення: кварк
Будучи одним з чотирьох інноваційних бізнесів Alibaba стратегічного рівня, кожен крок Quark відображає не тільки його самого, але і напрямок всього бізнесу Alibaba AI To C.
15 січня Quark оновив брендовий слоган - "Усеприсутній помічник штучного інтелекту для 200 мільйонів людей", показавши новий бізнес-тенденції у галузі дослідження штучного інтелекту для сегмента АІ до C. Нещодавно засновник Alibaba Джек Ма раптово "з'явився" в офісі Alibaba у Ханчжоу, також відвідався офіс сегменту бізнесу АІ до C, такого як Quark.
Останнім часом Алі часто робить кроки в галузі AI To C: по-перше, Ву Цзя, керівник «Школи Молодого Чжуана», повернувся в Alibaba Group, щоб вивчити бізнес AI To C; Потім додаток штучного інтелекту Alibaba «Tongyi» був офіційно відокремлений від Alibaba Cloud і об'єднаний з Alibaba Intelligent Information Business Group; Останнім часом, за даними ЗМІ, апаратна команда Tmall Genie також працює над інтеграцією з продуктовою командою Quark, і в її фокусі – планування та визначення нового покоління продуктів штучного інтелекту, а також інтеграція з можливостями штучного інтелекту Quark. Після того, як команда буде інтегрована, нова команда також досліджуватиме нові напрямки обладнання, включаючи окуляри зі штучним інтелектом.
Відтоді Quark, Tongyi App і Tmall Genie будуть використовуватися як інструменти продуктивності, чат-боти та апаратне забезпечення штучного інтелекту для надання користувачам диференційованих послуг.
6 лютого сфера змісту Alibaba відкрила важку фігуру - професор Стівен Хой, провідний у світі вчений у галузі штучного інтелекту, офіційно приєднався до Alibaba як віце-президент Alibaba Group, підпорядковуючись Ву Цзя, відповідальному за мультимодальну базову модель бізнесу AI To C та пов'язані з агентами фундаментальні дослідження та прикладні рішення.
За словами інсайдерів, професор Сюй Чжухун зосередиться на мультимодальній базовій моделі бізнесу AI To C та фундаментальних дослідницьких і прикладних рішеннях, пов'язаних з агентами, що значно посилить стрибок у наскрізних можливостях замкнутого циклу C-кінцевих продуктів Alibaba AI Application у поєднанні моделей та додатків. Після того, як можливості мультимодальних базових моделей досягли прориву, C-кінцеві додатки, такі як кварки, отримали новий простір для досліджень у бізнесі.
У той же час підрозділ Alibaba AI To C створює провідну команду дослідників та інженерів алгоритмів штучного інтелекту для залучення великої кількості видатних талантів у галузі. Згідно з аналізом інсайдерів галузі, на початку 2025 року приєднання топових вчених світового рівня можна розцінювати як важливий сигнал для Ali AI To C збільшити інвестиції в таланти та ресурси. Команда найкращих талантів великої моделі підтримає поглиблене дослідження Alibaba AI To C у напрямку мультимодальних агентів, а також відкриє простір для уяви для наступного етапу створення орієнтованої на користувача платформи додатків штучного інтелекту.
Сьогодні Byte вклала значні кошти в сферу додатків штучного інтелекту, перезапустивши стратегію «App Factory», енергійно інвестуючи в потоки, внутрішні кінні перегони та активно виїжджаючи за кордон. Tencent запустила два продукти, «Yuanbao» та «Yuanqi», у напрямку помічників штучного інтелекту та розумних близнюків, і повернула увагу громадськості за допомогою нещодавно запущеного інструменту управління персональними знаннями ima.copilot, тоді як Baidu запустила матрицю продуктів штучного інтелекту, включаючи Wenxin Yiyan, Wenxin Yige, Orange AI та Super Canvas тощо, щоб здійснювати «атаки насичення» на друзів із «великим і повним» підходом. Крім того, нові стартапи, такі як велика модель «Six Little Tigers» і DeepSeek, також доклали зусиль для застосування ШІ, а бізнес Alibaba AI To C можна охарактеризувати як оточений сильними ворогами, і тиск можна собі уявити.
Однак має бути рішення проблеми. Завдяки стратегії «AI in All» і точному контролю потреб користувачів, Quark довів, що сильної потужності продукту можна досягти без орфографічних параметрів, покладаючись на «великі моделі додатків» і точне розуміння потреб користувачів, що також є ще однією версією «низької вартості та високої ефективності»; А ще понад 200 мільйонів користувачів і топ щомісячного активного рейтингу. Це також доводить правильність стилю гри Quark і світле майбутнє бізнесу Алі AI To C.
У той момент, коли технологія штучного інтелекту увійшла в «глибоководну область застосування», інноваційна парадигма Quark дала нам ключове просвітлення: справжній технологічний прогрес полягає не тільки в тому, скільки технологічних вершин можна підняти, але і в тому, скільки науково-технічних досягнень можна перетворити в цінність, до якої можна доторкнутися кінчиками пальців користувачів. І тільки тоді, коли користувачі дійсно зроблять вибір і проголосують за застосування ШІ практичними діями, ця проривна битва, пов'язана з практичним застосуванням технології штучного інтелекту, може дійти до справжньої точки конкуренції, яка визначить майбутню промислову модель.