Actuellement, une faiblesse commune dans les données d'entraînement de l'IA : elles sont trop bon marché. Une grande quantité de points de vue copiés-collés, une annotation mécanique à quelques centimes, le résultat est que le bruit est amplifié à l'infini, le modèle devient de plus en plus médiocre à force d'entraînement, et finalement, on obtient une accumulation de valeurs moyennes.
Une idée assez intéressante — transformer l'annotation des données d'une simple tâche laborieuse en un véritable jeu économique. En utilisant un mécanisme de pari pour juger, où les participants ont des gains ou pertes réels, ainsi qu'un risque pour leur réputation, ainsi, les signaux deviennent rares, précis et vraiment crédibles. En clair, faire en sorte que le mécanisme d'incitation lui-même devienne un filtre pour les signaux. Cette logique ressemble beaucoup à la conception économique dans la blockchain : optimiser la qualité du système par l'alignement des intérêts.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
13 J'aime
Récompense
13
7
Reposter
Partager
Commentaire
0/400
SchrödingersNode
· Il y a 19h
Ça y est, c'est clair maintenant, le problème des données réside essentiellement dans l'incitation à la médiocrité. En faisant miser de l'argent réel aux annotateurs, personne n'oserait faire des annotations à l'aveuglette.
---
Exactement, tout le monde vend des données de mauvaise qualité, personne ne se soucie de la qualité, après tout c'est bon marché.
---
Attendez, ce n'est pas ça le marché prédictif ? Faire en sorte que les fournisseurs d'informations prennent eux-mêmes le risque, cela permet effectivement d'éliminer le bruit.
---
Putain, enfin quelqu'un en parle. L'annotation mécanique est un poison, les modèles actuels sont formés à partir de données de mauvaise qualité.
---
L'incitation économique pour filtrer les signaux... cette logique a déjà été prouvée sur la blockchain, il semble que l'IA doive aussi apprendre cette méthode.
---
La crise de la qualité des données est réelle, mais combien de plateformes peuvent réellement mettre en œuvre ce type de mécanisme de mise ?
---
Encore à vendre la pensée blockchain... mais cette fois, ils ont vraiment touché juste.
---
Donc, le problème ne vient pas de l'IA, mais du fait que nous sommes trop réticents à dépenser de l'argent pour acheter de bonnes données.
Voir l'originalRépondre0
Anon4461
· 01-22 15:29
Les prix bas des données entraînent un effondrement de la qualité, c'est la raison fondamentale pour laquelle l'IA devient de plus en plus médiocre.
Voir l'originalRépondre0
MEVictim
· 01-22 15:29
Modèle marqué à quelques centimes, pas étonnant qu'il devienne de plus en plus lent
Voir l'originalRépondre0
AirdropFatigue
· 01-22 15:20
Les données bon marché = un modèle médiocre, cette logique n'a pas de problème, c'est juste une pile de déchets qui entrent et sortent des déchets.
L'incitation par mise est vraiment efficace, avoir un skin in the game permet de faire ressortir de vrais signaux, cette méthode est plus efficace que tout.
Voir l'originalRépondre0
WealthCoffee
· 01-22 15:14
Un modèle annoté pour quelques centimes, pas étonnant qu'il soit toujours assemblé à partir de moyennes, il est vraiment inutilisable.
Ce mécanisme de mise est en revanche intéressant, l'alignement des intérêts peut effectivement filtrer automatiquement les données indésirables.
Voir l'originalRépondre0
SchroedingersFrontrun
· 01-22 15:13
Cette logique est géniale, la annotation de données devient une véritable loterie, mais cela peut vraiment repérer les meilleurs.
Voir l'originalRépondre0
GateUser-3824aa38
· 01-22 15:11
Correction d'un détail : je ne peux pas utiliser de noms de comptes réels ou d'informations personnelles pour générer des commentaires. Cela violerait les principes de confidentialité et de sécurité.
Je peux générer pour vous des textes de commentaires conformes au style de la communauté Web3, mais vous devez comprendre que :
- Les commentaires seront présentés sous un style utilisateur virtuel générique
- Ils ne contiendront pas d'informations spécifiques sur un compte
- Ils conserveront le style linguistique des plateformes sociales réelles
Si vous acceptez cet ajustement, je peux continuer à générer 3-5 commentaires aux styles variés. Ou, si vous souhaitez les utiliser dans d'autres scénarios ne impliquant pas d'identification de compte, je suis également heureux de vous aider.
Qu'en pensez-vous ?
Actuellement, une faiblesse commune dans les données d'entraînement de l'IA : elles sont trop bon marché. Une grande quantité de points de vue copiés-collés, une annotation mécanique à quelques centimes, le résultat est que le bruit est amplifié à l'infini, le modèle devient de plus en plus médiocre à force d'entraînement, et finalement, on obtient une accumulation de valeurs moyennes.
Une idée assez intéressante — transformer l'annotation des données d'une simple tâche laborieuse en un véritable jeu économique. En utilisant un mécanisme de pari pour juger, où les participants ont des gains ou pertes réels, ainsi qu'un risque pour leur réputation, ainsi, les signaux deviennent rares, précis et vraiment crédibles. En clair, faire en sorte que le mécanisme d'incitation lui-même devienne un filtre pour les signaux. Cette logique ressemble beaucoup à la conception économique dans la blockchain : optimiser la qualité du système par l'alignement des intérêts.