Évolution de la technologie d'indexation des données Blockchain : des Nœuds aux services de données de chaîne complète habilités par l'IA
1. Introduction
Depuis l'émergence des premières applications décentralisées (dApp) en 2017, l'écosystème Blockchain a connu un essor florissant, avec une multitude de dApps fleurissant sur différentes chaînes publiques. En discutant de ces applications décentralisées, avons-nous déjà réfléchi aux diverses sources de données qu'elles utilisent ?
En 2024, l'intelligence artificielle et le Web3 deviennent des sujets brûlants. Dans le domaine de l'IA, les données sont comme la source de vie pour la croissance et l'évolution des systèmes intelligents. Tout comme les plantes ont besoin de lumière et d'eau pour prospérer, les systèmes d'IA ont également besoin d'une masse énorme de données pour "apprendre" et "réfléchir" en continu. Sans le soutien des données, même les algorithmes d'IA les plus raffinés ont du mal à exprimer leur intelligence et leur efficacité.
Cet article analysera en profondeur l'évolution de l'indexation des données Blockchain au cours du développement de l'industrie, du point de vue de l'accessibilité des données Blockchain. Il comparera et analysera les similitudes et les différences entre les protocoles d'indexation de données traditionnels et les nouveaux protocoles de services de données Blockchain en matière de services de données et d'architecture de produits, en mettant particulièrement l'accent sur les innovations apportées par les nouveaux protocoles combinés aux technologies d'IA.
2. La complexité et la simplicité des index de données : des nœuds de Blockchain à la base de données de la chaîne entière
2.1 Source de données : Nœud Blockchain
L'essence de la Blockchain est un registre distribué décentralisé. Les nœuds de la Blockchain constituent la base de l'ensemble du réseau, responsables de l'enregistrement, du stockage et de la propagation de toutes les données de transactions sur la chaîne. Chaque nœud conserve une copie complète des données de la Blockchain pour maintenir la caractéristique décentralisée du réseau. Cependant, pour les utilisateurs ordinaires, créer et maintenir un nœud de Blockchain n'est pas une tâche facile, nécessitant non seulement une expertise technique, mais aussi faisant face à des coûts matériels et de bande passante élevés. De plus, la capacité de requête des nœuds ordinaires est limitée, rendant difficile la satisfaction des besoins des développeurs en matière de format de données. Ainsi, bien que théoriquement tout le monde puisse faire fonctionner un nœud, en réalité, les utilisateurs préfèrent s'appuyer sur des services tiers.
Pour résoudre ce problème, le fournisseur de nœuds d'appel de procédure à distance RPC( est né. Ces fournisseurs prennent en charge le coût et la gestion des nœuds, offrant aux utilisateurs un service d'accès aux données via des points de terminaison RPC. Cela permet aux utilisateurs d'accéder facilement aux données de la Blockchain sans avoir à créer leurs propres nœuds. Bien que les points de terminaison RPC publics soient gratuits, ils présentent des limitations de taux, ce qui peut affecter l'expérience utilisateur des dApp. Les points de terminaison RPC privés offrent de meilleures performances, mais restent inefficaces pour les requêtes complexes, et leur évolutivité ainsi que leur compatibilité entre réseaux sont moins bonnes. Malgré cela, l'interface API standardisée des fournisseurs de nœuds a tout de même réduit la barrière d'accès des utilisateurs aux données de la chaîne, posant ainsi les bases pour la future analyse des données et des applications.
) 2.2 Analyse des données : des données brutes aux données utilisables
Les données obtenues à partir des nœuds de la blockchain sont généralement des données brutes cryptées et codées. Bien que ces données garantissent l'intégrité et la sécurité de la blockchain, elles augmentent également la difficulté d'analyse des données. Pour les utilisateurs ordinaires ou les développeurs, traiter directement ces données brutes nécessite une grande quantité de connaissances techniques et de ressources de calcul.
Dans ce contexte, le processus d'analyse des données devient particulièrement important. En transformant des données brutes complexes en un format plus compréhensible et manipulable, les utilisateurs peuvent exploiter ces données de manière plus intuitive. La qualité de l'analyse des données influence directement l'efficacité et l'impact des applications de données Blockchain, ce qui en fait un maillon clé de l'ensemble du processus d'indexation des données.
2.3 L'évolution des indexeurs de données
Avec l'augmentation du volume de données de la Blockchain, la demande pour les indexeurs de données est en constante augmentation. Les indexeurs jouent un rôle clé dans l'organisation des données sur la chaîne et leur envoi vers une base de données pour requêtes. Le fonctionnement des indexeurs consiste à indexer les données de la Blockchain et à rendre les données disponibles à tout moment via un langage de requête similaire à SQL ### tel que l'API GraphQL (. En fournissant une interface de requête de données unifiée, les indexeurs permettent aux développeurs de récupérer rapidement et précisément les informations nécessaires en utilisant un langage de requête standardisé, simplifiant considérablement le processus.
Différents types d'indexeurs utilisent diverses méthodes pour optimiser la recherche de données :
Indexeur de nœud complet : extrait directement les données du nœud complet de la Blockchain, assurant l'exactitude et l'intégralité des données, mais nécessitant une grande capacité de stockage et de traitement.
Indexeur léger : dépend des nœuds complets pour obtenir des données spécifiques à la demande, réduisant ainsi les besoins de stockage mais pouvant augmenter le temps de requête.
Indexeur spécialisé : optimisé pour des types de données spécifiques ou des blockchains spécifiques, comme les données NFT ou les transactions DeFi.
Agrégateur d'index: extrait des données de plusieurs blockchains et sources ), y compris des informations hors chaîne (, fournissant une interface de requête unifiée, particulièrement utile pour les dApps multi-chaînes.
Actuellement, les exigences de stockage des nœuds d'archive Ethereum varient de 3 To à 13,5 To selon les clients, et augmentent continuellement avec la croissance de la blockchain. Face à un volume de données aussi important, les protocoles d'indexation majeurs non seulement prennent en charge l'indexation multi-chaînes, mais ont également personnalisé des cadres d'analyse de données pour répondre aux besoins en données des différentes applications.
Comparé aux points de terminaison RPC traditionnels, les indexeurs améliorent considérablement l'efficacité de l'indexation et des requêtes de données. Ils peuvent indexer efficacement des volumes massifs de données, prendre en charge des requêtes complexes à grande vitesse, et filtrer et analyser les données facilement. Certains indexeurs prennent également en charge l'agrégation des sources de données de plusieurs blockchains, évitant ainsi le problème des dApps multi-chaînes nécessitant le déploiement de plusieurs API. Grâce à un fonctionnement distribué, les indexeurs offrent une sécurité et des performances renforcées, réduisant le risque d'interruption que peuvent entraîner les fournisseurs RPC centralisés.
L'indexeur permet aux utilisateurs d'accéder directement aux informations requises sans avoir à gérer des données sous-jacentes complexes grâce à un langage de requête prédéfini. Ce mécanisme améliore considérablement l'efficacité et la fiabilité de la récupération des données, représentant une innovation importante dans le domaine de l'accès aux données Blockchain.
![Lire, indexer pour analyser, un aperçu de la voie d'indexation des données Web3])https://img-cdn.gateio.im/webp-social/moments-694cb5f2be61475195e2e559567dee89.webp(
) 2.4 Base de données Blockchain : alignement prioritaire sur le flux
Utiliser un nœud d'index pour interroger des données signifie souvent que l'API devient le seul canal pour traiter les données sur la blockchain. Cependant, lorsque le projet entre dans une phase d'expansion, il est souvent nécessaire d'avoir des sources de données plus flexibles, ce que les API standardisées ont du mal à fournir. Avec la complexité croissante des besoins des applications, les indexeurs de données de base et leurs formats d'indexation standardisés deviennent progressivement incapables de répondre à des besoins de requêtes de plus en plus diversifiés, tels que la recherche, l'accès inter-chaînes ou la cartographie des données hors chaîne.
Dans l'architecture moderne des pipelines de données, la méthode "priorité au flux" est devenue une solution pour résoudre les limitations des traitements par lots traditionnels, permettant l'ingestion, le traitement et l'analyse des données en temps réel. Ce changement de paradigme permet aux organisations de répondre immédiatement aux données entrantes, tirant ainsi des insights et prenant des décisions presque en temps réel. De même, le développement des fournisseurs de services de données Blockchain progresse également vers la construction de flux de données Blockchain. Les fournisseurs de services d'indexation traditionnels lancent des produits permettant d'obtenir des données Blockchain en temps réel sous forme de flux de données, tels que des lacs de données en temps réel basés sur des flux de données.
Ces services visent à répondre à la demande d'analyse en temps réel des transactions Blockchain et à offrir des capacités de recherche plus complètes. Tout comme l'architecture "flux prioritaire" révolutionne le traitement et la consommation des données dans les pipelines de données traditionnels en réduisant la latence et en améliorant la réactivité, ces fournisseurs de services de flux de données Blockchain espèrent également soutenir le développement de plus d'applications et aider à l'analyse des données on-chain grâce à des sources de données plus avancées et matures.
Redéfinir les défis des données on-chain à travers le prisme des pipelines de données modernes nous permet de voir tout le potentiel de la gestion, du stockage et de la fourniture des données on-chain sous un nouvel angle. Lorsque nous commençons à considérer des indexeurs tels que Subgraph et Ethereum ETL comme des flux de données dans un pipeline de données plutôt que comme des sorties finales, nous pouvons envisager un monde où des ensembles de données haute performance peuvent être personnalisés pour n'importe quel cas d'utilisation.
![Lire, indexer et analyser, un aperçu du terrain de l'indexation des données Web3]###https://img-cdn.gateio.im/webp-social/moments-587ce87f6dbedee4acec7d939fed6980.webp(
3. IA + Base de données ? Comparaison approfondie des trois principaux protocoles d'indexation des données
) 3.1 The Graph
Le réseau The Graph réalise des services d'indexation et de requête de données multi-chaînes grâce à un réseau de nœuds décentralisés, facilitant aux développeurs l'indexation des données de Blockchain et la construction d'applications décentralisées. Ses principaux modèles de produit incluent le marché d'exécution des requêtes de données et le marché de cache d'indexation des données, qui servent essentiellement les besoins de requête des produits des utilisateurs.
Un sous-graphe est une structure de données fondamentale dans le réseau The Graph, définissant comment extraire et transformer des données de la Blockchain en un format interrogeable. Tout le monde peut créer un sous-graphe, et plusieurs applications peuvent réutiliser ces sous-graphes, améliorant ainsi la réutilisabilité et l'efficacité des données.
Le réseau The Graph est composé de quatre rôles clés : indexeurs, conservateurs, délégataires et développeurs, qui fournissent ensemble un support de données pour les applications web3. Parmi eux, les indexeurs sont responsables de l'indexation et du traitement des requêtes, les délégataires mettent en jeu des jetons GRT pour soutenir l'exploitation des nœuds d'indexation, les conservateurs sont responsables de signaler quels sous-graphes doivent être indexés en priorité, tandis que les développeurs sont les principaux utilisateurs, créant et soumettant des sous-graphes au réseau.
Actuellement, The Graph a évolué vers un service d'hébergement de sous-graphiques entièrement décentralisé, avec des incitations économiques circulantes entre les différents participants pour garantir le fonctionnement du système. Les nœuds d'indexation génèrent des revenus grâce aux frais de requête et aux récompenses en tokens, tandis que les délégataires et les curateurs peuvent également en tirer une partie des récompenses.
Les produits de The Graph évoluent rapidement dans le sillage de l'IA. Des outils tels qu'AutoAgora, Allocation Optimizer et AgentC, développés par Semiotic Labs, améliorent les performances de l'écosystème dans plusieurs domaines, tels que la tarification dynamique, l'optimisation des ressources et les requêtes en langage naturel. L'application de ces outils permet à The Graph de combiner l'IA pour renforcer encore l'intelligence du système et sa convivialité.
![Lecture, indexation pour l'analyse, résumé de la piste d'indexation des données Web3]###https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase est un réseau de données de chaîne entière, intégrant toutes les données de Blockchain sur une plateforme, facilitant aux développeurs la construction et la maintenance d'applications. Ses fonctionnalités distinctives incluent :
Lac de données en temps réel : fournit un lac de données en temps réel spécialement conçu pour les flux de données Blockchain, permettant un accès instantané aux données.
Architecture à double chaîne : une couche d'exécution construite sur Eigenlayer AVS, formant une architecture à double chaîne parallèle avec l'algorithme de consensus CometBFT, renforçant la programmabilité et la combinabilité des données inter-chaînes.
Norme de format de données innovante : introduction de la norme de format de données "manuscripts", optimisant la structuration et l'utilisation des données dans l'industrie de la cryptographie.
Modèle du monde cryptographique : en combinant la technologie des modèles d'IA, un modèle d'IA capable de comprendre, prédire les transactions blockchain et d'interagir avec celles-ci a été créé. Actuellement, la version de base du modèle Theia est disponible pour le public.
Le modèle d'IA Theia de Chainbase est un point fort qui le distingue des autres protocoles de services de données. Theia est basé sur le modèle DORA de NVIDIA, combinant des données on-chain et off-chain ainsi que des activités spatio-temporelles, apprenant et analysant les modèles cryptographiques, répondant par le raisonnement causal, et explorant en profondeur la valeur et les régularités potentielles des données on-chain, afin de fournir aux utilisateurs des services de données plus intelligents.
![Lire, indexer et analyser, aperçu de la piste d'indexation des données Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espace et Temps
Space and Time ###SxT( s'engage à créer une couche de calcul vérifiable, en étendant les preuves de connaissance zéro sur un entrepôt de données décentralisé, pour fournir un traitement de données fiable aux contrats intelligents, aux grands modèles de langage et aux entreprises.
Dans le domaine de l'indexation et de la validation des données, Space and Time a introduit la technologie innovante Proof of SQL. Il s'agit d'une technique de preuve à connaissance nulle qui garantit que les requêtes SQL exécutées sur un entrepôt de données décentralisé sont infalsifiables et vérifiables. Lors de la requête, Proof of SQL génère une preuve cryptographique pour vérifier l'intégrité et l'exactitude des résultats de la requête. Cette méthode change le gaspillage de ressources causé par l'indexation répétée des mêmes données par plusieurs nœuds sous un mécanisme de consensus traditionnel, améliorant ainsi la performance globale du système.
SxT collabore étroitement avec le laboratoire d'innovation AI de Microsoft pour accélérer le développement d'outils d'IA générative, facilitant l'accès des utilisateurs aux données de la Blockchain via le traitement du langage naturel. Dans Space and Time Studio, les utilisateurs peuvent saisir des requêtes en langage naturel, l'IA les convertira automatiquement en SQL et exécutera la requête, présentant ainsi le résultat final souhaité par l'utilisateur.
![Lire, indexer pour analyser, aperçu de la piste d'indexation des données Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusion et perspectives
La technologie d'indexation des données de blockchain a évolué depuis les sources de données des nœuds, à travers le développement de l'analyse de données et des indexeurs, pour finalement aboutir à un service de données de chaîne complet habilité par l'IA, passant par un processus d'amélioration progressive. Cette évolution continue des technologies a non seulement amélioré l'efficacité et la précision d'accès aux données, mais a également offert aux utilisateurs une expérience d'intelligence sans précédent.
En regardant vers l'avenir, avec le développement continu de nouvelles technologies telles que l'IA et les preuves à divulgation nulle de connaissance, les services de données Blockchain deviendront encore plus intelligents et sécurisés. Nous avons des raisons de croire que les services de données Blockchain continueront à jouer un rôle important en tant qu'infrastructure à l'avenir, fournissant un soutien solide à l'avancement et à l'innovation de l'industrie.
![Lire, indexer pour analyser, un aperçu de la piste d'indexation des données Web3])https://
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Évolution de l'indexation des données Blockchain : des Nœuds aux services de chaîne complets habilités par l'IA
Évolution de la technologie d'indexation des données Blockchain : des Nœuds aux services de données de chaîne complète habilités par l'IA
1. Introduction
Depuis l'émergence des premières applications décentralisées (dApp) en 2017, l'écosystème Blockchain a connu un essor florissant, avec une multitude de dApps fleurissant sur différentes chaînes publiques. En discutant de ces applications décentralisées, avons-nous déjà réfléchi aux diverses sources de données qu'elles utilisent ?
En 2024, l'intelligence artificielle et le Web3 deviennent des sujets brûlants. Dans le domaine de l'IA, les données sont comme la source de vie pour la croissance et l'évolution des systèmes intelligents. Tout comme les plantes ont besoin de lumière et d'eau pour prospérer, les systèmes d'IA ont également besoin d'une masse énorme de données pour "apprendre" et "réfléchir" en continu. Sans le soutien des données, même les algorithmes d'IA les plus raffinés ont du mal à exprimer leur intelligence et leur efficacité.
Cet article analysera en profondeur l'évolution de l'indexation des données Blockchain au cours du développement de l'industrie, du point de vue de l'accessibilité des données Blockchain. Il comparera et analysera les similitudes et les différences entre les protocoles d'indexation de données traditionnels et les nouveaux protocoles de services de données Blockchain en matière de services de données et d'architecture de produits, en mettant particulièrement l'accent sur les innovations apportées par les nouveaux protocoles combinés aux technologies d'IA.
2. La complexité et la simplicité des index de données : des nœuds de Blockchain à la base de données de la chaîne entière
2.1 Source de données : Nœud Blockchain
L'essence de la Blockchain est un registre distribué décentralisé. Les nœuds de la Blockchain constituent la base de l'ensemble du réseau, responsables de l'enregistrement, du stockage et de la propagation de toutes les données de transactions sur la chaîne. Chaque nœud conserve une copie complète des données de la Blockchain pour maintenir la caractéristique décentralisée du réseau. Cependant, pour les utilisateurs ordinaires, créer et maintenir un nœud de Blockchain n'est pas une tâche facile, nécessitant non seulement une expertise technique, mais aussi faisant face à des coûts matériels et de bande passante élevés. De plus, la capacité de requête des nœuds ordinaires est limitée, rendant difficile la satisfaction des besoins des développeurs en matière de format de données. Ainsi, bien que théoriquement tout le monde puisse faire fonctionner un nœud, en réalité, les utilisateurs préfèrent s'appuyer sur des services tiers.
Pour résoudre ce problème, le fournisseur de nœuds d'appel de procédure à distance RPC( est né. Ces fournisseurs prennent en charge le coût et la gestion des nœuds, offrant aux utilisateurs un service d'accès aux données via des points de terminaison RPC. Cela permet aux utilisateurs d'accéder facilement aux données de la Blockchain sans avoir à créer leurs propres nœuds. Bien que les points de terminaison RPC publics soient gratuits, ils présentent des limitations de taux, ce qui peut affecter l'expérience utilisateur des dApp. Les points de terminaison RPC privés offrent de meilleures performances, mais restent inefficaces pour les requêtes complexes, et leur évolutivité ainsi que leur compatibilité entre réseaux sont moins bonnes. Malgré cela, l'interface API standardisée des fournisseurs de nœuds a tout de même réduit la barrière d'accès des utilisateurs aux données de la chaîne, posant ainsi les bases pour la future analyse des données et des applications.
) 2.2 Analyse des données : des données brutes aux données utilisables
Les données obtenues à partir des nœuds de la blockchain sont généralement des données brutes cryptées et codées. Bien que ces données garantissent l'intégrité et la sécurité de la blockchain, elles augmentent également la difficulté d'analyse des données. Pour les utilisateurs ordinaires ou les développeurs, traiter directement ces données brutes nécessite une grande quantité de connaissances techniques et de ressources de calcul.
Dans ce contexte, le processus d'analyse des données devient particulièrement important. En transformant des données brutes complexes en un format plus compréhensible et manipulable, les utilisateurs peuvent exploiter ces données de manière plus intuitive. La qualité de l'analyse des données influence directement l'efficacité et l'impact des applications de données Blockchain, ce qui en fait un maillon clé de l'ensemble du processus d'indexation des données.
2.3 L'évolution des indexeurs de données
Avec l'augmentation du volume de données de la Blockchain, la demande pour les indexeurs de données est en constante augmentation. Les indexeurs jouent un rôle clé dans l'organisation des données sur la chaîne et leur envoi vers une base de données pour requêtes. Le fonctionnement des indexeurs consiste à indexer les données de la Blockchain et à rendre les données disponibles à tout moment via un langage de requête similaire à SQL ### tel que l'API GraphQL (. En fournissant une interface de requête de données unifiée, les indexeurs permettent aux développeurs de récupérer rapidement et précisément les informations nécessaires en utilisant un langage de requête standardisé, simplifiant considérablement le processus.
Différents types d'indexeurs utilisent diverses méthodes pour optimiser la recherche de données :
Indexeur de nœud complet : extrait directement les données du nœud complet de la Blockchain, assurant l'exactitude et l'intégralité des données, mais nécessitant une grande capacité de stockage et de traitement.
Indexeur léger : dépend des nœuds complets pour obtenir des données spécifiques à la demande, réduisant ainsi les besoins de stockage mais pouvant augmenter le temps de requête.
Indexeur spécialisé : optimisé pour des types de données spécifiques ou des blockchains spécifiques, comme les données NFT ou les transactions DeFi.
Agrégateur d'index: extrait des données de plusieurs blockchains et sources ), y compris des informations hors chaîne (, fournissant une interface de requête unifiée, particulièrement utile pour les dApps multi-chaînes.
Actuellement, les exigences de stockage des nœuds d'archive Ethereum varient de 3 To à 13,5 To selon les clients, et augmentent continuellement avec la croissance de la blockchain. Face à un volume de données aussi important, les protocoles d'indexation majeurs non seulement prennent en charge l'indexation multi-chaînes, mais ont également personnalisé des cadres d'analyse de données pour répondre aux besoins en données des différentes applications.
Comparé aux points de terminaison RPC traditionnels, les indexeurs améliorent considérablement l'efficacité de l'indexation et des requêtes de données. Ils peuvent indexer efficacement des volumes massifs de données, prendre en charge des requêtes complexes à grande vitesse, et filtrer et analyser les données facilement. Certains indexeurs prennent également en charge l'agrégation des sources de données de plusieurs blockchains, évitant ainsi le problème des dApps multi-chaînes nécessitant le déploiement de plusieurs API. Grâce à un fonctionnement distribué, les indexeurs offrent une sécurité et des performances renforcées, réduisant le risque d'interruption que peuvent entraîner les fournisseurs RPC centralisés.
L'indexeur permet aux utilisateurs d'accéder directement aux informations requises sans avoir à gérer des données sous-jacentes complexes grâce à un langage de requête prédéfini. Ce mécanisme améliore considérablement l'efficacité et la fiabilité de la récupération des données, représentant une innovation importante dans le domaine de l'accès aux données Blockchain.
![Lire, indexer pour analyser, un aperçu de la voie d'indexation des données Web3])https://img-cdn.gateio.im/webp-social/moments-694cb5f2be61475195e2e559567dee89.webp(
) 2.4 Base de données Blockchain : alignement prioritaire sur le flux
Utiliser un nœud d'index pour interroger des données signifie souvent que l'API devient le seul canal pour traiter les données sur la blockchain. Cependant, lorsque le projet entre dans une phase d'expansion, il est souvent nécessaire d'avoir des sources de données plus flexibles, ce que les API standardisées ont du mal à fournir. Avec la complexité croissante des besoins des applications, les indexeurs de données de base et leurs formats d'indexation standardisés deviennent progressivement incapables de répondre à des besoins de requêtes de plus en plus diversifiés, tels que la recherche, l'accès inter-chaînes ou la cartographie des données hors chaîne.
Dans l'architecture moderne des pipelines de données, la méthode "priorité au flux" est devenue une solution pour résoudre les limitations des traitements par lots traditionnels, permettant l'ingestion, le traitement et l'analyse des données en temps réel. Ce changement de paradigme permet aux organisations de répondre immédiatement aux données entrantes, tirant ainsi des insights et prenant des décisions presque en temps réel. De même, le développement des fournisseurs de services de données Blockchain progresse également vers la construction de flux de données Blockchain. Les fournisseurs de services d'indexation traditionnels lancent des produits permettant d'obtenir des données Blockchain en temps réel sous forme de flux de données, tels que des lacs de données en temps réel basés sur des flux de données.
Ces services visent à répondre à la demande d'analyse en temps réel des transactions Blockchain et à offrir des capacités de recherche plus complètes. Tout comme l'architecture "flux prioritaire" révolutionne le traitement et la consommation des données dans les pipelines de données traditionnels en réduisant la latence et en améliorant la réactivité, ces fournisseurs de services de flux de données Blockchain espèrent également soutenir le développement de plus d'applications et aider à l'analyse des données on-chain grâce à des sources de données plus avancées et matures.
Redéfinir les défis des données on-chain à travers le prisme des pipelines de données modernes nous permet de voir tout le potentiel de la gestion, du stockage et de la fourniture des données on-chain sous un nouvel angle. Lorsque nous commençons à considérer des indexeurs tels que Subgraph et Ethereum ETL comme des flux de données dans un pipeline de données plutôt que comme des sorties finales, nous pouvons envisager un monde où des ensembles de données haute performance peuvent être personnalisés pour n'importe quel cas d'utilisation.
![Lire, indexer et analyser, un aperçu du terrain de l'indexation des données Web3]###https://img-cdn.gateio.im/webp-social/moments-587ce87f6dbedee4acec7d939fed6980.webp(
3. IA + Base de données ? Comparaison approfondie des trois principaux protocoles d'indexation des données
) 3.1 The Graph
Le réseau The Graph réalise des services d'indexation et de requête de données multi-chaînes grâce à un réseau de nœuds décentralisés, facilitant aux développeurs l'indexation des données de Blockchain et la construction d'applications décentralisées. Ses principaux modèles de produit incluent le marché d'exécution des requêtes de données et le marché de cache d'indexation des données, qui servent essentiellement les besoins de requête des produits des utilisateurs.
Un sous-graphe est une structure de données fondamentale dans le réseau The Graph, définissant comment extraire et transformer des données de la Blockchain en un format interrogeable. Tout le monde peut créer un sous-graphe, et plusieurs applications peuvent réutiliser ces sous-graphes, améliorant ainsi la réutilisabilité et l'efficacité des données.
Le réseau The Graph est composé de quatre rôles clés : indexeurs, conservateurs, délégataires et développeurs, qui fournissent ensemble un support de données pour les applications web3. Parmi eux, les indexeurs sont responsables de l'indexation et du traitement des requêtes, les délégataires mettent en jeu des jetons GRT pour soutenir l'exploitation des nœuds d'indexation, les conservateurs sont responsables de signaler quels sous-graphes doivent être indexés en priorité, tandis que les développeurs sont les principaux utilisateurs, créant et soumettant des sous-graphes au réseau.
Actuellement, The Graph a évolué vers un service d'hébergement de sous-graphiques entièrement décentralisé, avec des incitations économiques circulantes entre les différents participants pour garantir le fonctionnement du système. Les nœuds d'indexation génèrent des revenus grâce aux frais de requête et aux récompenses en tokens, tandis que les délégataires et les curateurs peuvent également en tirer une partie des récompenses.
Les produits de The Graph évoluent rapidement dans le sillage de l'IA. Des outils tels qu'AutoAgora, Allocation Optimizer et AgentC, développés par Semiotic Labs, améliorent les performances de l'écosystème dans plusieurs domaines, tels que la tarification dynamique, l'optimisation des ressources et les requêtes en langage naturel. L'application de ces outils permet à The Graph de combiner l'IA pour renforcer encore l'intelligence du système et sa convivialité.
![Lecture, indexation pour l'analyse, résumé de la piste d'indexation des données Web3]###https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase est un réseau de données de chaîne entière, intégrant toutes les données de Blockchain sur une plateforme, facilitant aux développeurs la construction et la maintenance d'applications. Ses fonctionnalités distinctives incluent :
Lac de données en temps réel : fournit un lac de données en temps réel spécialement conçu pour les flux de données Blockchain, permettant un accès instantané aux données.
Architecture à double chaîne : une couche d'exécution construite sur Eigenlayer AVS, formant une architecture à double chaîne parallèle avec l'algorithme de consensus CometBFT, renforçant la programmabilité et la combinabilité des données inter-chaînes.
Norme de format de données innovante : introduction de la norme de format de données "manuscripts", optimisant la structuration et l'utilisation des données dans l'industrie de la cryptographie.
Modèle du monde cryptographique : en combinant la technologie des modèles d'IA, un modèle d'IA capable de comprendre, prédire les transactions blockchain et d'interagir avec celles-ci a été créé. Actuellement, la version de base du modèle Theia est disponible pour le public.
Le modèle d'IA Theia de Chainbase est un point fort qui le distingue des autres protocoles de services de données. Theia est basé sur le modèle DORA de NVIDIA, combinant des données on-chain et off-chain ainsi que des activités spatio-temporelles, apprenant et analysant les modèles cryptographiques, répondant par le raisonnement causal, et explorant en profondeur la valeur et les régularités potentielles des données on-chain, afin de fournir aux utilisateurs des services de données plus intelligents.
![Lire, indexer et analyser, aperçu de la piste d'indexation des données Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espace et Temps
Space and Time ###SxT( s'engage à créer une couche de calcul vérifiable, en étendant les preuves de connaissance zéro sur un entrepôt de données décentralisé, pour fournir un traitement de données fiable aux contrats intelligents, aux grands modèles de langage et aux entreprises.
Dans le domaine de l'indexation et de la validation des données, Space and Time a introduit la technologie innovante Proof of SQL. Il s'agit d'une technique de preuve à connaissance nulle qui garantit que les requêtes SQL exécutées sur un entrepôt de données décentralisé sont infalsifiables et vérifiables. Lors de la requête, Proof of SQL génère une preuve cryptographique pour vérifier l'intégrité et l'exactitude des résultats de la requête. Cette méthode change le gaspillage de ressources causé par l'indexation répétée des mêmes données par plusieurs nœuds sous un mécanisme de consensus traditionnel, améliorant ainsi la performance globale du système.
SxT collabore étroitement avec le laboratoire d'innovation AI de Microsoft pour accélérer le développement d'outils d'IA générative, facilitant l'accès des utilisateurs aux données de la Blockchain via le traitement du langage naturel. Dans Space and Time Studio, les utilisateurs peuvent saisir des requêtes en langage naturel, l'IA les convertira automatiquement en SQL et exécutera la requête, présentant ainsi le résultat final souhaité par l'utilisateur.
![Lire, indexer pour analyser, aperçu de la piste d'indexation des données Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusion et perspectives
La technologie d'indexation des données de blockchain a évolué depuis les sources de données des nœuds, à travers le développement de l'analyse de données et des indexeurs, pour finalement aboutir à un service de données de chaîne complet habilité par l'IA, passant par un processus d'amélioration progressive. Cette évolution continue des technologies a non seulement amélioré l'efficacité et la précision d'accès aux données, mais a également offert aux utilisateurs une expérience d'intelligence sans précédent.
En regardant vers l'avenir, avec le développement continu de nouvelles technologies telles que l'IA et les preuves à divulgation nulle de connaissance, les services de données Blockchain deviendront encore plus intelligents et sécurisés. Nous avons des raisons de croire que les services de données Blockchain continueront à jouer un rôle important en tant qu'infrastructure à l'avenir, fournissant un soutien solide à l'avancement et à l'innovation de l'industrie.
![Lire, indexer pour analyser, un aperçu de la piste d'indexation des données Web3])https://