Après trois longues années de développement, Apache Cassandra 4.0 est désormais disponible.
La raison principale de ce temps de développement tient en une volonté : la qualité. Vinay Chella, ingénieur chez Netflix et committer Apache Cassandra, explique cela très simplement : « The goal of Cassandra 4.0, since the beginning, has been very simple: to be able to run it in production from day one of the release. »
Cette nouvelle version contient plus de 1000 corrections de bugs, de nombreuses améliorations ainsi que le développement de nouvelles fonctionnalités.
Nous pouvons notamment noter :
- Des améliorations significatives sur la communication inter-nodes et le streaming de données qui permet de transférer les données jusqu’à 5 fois plus rapidement entres les noeuds (ce qui sert très régulièrement : repairs, ajout ou remplacement de données, etc.).
- Les repairs incrémentaux ont été réécrits pour les rendre réellement utilisables en production afin d’améliorer et simplifier les opérations permettant de maintenir la consistance entre les noeuds.
- La mise en place des tables virtuelles pour accéder aux métriques et à la configuration directement en CQL.
- L’ajout d’une fonctionnalité d’audit des accès et de l’activité des utilisateurs ; cette fonctionnalité se veut avoir un impact minimal sur les performances.
- Le FQL « Full Query Logging », une fonctionnalité de capture et de replay de la charge applicative ce qui peut être très utile pour du debugging, des tests ou encore des benchmarks de performance.
- L’ajout de l’algorithme de compression Zstd pour les projets où la réduction de l’empreinte stockage est primordiale.
Cassandra 4.0 a été intensivement testé par des utilisateurs majeurs comme Amazon, Apple, DataStax, Instaclustr, iland, Netflix et d’autres qui exécutent régulièrement des clusters pouvant atteindre 1000 nœuds et avec des centaines de cas d’utilisation et de schémas réels.
La fondation Apache livre quelques témoignages :
In our experience, nothing beats Apache Cassandra for write scaling, and we’re looking forward to the performance and management improvements in the 4.0 release. We rely on Cassandra to manage over one exabyte of customer data and serve over 50 billion files for our customers across 175 countries so optimizing Cassandra’s capabilities and performance means a lot to us.
Elliott Sims, Senior Systems Administrator at Backblaze
Since 2016, software engineers at Bloomberg have turned to Apache Cassandra because it’s easy to use, easy to scale, and always available. Today, Cassandra is used to support a variety of our applications, from low-latency storage of intraday financial market data to high-throughput storage for fixed income index publication. We serve up more than 20 billion requests per day on a nearly 1 PB dataset across a fleet of 1,700+ Cassandra nodes.
Isaac Reath, Software Engineering Team Lead, NoSQL Infrastructure at Bloomberg
Netflix uses Apache Cassandra heavily to satisfy its ever-growing persistence needs on its mission to entertain the world. We have been experimenting and partially using the 4.0 beta in our environments and its features like Audit Logging and backpressure. Apache Cassandra 4.0’s improved performance helps us reduce infrastructure costs. 4.0’s stability and correctness allow us to focus on building higher-level abstractions on top of data store compositions, which results in increased developer velocity and optimized data store access patterns. Apache Cassandra 4.0 is faster, secure, and enterprise-ready; I highly suggest giving it a try in your environments today.
Vinay Chella, Netflix Engineering Manager and Apache Cassandra Committer
Apache Cassandra’s contributors have worked hard to deliver Cassandra 4.0 as the project’s most stable release yet, ready for deployment to production-critical Cloud service. Cassandra 4.0 also brings new features, such as faster host replacements, active data integrity assertions, incremental repair, and better compression. The project’s investment in advanced validation tooling means that Cassandra users can expect a smooth upgrade. Once released, Cassandra 4.0 will also provide a stable foundation for development of future features and the database’s long-term evolution.
Scott Andreas, Apache Cassandra Contributor
En parallèle de la sortie de Cassandra 4.0, l’équipe du projet a annoncé le passage à un cycle avec une release par an, et un support de trois ans ce qui devrait dynamiser le produit.
Pour conclure, notons que Cassandra 4.0 est déjà en production chez Apple, DataStax, Instaclustr, Netflix, Orange, Pythian, Sky UK, Yelp et bien d’autres.
Vous avez besoin d’assistance autour de Cassandra (conseil, expertise, services managés) ou vous envisagez de migrer vos clusters en version 4.0, contactez-nous !