GridGain®内存计算平台用于全球客户的流式分析业务中,为大型核心业务应用的流式数据提取、处理、存储和发布提供支撑。GridGain已经帮助世界上一些最大的银行用于贸易处理、结算和合规;帮助电信公司通过电话网和互联网提供呼叫服务;帮助零售商和电子商务供应商提供改进的实时体验;帮助领先的云基础架构和SaaS供应商作为其产品的内存计算基础。客户已经能够在中等规模的集群上以每秒数百万个事件来提取和处理流式数据。

GridGain可以与主要流技术一起集成使用,包括Apache Camel、Apache Kafka、Apache Spark®和Apache Storm、消息服务(JMS)和MQTT,用于提取、处理和发布流数据。加载到集群中之后,客户就可以利用GridGain的内置大规模并行处理库进行并发数据处理,包括并发SQL查询、机器和深度学习。然后,客户端可以订阅持续查询,这些查询在处理流时执行和识别重要事件。

Streaming Analytics

GridGain还提供与Apache Spark广泛的内存计算集成。该集成包括对Spark DataFrames的原生支持,GridGain RDD API作为可变的Spark RDD,可以用于读取和写入GridGain的数据,包括优化的SQL以及使用GridGain文件系统(GGFS)的HDFS的内存实现。集成部署时,可以实现:

  • 访问GridGain中的所有内存数据,而不仅仅是数据流
  • 在所有Spark作业中共享数据和状态
  • 充分利用GridGain的所有内存加载和处理功能,包括机器和深度学习、实时训练模型,以改善运行中的HTAP应用的结果