Pyspark处理Kafka数据依赖包

spark 36

295.9KB 2024-04-29

#Pyspark # Kafka # 流处理 # 虚拟环境 # 依赖包

使用Pyspark进行Kafka数据流处理时，需确保 spark-streaming-kafka-0-8_2.11-2.4.5.jar 位于Python虚拟环境的 venv/lib/python3.7/site-packages/pyspark/jars 目录下。该jar包提供了Spark Streaming与Kafka 0.8.x版本进行交互所需的类和方法。