pyspark读取hive数据实例
使用pyspark读取hive中的数据,测试代码:
vi test.py
#!-*- coding:utf-8 -*- from pyspark import SparkConf, SparkContext from pyspark.sql import HiveContext conf = (SparkConf().setMaster("yarn").setAppName("My app").set("spark.executor.memory", "1g")) sc = SparkContext(conf = conf) sqlContext = HiveContext(sc) my_dataframe = sqlContext.sql("Select * from database.table limit 10") my_dataframe.show() sc.stop()
报错:
python pyspark_hive.py
Traceback (most recent call last):
File "pyspark_hive.py", line 2, in <module>
from pyspark.sql import HiveContext,SparkSession
ModuleNotFoundError: No module named 'pyspark'
环境变量设置:
vi ~/.profile
export SPARK_HOME=/usr/lib/spark-current export PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.10.7-src.zip:$PYTHONPATH
参考:
https://www.cnblogs.com/tong775131501/p/7582258.html
热门文章
- 「12月3日」最高速度20.6M/S,2024年Hiddify Next每天更新免费节点订阅链接
- 「12月15日」最高速度19.3M/S,2024年Hiddify Next每天更新免费节点订阅链接
- 做宠物粮的机器多少钱一台 做宠物粮的机器多少钱一台啊
- 动物疫苗接种时间表图片大全集高清(动物疫苗接种时间表图片大全集高清视频)
- 「12月13日」最高速度19.7M/S,2024年Hiddify Next每天更新免费节点订阅链接
- python神经网络tf.name_scope和tf.variable_scope函数区别_python
- DDL(数据定义语言)
- 「2月28日」最高速度21.3M/S,2025年Hiddify Next每天更新免费节点订阅链接
- 济南宠物领养救助中心 济南宠物领养救助中心电话
- 开动物医院的条件有哪些(开动物医院的条件有哪些方面)