728x90
pyspark 코드를 실행하기 위해서 import pyspark를 해도 아래와 같이 에러가 발생할 수 있다.
ModuleNotFoundError: No module named 'pyspark' |
그 이유는 pyspark가 정규 library로 인식되지 않기 때문에 pyspark의 위치를 찾을 수 없기 때문이다.
이 때는 아래와 같이 findspark 라이브러리를 설치 후 실행하면 된다.
pip install findspark |
import findspark
findspark.init()
import pyspark
sc = pyspark.SparkContext(appName="myAppName")
추가적으로 궁금한 내용은 아래 링크에서 찾아보면 된다.
728x90
'빅데이터(BigData) > Spark' 카테고리의 다른 글
ERROR cluster.YarnScheduler: Lost executor 1 on xxx-Xxxx: Slave lost 에러 발생 시 (0) | 2021.08.09 |
---|---|
pyspark 실행 후 config를 수정하는 방법 (0) | 2021.07.06 |
pyspark에서 비어있는 DataFrame 만들기 (0) | 2021.04.28 |
pyspark에서 agg에서 multiple columns 사용하기 (0) | 2021.04.13 |
스파크에서 로그 레벨 정의하기 (0) | 2021.04.12 |