빅데이터(BigData)/Spark

spark에서 list로 dataframe 만들기

leebaro 2020. 10. 19.
728x90

spark에서 createDataFrame을 하면 df를 만들 수 있다.

이 때 스키마를 지정해야하는데 기존의 df와 동일하게 만들고 싶다면 df.schema를 바로 이용할 수 있다.

list_rslt_on_driver_node = df_rslt.collect()

df_rslt_on_driver_node = spark.createDataFrame(list_rslt_on_driver_node,schema=df_rslt.schema)

df_rslt_on_driver_node.repartions(1)



df2 = df_rslt_on_driver_node.repartition(1)
728x90