Redis
 sql >> Base de Dados >  >> NoSQL >> Redis

Conversão de DataFrame para RDD[(String, String)]


Você pode usar df.map(row => ...) para converter o dataframe em um RDD se desejar mapear uma linha para um elemento RDD diferente.

Por exemplo:
val df = Seq(("table1",432),
      ("table2",567),
      ("table3",987),
      ("table1",789)).
      toDF("tablename", "Code").toDF()

    df.show()

    +---------+----+
|tablename|Code|
+---------+----+
|   table1| 432|
|   table2| 567|
|   table3| 987|
|   table1| 789|
+---------+----+

    val rddDf = df.map(r => (r(0), r(1))).rdd // Type:RDD[(Any,Any)]

    OR

    val rdd = df.map(r => (r(0).toString, r(1).toString)).rdd  //Type: RDD[(String,String)]

Consulte https://community.hortonworks.com/questions/106500/error-in-spark-streaming-kafka-integration-structu.html sobre AnalysisException:consultas com fontes de streaming devem ser executadas com writeStream.start()

Você precisa aguardar o término da consulta usando query.awaitTermination() Para evitar que o processo seja encerrado enquanto a consulta estiver ativa.