MongoDB工具 >MongoDB Spark连接器 >Spark Connector Python指南 > 写入MongoDB
要创建一个DataFrame,首先创建一个SparkSession对象,然后使用该对象的createDataFrame()
功能。在以下示例中,createDataFrame()
获取包含名称和年龄的元组列表以及列名称列表:
写people
数据框在指定的MongoDB的数据库和收集spark.mongodb.output.uri通过选项write
方法:
当您连接到Shell 时,上述操作将写入spark.mongodb.output.uri选项中指定的MongoDB数据库和集合pyspark
。
若要读取DataFrame的内容,请使用show()
方法。
在pyspark
外壳程序中,该操作将输出以下输出:
该printSchema()
方法打印出DataFrame的架构:
在pyspark
外壳程序中,该操作将输出以下输出:
如果您需要写入其他MongoDB集合,请将该.option()
方法与结合使用.write()
。
要写入名为contacts
的数据库中称为
的集合people
,请people.contacts
在输出URI选项中指定。