MongoDB工具 >MongoDB Spark连接器 >Spark Connector R指南 > 写入MongoDB
在本页面
要创建一个DataFrame,首先创建一个SparkSession对象,然后使用该对象的createDataFrame()
功能。该sparkR
外壳提供了一个名为默认SparkSession对象
spark
。
要创建DataFrame,请使用createDataFrame
方法将R转换data.frame
为Spark DataFrame。要将DataFrame保存到MongoDB,请使用以下write.df()
方法:
注意
空参数(“”)是指用作数据源的文件。在这种情况下,我们的数据源是MongoDB集合,因此数据源参数为空。
上面的操作将写入Shell参数或
配置中指定的spark.mongodb.output.uri选项中指定的MongoDB数据库和集合。sparkR
SparkSession
要读取DataFrame的前几行,请使用head()
方法。
该操作将输出以下输出:
该printSchema()
方法打印出DataFrame的架构:
在sparkR
外壳程序中,该操作将输出以下输出:
您可以向该write.df()
方法添加参数以指定MongoDB数据库和集合。
以下操作将charactersSparkdf
数据写入到名为ages
的数据库中的MongoDB集合中
characters
。