MongoDB工具 >MongoDB Spark连接器 >Spark Connector Python指南 > 从MongoDB读取
您可以创建一个Spark DataFrame来保存来自您正在使用的spark.mongodb.input.uri选项中
指定的MongoDB集合的数据
SparkSession
。
考虑一个名为的集合fruit
,其中包含以下文档:
spark.read()
从pyspark
shell 内将集合分配给DataFrame 。
Spark对记录进行采样以推断集合的模式。
上面的操作产生以下shell输出:
如果需要从其他MongoDB集合中读取数据,则在将数据读取到DataFrame中时使用.option方法。
要从名为contacts
的数据库中
的集合中读取内容people
,请people.contacts
在input URI选项中指定。