首先要引入mongodb-spark-connector的maven依赖具体的可见這个api网址:,然后基本上就可以按照api上面的内容来进行spark操作了这里面已经有spark读入mongodb数据转化为rdd的操作了。
有一些补充的或许有用(?)的代码放在这里。
假设已经插入下面数据:
使用$set只更新特定的字段
$set
该例子介绍使用$inc修改符增加特定值。
$inc
该例子介绍使用updateMany更新符合条件的多个文档
updateMany