Mongodb采用$in方式提升操作效率_MySQL, Oracle及数据库讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 3061 | 回复: 0

主题： Mongodb采用$in方式提升操作效率

renruishen

注册用户

等级：新兵
经验：58
发帖：79
精华：0
注册：2011-12-25
状态：离线
发送短消息息给renruishen

加好友发送短消息息给renruishen

发消息

发表于：

2015-9-16 17:18:22 | [全部帖] [楼主帖]

楼主

Mongodb操作里许多人喜欢采用PHP的循环操作，这种方式效率非常低下，可以优化。
1、查询：
有两种方式，在PHP里循环查询和使用$in的方式。做一个查询1000条数据的示例如下：

// 循环查询
for($i = 0; $i < count($array); $i++) {
$item = $collection -> findOne(array("_id" => new MongoId($array[$i])));
echo$item["profile"]["name"] . "<br />";
}

运行时间：0.52035784721375

秒

// 采用$in的方式
$mongoIds = array();
for($i = 0; $i < count($array); $i++) {
$mongoIds[] = new MongoId($array[$i]);
}
$cursor = $collection -> find(array("_id" => array('$in' => $mongoIds)));
while($item = $cursor-> getNext()){
echo$item["profile"]["name"] . "<br />";
}

运行时间：0.15661716461182

秒

结果采用循环方式的运行时间为$in方式的3倍以上。
2、更新：
还是两种方式，在PHP里循环更新和使用$in的方式。做一个查询1321条数据的示例如下：

// 循环更新（目前删除blog时采用的方式）
foreach ($fansas$fan)
{
      $feed = $db -> command(array("findAndModify" => $MONGO_DB_FEED,
      "query" => array('_id' => new MongoId($fan)),
      "update" => array('$pull' => array("blogs"=>array("bid" => $blog_id)), '$inc' => array("count"=>-1)),
      "new" => true
      )
      );
}

运行时间：28.02441906929

秒

// 采用$in的方式
$mongoIds = array();
foreach ($fansas$fan) {
$mongoIds[] = new MongoId($fan);
}
$feed -> update(array('_id' => array('$in' => $mongoIds)), array('$pull' => array("blogs"=>array("bid" => $blog_id)), '$inc' => array("count" => -1)), array('multiple' => true));

运行时间：0.011945962905884

秒

结果采用循环方式的运行时间为$in方式的2335

倍！
第一种方式非常容易出现运行的超时的情况造成操作不成功，而第二种方式在提高效率的同时避免了这种问题的出现。
造成这样问题的原因是1、循环里的网络请求时间消耗太多时间2、$in操作可以进行查询优化，也不需要多次编译。

--转自