MongoDB各种查询操作详解
作者:
一、find操作
MongoDB中使用find来进行查询,通过指定find的第一个参数可以实现全部和部分查询。
1、查询全部
空的查询文档{}会匹配集合的全部内容。如果不指定查询文档,默认就是{}。
2、部分查询
3、键的筛选
键的筛选是查询时只返回自己感兴趣的键值,通过指定find的第二个参数来实现。这样可以节省传输的数据量,又能节省客户端解码文档的时间和内存消耗。
查询时,数据库所关心的查询文档的值必须是常量。
二、查询条件
1、比较查询
$lt,$lte,$gt,$gte,$ne和<,<=,>,>=,!=是一一对应的,它们可以组合起来以查找一个范围内的值。
2、关联查询
$in用于查询一个键的多个值,$nin将返回与筛选数组中所有条件都不匹配的文档。将$in与$not组合可以实现$nin相同的效果。
$or用于对多个键做or查询。
三、特定类型的查询
1、null查询
null不仅能匹配自身,还能匹配键不存在的文档。
2、正则表达式
3、数组查询
$all:通过多个元素来匹配数组。
$size:查询指定长度的数组。
$slice:返回数组的一个子集合。
4、内嵌文档查询
四、$where查询
$where查询是MongoDB的高级查询部分,可以执行任意JavaScript作为查询的一部分,是其他查询方式的一个补充。
$where查询需要将每个文档从BSON转换为JavaScript对象,然后通过$where的表达式来运行,该过程不能利用索引,所以查询速度较常规查询慢很多。如果必须使用时,可以将常规查询作为前置过滤,能够利用索引的话可以使用索引根据非$where子句进行过滤,最后使用$where对结果进行调优。另一种方式采用映射化简-MapReduce.
五、游标
游标是很有用的东西,MongoDB数据库使用游标来返回find的执行结果。客户端使用游标可以对最终结果进行有效的控制,比如分页,排序。
1、limit,skip和sort
limit:限制结果数量,限制的是上限。
skip:略过匹配到的前n个文档,然后返回余下的文档。skip略过过多的文档时会产生性能问题,建议尽量避免。
sort:按照指定的键对文档进行排序,1为升序,-1为降序。
2、高级查询选项
包装查询:使用sort,limit或skip对最终结果进行进一步的控制。
有用的配置选项:
$maxscan:integer,指定查询最多扫描的文档数量。
$min:document,查询的开始条件。
$max:document,查询的结束条件。
$hint:document,指定服务器使用哪个索引进行查询。
$explain:boolean,获取查询执行的细节(用到的索引,结果数量,耗时等),而并非真正执行查询。
$snapshot:boolean,确保查询的结果是在查询执行那一刻的一致快照,用于避免不一致读取。
包装查询会将查询条件包装到一个更大的查询文档中,比如执行如下查询时:
db.foo.find({"name":"bar"}).sort("x":1)shell会把查询从{"name":"bar"}转换成{"$query":{"name":"bar"},"$orderby":{"x":1}},而不是直接将{"name":"bar"}作为查询文档发送给数据库。
3、游标内幕
看待游标的两种角度:客户端的游标及客户端游标表示的数据库游标(服务器端)。
在服务器端,游标消耗内存和其他资源,所以在合理的情况下需要尽快释放。服务器端导致游标终止的情况如下:
1、游标完成匹配结果的迭代时自动清除。
2、游标在客户端已不在作用域内的情况下,驱动会向服务器发送专门的消息,让其销毁游标。
3、超时销毁,可以使用immortal函数关闭游标超时时间,采用此操作一定要在迭代完结果后将游标关闭。
六、总结
使用MongoDB需要对文档结构进行合理的设计,以满足某些特定需求。比如随机选取文档,使用skip跳过随机个文档就没有在文档中加个随机键,然后使用某个随机数对文档进行查询高效,随机键还能添加索引,效率更高。合理选择,合理设计。