排名在各行各业都比较流行,大到世界大学排名、福布斯富豪榜,小到班级学生成绩排名、银行按号排队办理业务等等。在数字化时代,通常数据库都能比较方便地支持排名次序。不过,也并不是所有的数据库都能如此,例如数据库 Mongodb,它可以按照下标查出内嵌数组的元素,但是却不能通过元素值来查询下标,也就是不能知道元素的次序。如果在 MongoDB 数组中按照排名先后顺序存放人员姓名,它可以做到根据排名(数组下标)来找姓名,但是不能通过姓名查找排名(数组下标),也就是能够知道排第几名的是谁,却不能知道某人排在第几个位置。对于这种情况,我们可以利用集算器 SPL 语言来进行辅助,完美实现数组查下标的功能,下面用例子说明。
Mongodb 的集合 users 中,保存了姓名和朋友(数组)。朋友数组中的人名是按照排名顺序保存的,样例数据如下:
> db.users.find({"name":"jim"})
{
"_id" : ObjectId("544f3bf8cdb02668db9ab229"), "name" : "jim", "friends" : ["tom", "jack", "luke", "rose", "james", "sam", "peter"]
}
mongodb查找指定排名的人名,例如查找 jim 的朋友当中,排名第一的人名:
> db. users.find({"name":"jim"},{"friends":{"$slice":[0,1]}})
{
"_id" : ObjectId("544f3bf8cdb02668db9ab229"), "name" : "jim", "friends" : ["tom"]
}
如果只用 MongoDB 的功能,我们无法查找 jim 的朋友当中“luke”的排名数值,不过使用了 SPL 语言后就可以轻松实现了。
使用集算器 SPL 的代码如下:
A | |
1 | =mongo_open("mongodb://localhost:27017/local?user=test&password=test") |
2 | =mongo_shell(A1,"users.find({name:'jim'},{name:1,friends:1,_id:0})") |
3 | =A2.fetch() |
4 | =A3.friends.pos("luke") |
5 | =mongo_close(A1) |
A1:连接 mongodb,ip 和端口号是 localhost:27017,数据库是local,用户名和密码都是 test。如果需要其他参数的话可以按照 mongo://ip:port/db?arg=value&…格式设置参数。
A2:使用 MongoDB 的 find 函数从集合 users 中取数,形成游标。过滤条件是 name=jim,指定键是 name 和 friends。SPL游标能够分批读取和处理数据,可以避免数据量过大,以防内存溢出。
A3:因为数据量不大,所以这里可以直接 fetch 出游标的所有记录。
A4:使用 pos 函数,查出 luke 的位置。
运行的结果是:
Value |
3 |
简言之,SPL 先通过条件获取到排名的数据,再用函数 pos() 查出所给人员姓名的位置,使用非常容易,书写也简洁。
需要说明的是:集算器SPL并不包含mongodb的java驱动包。如果要用SPL访问mongodb,必须提前将mongodb的java驱动包(例如:mongo-java-driver-3.9.1.jar)放到集算器设置的外部库目录extLib\MongoCli下。
除了在集算器中直接计算,上述使用SPL语言协助mongodb计算的脚本也很容易集成到java中,只要增加一行,写成return A4即可向java输出resultset形式的结果,具体的代码参考SPL教程。同样,用java调用SPL访问mongodb也必须将mongdb的java驱动包放到java程序的classpath中。