解决Birt等报表工具制作报表的几个难题
在上一篇《》中,我们讲解了如何帮助 Birt 制作这种报表的详细过程,在本文中我们再继续讨论几个类似的制作难题,并把说明集中在如何编写集算器 SPL 脚本上,不再赘述如何在 Birt 中引入 SPL 的步骤了。
1. 组内跨行计算
组内跨行计算是指在计算一行中某个计算列的值时,需要引用到组内其它行的数据来进行计算。比如下面这个例子:
库表 sample 有三个字段,其中 id 是分组字段。需要设计一张分组表,使用 id 分组,明细字段是 v1,v2 以及计算列 crossline, 其中 crossline 的算法是本条记录 v1、v2 之和加上本组上一条记录的 v1、v2 之和。示例源数据如下:
id | v1 | v2 |
1 | 1 | 2 |
1 | 2 | 3 |
2 | 1 | 1 |
2 | 2 | 2 |
3 | 3 | 3 |
最后要展现的报表结果如下图所示:
编写集算器 SPL 代码如下:
|
A |
1 | =connect("demo") |
2 | =A1.query("select *, 0 as crossline from sample") |
3 | >A2.group(id).run(~.run(v1+v2+v1[-1]+v2[-1]:crossline)) |
4 | >A1.close() |
5 | return A2 |
A1 连接数据库
A2 查询数据库,同时多产生一列常数备用。
A3 按 id 分组,并在每组数据中修改计算列 crossline,最后合并,其中 v1[-1]、v2[-1] 是集算器特有的定位上一行记录中字段的写法。
A4 关闭数据库
A5 将 A2 中的计算结果数据集返回给报表工具
2. 跨库数据源
制作报表的数据往往来自于多种数据源,比如不同的物理数据库、文本文件、Excel 文件等,这些数据在报表中往往还需要相互关联进行运算。
报表工具本身能实现从多数据源取数,但进行关联运算会有一定的困难,或者运算性能非常差。而由开发者自己编程去做关联运算,工作量一般又会非常大。而集算器 SPL 恰恰能在这一点帮上大忙。
下面这个例子中,订单表 orders 和订单明细表 orderDetail 数据分别来自两个不同的数据库,二者之间要做 join 运算。两表数据如下:
最后想要展现的报表结果如下:
编写集算器 SPL 代码如下:
|
A |
1 | =connect("db1") |
2 | =connect("db2") |
3 | =A1.query("select orderID,customer,orderDate from orders") |
4 | =A2.query("select orderID,productID,price,mount from orderDetail order by orderID") |
5 | >A1.close() |
6 | >A2.close() |
7 | =join@1(A3:orderID,A4:orderID) |
8 | =A7.new(#1.orderID,#1.customer,#1.orderDate,#2.productID,#2.price,#2.mount) |
9 | return A8 |
A1 连接数据库 1
A2 连接数据库 2
A3 查询订单表数据
A4 查询订单明细表数据
A5A6 关闭数据库连接
A7 以 A3 的 orderID 和 A4 的 orderID 为主键进行 left join,连接后的结果集有两个字段,第一个字段是 A3 的记录,第二个字段是 A4 的记录。
A8 以 A7 中两个字段的字段形成新的数据集,也就是需要的结果
A9 将 A8 的数据集返回给报表工具
本例只是演示了两个数据源的 left join,其实 SPL 能做关系数据库能完成的任何数据运算,比如各种 join、union、过滤、分组、排序等。
3. 字段拆分成记录
在本例中,数据库表 data 有两个字段,其中 ANOMOALIES 字段是用空格分隔的多个字符串,我们需要把 ANOMOALIES 按空格拆分为多个字符串,并用每个字符串和原 ID 字段形成新的记录。源数据如下:
ID | ANOMALIES |
3903 | B1 D1 CAT1 |
3904 | D7 D2 B1 CAD4 |
最后想要展现的报表结果如下:
编写集算器 SPL 代码如下:
|
A |
1 | =connect("db") |
2 | =A1.query("select ID,ANOMALIES from data") |
3 | =A2.conj(ANOMALIES.array(" ").new(A2.ID:ID,~:ANOMALIES)) |
4 | >A1.close() |
5 | return A3 |
A1 连接数据库 1
A2 查询 data 表数据
A3 将ANOMALIES字段值按空格拆分,并与原ID形成新的记录
A4 关闭数据库连接
A5 将 A3 形成的数据集返回给报表工具
4. 主表中动态插入子表字段
在本例中,数据库表 dColThread 是主表,主键是 tID。dColQuestion 是子表,外键是 tID,如下:
dColThread
tID | ApplicationName | User | Phone | Decline |
A01 | mfc | Bill | +70000000 | 1 |
A02 | mfc | John | +18761221 | 2 |
A03 | java | Jack | +8014001231 | 6 |
A04 | mfc | Tim | +008613133123 | 4 |
A05 | db | John | +18761221 | 8 |
dColQuestion
qID | tID | status |
1 | A01 | yes |
2 | A01 | no |
3 | A01 | yes |
4 | A02 | yes |
5 | A03 | no |
6 | A04 | no |
7 | A04 | no |
8 | A05 | yes |
报表需要根据 ApplicationName 查询主表并以列表的形式展现数据。可以看到,在子表中,主表每条记录对应的 status 字段值有多个,但不超过 5 个。我们需要把子表中的这些记录横向排列后插入主表的 Phone、Decline 字段之间,依次命名为 QuestionNo1、QuestionNo2…QuestionNo5。同时,如果某列数据都为空,则这一列不显示。最后的表样形如下图:
用集算器准备数据,SPL 代码如下:
|
A | B |
1 | =connect("db") | |
2 | =A1. query("select * from dColThread t,dColQuestion q where t.tID=q.tID and t.ApplicationName=?",arg1) | |
3 | >A1.close() | |
4 | =A2.group(tID) | |
5 | =create(ApplicationName,User,Phone,QuestionNo1,QuestionNo2,QuestionNo3,QuestionNo4,QuestionNo5,Decline) | |
6 | for A4 | =A6.(status)|["","","","",""] |
7 |
|
= A5.record(A6.ApplicationName|A6.User|A6.Phone|B6.to(5)|A6.Decline) |
8 | return A5 |
A1 连接数据库
A2 执行 SQL,取出主子表关联数据。arg1 是来自报表参数。假如 arg1= "mfc ",则 A1 的计算结果如下:
A4 按照 tID 分组,每组是一条主表记录及其对应的子表记录,如下图:
A5 按照报表中列表的结构新建空二维表。
A6 循环 A4 中的组,每次向 A5 插入一条记录。循环体中可用 A6 引用循环变量,用 #A6 来引用循环计数。
B6 取当前组中 status 的字段值,并补足至少 5 条记录。
B7 向 A5 追加新记录。循环结束后 A5 如下:
A8:返回结果给报表。
隐藏空列的工作交给 BIRT,设计 list 表,模板如下:
如果 QuestionNo 列为空则应当隐藏。动态隐藏的方法有很多,这里介绍其中一种。对于 QuestionNo5(其他列类似),可以先在 dataSet 的 onFetch 方法中使用如下脚本:
if(reportContext.getGlobalVariable("t5")==null){
reportContext.setGlobalVariable("t5",row.QuestionNo5)
}else{
reportContext.setGlobalVariable("t5",reportContext.getGlobalVariable("t5")+row.QuestionNo5)
}
再在 QustionNo5 列的 Visibility 属性中使用如下表达式:BirtStr.trim(reportContext.getGlobalVariable("t5"))==""
预览后可以看到报表结果:
5. 小结
通过以上例子可以看出,报表制作时经常遇到不好处理的数据准备工作,而在集算器的帮助下都可以得到完美的解决。这是因为集算器提供了完备的数据源连接功能,能连接市面上常见的各种数据源并从中取数。同时,SPL 还提供了丰富的函数库,能在库外轻松进行数据的各种关联运算。