我知道 Group 不能处理多个元组,因此我们在 PIG 中有 COGROUP。然而,今天检查时,GROUP 命令对我有用。我正在使用 PIG-0.12.0。
我的命令和输出如下。
grunt> grpvar = GROUP C by $2, B by $2;
grunt> cogrpvar = COGROUP C by $2, B by $2;
grunt> describe grpvar;
grpvar: {group: chararray,C: {(pid: int,pname: chararray,drug: chararray,gender: chararray,tot_amt: int)},B: {(pid: int,pname: chararray,drug: chararray,gender: chararray,tot_amt: int)}}
grunt> describe cogrpvar;
cogrpvar: {group: chararray,C: {(pid: int,pname: chararray,drug: chararray,gender: chararray,tot_amt: int)},B: {(pid: int,pname: chararray,drug: chararray,gender: chararray,tot_amt: int)}}
GROUP 会这样运作吗?
它们之间的 GROUP 和 COGROUP 有什么区别?