PIG 中的 GROUP 和 COGROUP 有什么区别?

2024-01-29

我知道 Group 不能处理多个元组,因此我们在 PIG 中有 COGROUP。然而,今天检查时,GROUP 命令对我有用。我正在使用 PIG-0.12.0。 我的命令和输出如下。

grunt> grpvar = GROUP C by $2, B by $2;
grunt> cogrpvar = COGROUP C by $2, B by $2;
grunt> describe grpvar;

grpvar: {group: chararray,C: {(pid: int,pname: chararray,drug: chararray,gender: chararray,tot_amt: int)},B: {(pid: int,pname: chararray,drug: chararray,gender: chararray,tot_amt: int)}}

grunt> describe cogrpvar;

cogrpvar: {group: chararray,C: {(pid: int,pname: chararray,drug: chararray,gender: chararray,tot_amt: int)},B: {(pid: int,pname: chararray,drug: chararray,gender: chararray,tot_amt: int)}}

GROUP 会这样运作吗? 它们之间的 GROUP 和 COGROUP 有什么区别?


是的,团队就应该这样工作!

根据文档(http://pig.apache.org/docs/r0.12.0/basic.html#group http://pig.apache.org/docs/r0.12.0/basic.html#group ) :

注意:GROUP 和 COGROUP 运算符是相同的。双方运营商 与一个或多个关系合作。为了便于阅读,GROUP 用于 涉及一个关系的语句并且在语句中使用 COGROUP 涉及两个或多个关系。您可以 COGROUP 最多但不能更多 一次超过 127 个关系。

所以这只是为了可读性,两者之间没有区别。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PIG 中的 GROUP 和 COGROUP 有什么区别? 的相关文章

随机推荐