在Spark中,假設(shè)lines是一個DStream對象,filter語句可以過濾掉80%的數(shù)據(jù),針對以下兩個語句說法正確的是:() X:lines.filter(...).groupByKey(...) Y:lines.groupByKey(...).filter(...)
A.X比Y的性能更高 B.X比Y的性能更低 C.X和Y和性能一樣 D.無法確性X和丫的性能差異
A.分桶表,按照天分桶 B.分區(qū)表,按天分區(qū) C.傾斜表,傾斜字段選擇日期,傾斜值隨機 D.分區(qū)+分桶表,按照時間分區(qū),每個分區(qū)2560個桶