发布网友
共1个回答
热心网友
分箱,意思就是将连续型的数据分成几个数据段,即离散化。比如将原本连续的年龄特征离散化,结果可变为0-18,18-30, 30-50,大于50,这个过程就是:连续 —>不连续。
可能通过箱线图直观看一下分布,再根据行业的特点,经验初分。理论上也可以通过卡方检验再做细分。