2.1.1 数据来源
2.1.2 数据清洗和去重
2.1.3 数据配比和顺序