数据来源:
数据产品的输入数据由广东省内各地级市公共交通服务商采集并提供岭南通公司,数据内容为全国不特定乘客在广东省跨区使用公交卡乘坐公共交通工具的交易数据,所包含的数据字段为发卡机构、收单机构、交易类型、交易时间、交易金额等字段。岭南通公司根据所获得的原始输入数据无法识别任何特定自然人身份信息。经加工后最终对外输出的数据产品包含公交卡发行地、刷卡使用地、刷卡时间、消费金额等字段,截止到2025年1月12日数据量共9,065,181条、数据文件大小349MB,预计到2027年底数据量共约14,369,400条、数据文件大小约553MB。
广东省各地市公共交通服务商在归集公交卡刷卡数据后,通过专线网络上传到岭南通公共交通省级平台(以下简称“省级平台”)数据交换服务器,省级平台对原始输入数据执行格式校验、历史重复校验、上下笔数据逻辑校验、TAC码等数据清洗处理,再应用K-means算法和聚类模型分析和挖掘乘车数据与地市基础字典数据的关系,通过计算关联出不特定自然人的公交卡发行地、刷卡使用地、刷卡时间、消费金额等信息的逻辑关系,得到跨区客群流动分析数据,并持久化存储到省级平台数据库做长期保存。
数据产品的输入数据由广东省内各地级市公共交通服务商采集并提供岭南通公司,数据内容为全国不特定乘客在广东省跨区使用公交卡乘坐公共交通工具的交易数据,所包含的数据字段为发卡机构、收单机构、交易类型、交易时间、交易金额等字段。岭南通公司根据所获得的原始输入数据无法识别任何特定自然人身份信息。经加工后最终对外输出的数据产品包含公交卡发行地、刷卡使用地、刷卡时间、消费金额等字段,截止到2025年1月12日数据量共9,065,181条、数据文件大小349MB,预计到2027年底数据量共约14,369,400条、数据文件大小约553MB。
广东省各地市公共交通服务商在归集公交卡刷卡数据后,通过专线网络上传到岭南通公共交通省级平台(以下简称“省级平台”)数据交换服务器,省级平台对原始输入数据执行格式校验、历史重复校验、上下笔数据逻辑校验、TAC码等数据清洗处理,再应用K-means算法和聚类模型分析和挖掘乘车数据与地市基础字典数据的关系,通过计算关联出不特定自然人的公交卡发行地、刷卡使用地、刷卡时间、消费金额等信息的逻辑关系,得到跨区客群流动分析数据,并持久化存储到省级平台数据库做长期保存。
扫码关注微信号
扫码关注公众号
咨询服务热线