随着自动驾驶传感器方案及计算平台的日趋同质化,“场景化数据”驱动的算法优化正成为自动驾驶技术商业化落地的必由之路。
从自动驾驶算法角度来看,当训练数据集数量越庞大,覆盖面越广,标注越精细,分类的越准确、类型越多,那么训练出来的自动驾驶算法性能就越好。
换而言之,没有足够数量和高质量数据的加持,自动驾驶就缺少了对车辆周围环境的定量感知,犹如人没有眼睛,自动驾驶的决策系统就无法正常工作。更别说,与其他应用场景相比,自动驾驶需要面对更为复杂多变的路况环境。
马达智数行车记录仪视频数据集系列产品涵盖了多个城市的多类型道路场景,在多种天气条件下,通过行车记录仪视角采集行驶过程中的车外物体。
本次发布的版本1.0数据集的视频总时长约6,300分钟,总标注图片数量约2万张,包含了对多类型目标的约20万拉框,以及遮挡、朝向等属性。
♦︎ 多城市的多类型道路:目前包括高速公路、十字路口等路况场景;
♦︎多种天气条件:包含晴天、多云、低光照,雨天等天气情况;
♦︎多类型的标注对象:涵盖了道路上典型的目标类型,包括汽车、行人、电动车、公交、卡车等 10个标注大类别。