数字化转型浪潮之下,买车也能靠算法优化?
近年来,汽车产业在数字化转型浪潮的驱动下,不断进行着稳步的转型升级与业务重塑。而在此过程中,AI 算法的介入为汽车产业各业务线的经营效率提升与价值平衡起到了极大的帮助。在不久前由 51CTO 举办的【T·TALK】全年系列技术分享活动中,大搜车集团 AI 中心负责人 / 资深总监张扬老师就“AI 算法在汽车行业数字化转型中的应用”话题进行了公开的直播分享,结合汽车行业自身特性,重点介绍了 AI 技术在多场景数字化中的应用以及基于 AI 算法的汽车行业业务优化案例。以下为本次分享的核心内容整理,希望能为读者带来一些收获。
本次分享,主要想与大家聊一聊 AI 算法以及我在汽车行业和消费互联网行业的一些工作实践。在这其中,首先要介绍的是消费互联网与产业互联网的概念。
结合自身经验来讲,我从 2012 年开始负责搜狗输入法的算法团队,对于搜狗而言,更多的是涉足到消费互联网上的,大家对消费互联网都比较了解,包括衣食住行在内,每一个行业在目前也都有每一个行业的剧情。
从 2021 开始,我加入了搜车集团,投身到了产业互联网行业。产业互联网的核心其实同样是应用 AI、云计算、大数据等技术,对行业上的一些经典应用场景进行赋能。从狭义角度看,产业互联网主要涉及生产制造领域。而从广义角度来讲,产业除了生产制造外,还必须经过流通、交易、物流及仓储,因此产业互联网也并非完全局限于生产制造的领域。
互联网的赋能技术,其中所涉及的方法很多都是相通的,包括 AI、大数据、云计算以及现在的区块链和物联网的一些技术。而这其中的趋势,可以理解为信息化、数字化和智能化三个阶段。
信息化,是一个形式上的变化和差异。数字化,更多的是商业模式包括应用方式的转变。而在数字化的一个更高级阶段,所经历的则是广泛的应用 AI 以及相关技术对数字化的提速。通过 AI 技术的赋能,如今各行业的数字化进程正呈现出指数加速的趋势。
接下来,我将以汽车行业为例介绍产业互联网的算法应用。选择汽车行业作为具体案例的主要原因有两个,第一是因为汽车行业的市场规模与市场空间比较大,目前中国已是全球规模最大的汽车消费市场,不管是新车还是二手车,都拥有着比较大的规模。
第二,在汽车行业里涉及到的商品数量是较少的,这使得技术更容易实现。以车型为例,品牌下有不同的车系,车系下有不同的车型,数目大概是六七万的规模。当在进行 AI 实践的时候,如果需要做知识图谱的话,一个几亿规模的图谱和一个几万规模的图谱,其中的差异是很大的,会涉及到工作量以及重复劳动的问题,这会影响 AI 工作所能提供的技术高度。
在具体业务线的选择上,本次会以二手车作为业务主线。目前,包括搜车在内的国内外头部汽车行业企业,都是以二手车作为主业的,这其中也有着几点重要的原因。首先,二手车是非标品。二手车作为一个商品去买卖的时候,是一车一况的,其使用情况、折旧情况都有所不同,这就会造成较大的议价空间,正因为有利益的驱使,所以做车辆流通的企业都倾向于二手车作为主业,不像广告词说的那样,确实是需要有中间商赚差价的。
另外,目前中国的二手车交易是逐年增长的,并且有相关的政策扶持,国家也在促进二手车的应用和流通。
从 AI 从业者的角度来讲,当我们在做汽车流通,尤其是二手车流通领域业务时,是会遇到一些困难和挑战的。其中最主要的便是之前所提到过的一车一况,二手车的车况是难以判定的,但是当我们将二手车进行商品化时,需要去判定车况损耗的情况,比如剐蹭、掉漆、磨损,需要去界定它的状态和价值,这样才能完成对它的完全商品化。另外,对车辆相关证件的信息化录入也是必不可少的。这些都是将二手车从一个线下实体变为线上可浏览页面所需要做的工作。
其次,因为我们的主要工作是行业赋能,对于传统 4S 店以及二手车商而言,它们的店面主要是存在于线下的。对于一些线上或线下的 C 端客户而言,它们需要的是快速的匹配,但这其中难免会存在一些地域差异等影响因素。
最后,在二手车的售后过程中也很容易出现问题,如果顾客接手了事故车,那么顾客后续的使用包括安全方面是会存在很大隐患的,这里面也存在很多难以处置的问题。
而搜车所做的,则是为上述问题提供基于 AI 技术的行业解决方案,AI 解决的基础可以理解为 ABC。A 代表 AI,B 代表大数据,C 代表云计算。搜车的侧重点主要在交易和营销领域,从一开始商品的上架,到交易的匹配,再到交易的金融方案与物流售后,每一个环节我们都会有相应的赋能。整体流程可分为前中后三个阶段,其中的定损检测和残值预测是二手车特有的,去掉这两个步骤,剩余的阶段对于新车交易也是同样适用的。
本次主要选择整体流程中的车况检测、残值预测与匹配交易三个环节,与大家分享 AI 算法在其中的应用。首先,是车况检测环节。做定损检测分成五个环节,首先对于车辆的车证进行录入,接下来检测师会对车辆的外观和内饰做拍照或录制视频,AI 算法则会自动识别视频或者图片里的车辆部件及瑕疵。随后,检测师将对所呈现的瑕疵进行核对及修改。在确认信息无误后,检测师会把数据传输到云端后台进行审核。
在这个流程中要解决的核心问题,是要提升算法识别的精确度。而其中主要的困难,在于汽车部件与瑕疵类型的数目过多且难以区分。对此,所做出的提速和效果优化分成几个维度,一般图像识别的任务会用 CNN 去抽取基本特征,而后是基于 Transformer 的模型在图像中进行应用,并使用 Transformer 的模型做了一些简单的调整。另一方面,基于汽车的图片,我们构建了一个汽车领域的预训练的模型,并在流程上做了一些优化,使得一张图里边能够识别尽可能多的缺陷,当然这里也有可能误检与漏检,对此我们做了一些调整,使得我们后面的提速得到了比较明显的体现。
其次是车辆残值预测环节,这里的第一个困难是在于缺乏标准,二手车很难用一个很确切的方式去衡量。它的价格影响因素很多,有地域因素、车况因素、颜色因素,这是在品牌车型之外的一些需要去考量的目标。第二,在所使用的数据中,车辆要么作为零售卖出,要么就是批售卖出,不会同时存在零售价和批售价,因此会存在零售价和批售价倒挂的问题。
对于上述问题,首先需进行数据层面的优化,采用新车与二手车的零售价、批售价数据进行共同考虑。由于国产车与外国品牌车辆的销售策略不同,因此新车的指导价与到手价会是二手车估价的一个重要影响因素。另一方面,是否有足够的交易数据量支撑也是极为重要的一点。而在特征层面,则需要更加全面的特征考量,这其中包括车辆的车型信息、车龄、地域、颜色、过户次数、里程数、车况、新车指导价、新车到手价等特征。其次是模型层面,这部分的差异化是比较小的,各企业都会利用深度学习模型或者树模型。最后的接口层面,零售、批售对应的价格以及处置的周期,都是往经营分析上面去靠的。
最后一个环节,是车辆的匹配与交易,该环节存在的困难第一是车辆的购买,C 端是一个高消费但低频的环节,用户的决策周期是比较长的,而车商往往是聚集到线下的。因此,获取采集它们信息并放到线上去做自动的匹配是比较困难的,并且这其中还存在一些地域的差异。对此的解决的方式是,通过集团内部资源的整合,尽可能让交易能够挂到线上,并综合考虑物流,尽可能地解决其中的跨地域问题,包括对一些顶价策略、一些 bot 策略去做提升。这里的技术架构其实也是比较经典的,就是推荐系统的模型。
而为了更好的赋能匹配与交易环节,需要对传统推荐系统进行优化,更多的考虑用户的系统优化,并把用户的推荐系统的系统目标与平台的营收目标结合起来,基于 MMoE 模型进行整合。综合的考虑用户使用的满意度以及平台营收的满意度。采用田忌赛马的思想,在某些部分进行一定程度的舍弃,去降低某些客户的需求,实现保证全局收益的最终目标。
无论是消费互联网还是产业互联网,其中都会应用到很多的 AI 技术。而我们要做的,是根据业务的需求和目标选择合适的模型,以结果作为技术应用的最终导向,为业务目标的提升、用户体验的提升,去选择最合适的技术手段。
并且在许多业务之中,一些人工的、规则的,包括一些统计的简单模型,其实也是有着生存空间的,而且它们所发挥的作用有时会比我们所追求的高大上的算法还要大。最后,在技术的应用方面,希望大家能进行更多新的尝试,这将会是很有意思的事情。
张扬,大搜车集团 AI 中心负责人 / 资深总监。搜狗输入法初创成员之一,历任搜狗输入法算法负责人,前平安人寿 AI Lab 语义问答产品负责人,现大搜车集团 AI 中心负责人、资深总监。发表及合作发表 ACL、EMNLP、IJCAI 等 CCF A/B 类国际 AI 会议论文 10 篇,国际及国内技术专利 28 项。
此外,更加值得关注的是,在今年的 4 月 9 日 -10 日,张扬老师还将以专题出品人及演讲嘉宾的身份出席 WOT 全球技术创新大会,并在大会的“算法与 AI 应用”专题中为参会听众带来更多 AI 技术细节层面的内容分享。对 AI 算法及产业数字化转型感兴趣的同学,这将是你不容错过的学习与成长机会。
目前大会 8 折购票中,现在购票立减 1160 元,团购还有更多优惠!感兴趣的同学可扫描下图二维码或点击阅读原文了解更多参会信息。任何大会相关问题欢迎联系票务小姐姐秋秋:15600226809(电话同微信)