从美团云GPU云主机谈起 揭秘美团外卖的AI技术
提起人工智能,很多人会想到战胜人类的AlphaGo, 想到具有情感认知能力的机器人, 殊不知你每天订餐的外卖平台也应用了大量的AI技术,AI正渗透到生活的方方面面。
以占据近六成市场份额的美团外卖为例,为了应对复杂的场景,美团外卖搭建了平均送达时间28分钟的智能调度系统、训练机器自动审核提高了运营效率以及采用图片识别技术提升了用户体验。
其实,美团外卖平台从技术的最底层便开始使用AI技术——利用美团云GPU云主机来加速DNN(Deep Neural Network深度神经网络)算法,并通过深度学习对平台上的图像、文字进行自动识别,实现了美团外卖的高效、平稳运行。
GPU云主机加速DNN算法解决核心难题
深度学习作为机器学习的一个重要分支,能够建立、模拟人脑进行分析学习的神经网络,以人脑的机制解释数据,例如图像,声音和文本等。这使得机器能从海量数据中摸索规律,具有和人类相似的思考能力,从而对新的样本做智能识别或对未来做出预测。
图一:DNN深度神经网络与人工智能的关系
目前支撑深度学习的算法中,比较常用的是DNN算法。它能较好地模拟人脑神经元多层深度传递的过程,在语音识别和图像识别方面表现突出。但是,人脑的构成异常复杂,一个健康的成年人的大脑中约有860亿个神经元,每个神经元之间形成大约1000个突触。机器想要模拟人脑就需模拟出更多的神经元和神经突触,这带来了超高的计算复杂度。
因此,美团外卖技术团队选择了美团云GPU云主机来对DNN算法进行加速。该云主机搭载了NVIDIA Tesla M60 GPU,预装了TensorFlow 1.1-GPU框架和Keras 2.0.4框架。M60可提供最高4096个并行处理核心,16GB的GDDR5显存及9.7TFlops 的单精度峰值性能,能够快速处理海量数据解决深度学习中的计算难题。
有了GPU云主机提供的计算能力作为基础支撑,美团外卖主要将深度学习用于图片质量识别和OCR印刷文字识别两个场景,这也是和平台用户及商家密切相关的应用场景。
图像质量识别提升用户体验
用户在外卖平台能够看到大量的美食图片,图片的美观程度影响着用户在点餐时的视觉体验以及下单决策结果,因此,图片质量尤为重要。
图二:外卖平台图片示例
以上图为例,用户普遍认为左侧的图片在拍摄角度、色彩等方面均优于右侧。然而,人工进行图片质量的评判一般较为主观,每个用户的标准不一。此外,人工评判进行标注又需要耗费大量的人力和时间。
基于此前的海量图片、点击率、评论等数据,美团外卖通过深度学习建模,采用多维度特征设计、自动化数据标注的方式,用DNN算法来判断图片的品类、色彩、对比度等基础特征。最终以保证质量较高的图片出现在用户眼前,不仅提升了用户的点餐体验,还能够有效促进商家在平台的成单率。
图三:针对图片质量问题美团外卖给出的DNN解决方案
OCR文字识别智能审核商家资质
美团外卖整合了超过100万家商户,为了提供可靠的服务,平台需要对商家牌照逐个审核并进行监管,打造让用户放心的外卖平台;商家入驻后,又需要将店铺资料、菜单等信息录入,为用户提供最全面的服务信息。
无论是资质牌照的审核还是菜单的录入,涉及到的文字构成可能异常复杂,如各种各样的字体、杂乱的背景等。如果全部人工操作,将产生极大的人工成本,肉眼识别还容易出现疏忽疏漏的情况。
为了成功在图片中检测到文字并进行准确识别,美团外卖整体采用了CNN算法并加入BLSTM(bidirectional long short-termmemory双向长短期记忆网络)的模式。考虑到整个序列建模的能力,美团外卖平台又加入了CTC(Connectionist Temporal Classifier联结主义时间分类器)序列识别模型。
图四:美团外卖的文字检测识别方案
通过美团云GPU云主机对算法模型的加速,美团外卖平台上的上百万家商户数据能够快速得到处理,并的到有效的审核监管。利用机器完成资质审核、文字录入的工作,大大提升了平台的运营效率,实现了精细化运营。
人工智能的发展得益于大数据和云计算的日趋成熟。美团点评聚集了超6亿用户、2.4亿活跃买家以及450万商户的海量数据,从2013年起,美团云就开始逐步承担起集团的全部业务,100%云化为美团点评AI技术的应用打下了良好的技术基础。
在底层计算、算法平台、AI应用方面,美团云也走在了行业前列。除GPU云主机外,美团云还上线了FPGA云主机和KNL物理机,并将推出KNM云主机,为用户提供更多选择。已经上线的深度学习平台和人脸识别、OCR文字识别等AI应用也进一步提升了整个平台的智能化水平。