淘宝网算法原理及信息处理情况说明

 

为依法保障用户对淘宝网算法推荐服务的基本原理、目的意图和主要运行机制的知情权,告知用户淘宝网提供的算法推荐服务情况,并保障用户的选择权,淘宝网服务提供者(或简称“我们”)制定本《淘宝网算法原理及信息处理情况说明》,帮助用户充分了解在使用淘宝网产品和服务的过程中我们如何通过利用生成合成类、个性化推送类、检索过滤类等算法技术向用户提供信息和服务,以便用户更好地作出选择。

一、适用范围

本说明适用于淘宝网服务提供者以网站、客户端、小程序以及随技术发展出现的新形态向您提供的各项产品和服务。

二、算法原理说明

1、个性化推送类算法

算法名称

淘宝推荐算法

算法基本原理

为向淘宝平台电商用户展示商品或服务信息,包括用户的访问足迹、历史搜索情况,我们会收集和使用用户在访问或使用淘宝时的浏览、搜索记录。我们会结合依法收集的设备信息、服务日志信息,以及其他取得用户授权的信息,通过算法模型预测人群偏好特征。我们会基于人群偏好特征在淘宝及其他第三方应用程序向相关人群推送可能感兴趣的商业广告及其他信息,或者商业性短信息。

算法运行机制

个性化推荐类算法会基于模型预测人群偏好特征,匹配人群可能感兴趣的商品、服务或其他信息,对展示的商品、服务或其他信息进行排序。我们会根据用户使用产品过程中的浏览行为,对推荐模型进行实时反馈,不断调整优化推荐结果。为满足多元需求,我们会在排序过程中引入多样性打散机制,拓展推荐的内容,避免同类型内容过度集中。

如用户不想看到我们在首页或支付完成页面等推荐的商品或服务,用户可以通过长按被推荐的商品或服务图片,在随后出现的弹窗中根据提示选择屏蔽类似商品或者商品或服务所属的类目;如用户想管理我们为其推送的个性化内容,可以在“我的淘宝-设置-隐私设置-推荐管理”中进行设置。

算法应用场景

淘宝平台首页、逛逛、支付完成页面等的商品或服务信息展示

算法目的意图

向用户展示商品或服务信息

备案编号

网信算备330110872770702220011

 

2、检索类算法

算法名称

淘宝搜索算法

算法基本原理

为向淘宝平台用户展示更契合搜索意图的商品或服务信息,检索类算法将针对用户输入的搜索词,使用算法模型预测、匹配相关可能感兴趣的商品或服务信息,最终完成搜索结果的展示。

算法运行机制

在用户输入的搜索词后,我们将使用文本匹配的倒排索引和基于神经网络的向量匹配召回算法,根据搜索关键词特征、商品特征、用户在淘宝的使用情况等对商品和服务进行召回,并结合相关性模型保障结果页展现的商品结果与搜索的关键词相关。同时,为满足用户多元需求,我们会在排序过程中引入多样性打散机制,拓展展示的内容,避免同类型内容过度集中。

如用户在使用我们提供的站内搜索服务时,需要查看不针对其个人特征的排序,可以在搜索结果页面点击“筛选”,选择其中的“销量”、“价格”、“通用排序”进行设置。

算法应用场景

淘宝平台首页搜索框等商品或服务的检索

算法目的意图

帮助用户快速找到想要的商品或信息

备案编号

网信算备330110872770704220021

 

3、过滤类算法

算法名称

淘宝内容安全算法

算法基本原理

我们基于大量样本数据的分析,形成内容安全算法模型,依法对淘宝平台上发布的文本、图片、音频、视频等信息内容进行依法识别和处置,防范违反相关法律法规规定的淫秽、色情、赌博、暴力、恐怖、教唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信等信息,以及可能侵害他人隐私、知识产权等合法权益信息的发布和传播

算法运行机制

内容安全算法的运行过程包括数据源接入、算法识别、审核、处置决策等。我们对淘宝平台上发布的文本、图片、音频、视频等信息,通过深度学习、知识图谱推理、时序模型和融合模型等风险分类模型进行安全风险识别,形成不同的风险置信度分级,对于高置信度的信息由算法直接完成审核,对于低置信度的信息将引入人工审核,最后完成对违规信息的处置决策。

算法应用场景

淘宝平台上的商品评价、问答、论坛等信息发布相关的所有场景

算法目的意图

及时发现、处置违反法律、行政法规或违反社会公德、公序良俗的信息内容。

备案编号

网信算备330110872770705220027

 

4、生成合成类算法

算法名称

淘宝人生表情动作复刻算法

算法基本原理

淘宝平台“淘宝人生”表情动作复刻算法会基于用户主动提交的照片,识别照片中人物的表情和动作,基于深度学习技术,渲染出契合用户相关照片表情动作的虚拟形象。

算法运行机制

淘宝人生”虚拟形象使用3D人体重建深度学习的算法模型,对用户主动提交的照片进行姿态扭正,依据体态算法提取关键动作信息并通过反向动力学算法、重定向算法,来形成用户的淘宝人生形象图片。经过该算法生成后的图像上会打上“淘宝人生”的显著标识。

我们仅支持和处理用户自己的或用户已取得个人信息主体授权使用的照片,如我们发现用户拍摄或上传的内容违反法律、行政法规等有关规定,我们将依法及时采取拦截、消除等处置措施。

算法应用场景

淘宝平台设定“淘宝人生”表情动作虚拟形象

算法目的意图

提供淘宝平台“淘宝人生”虚拟形象服务

备案编号

网信算备330110872770701220015