天猫平台算法原理及数据处理情况说明

为依法保障用户对天猫平台算法推荐服务的基本原理、目的意图和主要运行机制的知情权和选择权,告知用户天猫平台提供的算法推荐服务基本情况,天猫平台服务提供者(或简称我们)制定本《天猫平台算法原理及数据处理情况说明》,帮助用户充分了解在使用天猫平台产品和服务的过程中,了解我们如何通过利用生成合成类、个性化推送类、检索过滤类、排序精选类、调度决策类等算法技术向用户提供信息和服务,充分保障用户合法权益。


一、适用范围

本说明适用于天猫平台服务提供者以网站、客户端、小程序以及随技术发展出现的新形态向您提供的各项产品和服务。

二、算法原理说明

1、精选排序类算法

算法名称

排序精选类算法

算法基本原理

手机天猫使用了商品点击、加购、销量数据,按照不同的商品类目/属性,使用商品的客观数据排序以及对客观数据加权平均,来对商品进行排序

算法运行机制

手机天猫排行数据是按照通过小时/天级别,根据手机天猫用户平台上商品点击、加购、销量等客观数据进行统计,同时相应商品类目/属性进行汇总,然后对客观数据进行排序或者对客观数据加权平均排序


算法应用场景

手机天猫APP首页的“排行”页面

算法目的意图

希望通过平台客观的排行数据,帮助客户做购买决策

备案编号

网信算备330110046572903220011号

2、过滤类算法

算法名称

手机天猫内容安全类算法

算法基本原理

我们基于大量样本数据的分析,形成内容安全算法模型,依法对手机天猫平台上发布的文本、图片、音频、视频等信息内容进行依法识别和处置,防范违反相关法律法规规定的淫秽、色情、赌博、暴力、恐怖、教唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信等信息,以及可能侵害他人隐私、知识产权等合法权益信息的发布和传播。

算法运行机制

内容安全类算法的运行过程包括数据源接入、算法识别、审核、处置决策等。我们对手机天猫上发布的文本、图片、音频、视频等信息,通过深度学习、知识图谱推理、时序模型和融合模型等风险分类模型进行安全风险识别,形成不同的风险置信度分级,对于高置信度的信息由算法直接完成审核,对于低置信度的信息将引入人工审核,最后完成对违规信息的处置决策。

算法应用场景

手机天猫上的商品、用户评价、圈子等信息发布相关的所有场景

算法目的意图

及时发现、处置违反法律、行政法规或违反社会公德、公序良俗的信息内容

备案编号

网信算备330110046572905220013号

3、检索类算法

算法名称

天猫图搜算法

算法基本原理

为向手机天猫用户展示更契合搜索意图的商品或服务信息,天猫图搜算法将针对用户拍照输入的检索图片,使用算法模型预测、匹配相关可能感兴趣的商品或服务信息,最终完成搜索结果的展示

算法运行机制

在用户拍照输入检索图后,我们将使用基于神经网络的向量匹配召回算法,根据检索图特征、商品特征、用户在手机天猫的使用情况等对商品进行召回,并结合相关性模型保障结果页展现的商品结果与搜索的检索图相关。同时,为满足用户多元需求,我们会在排序过程中引入多样化推荐技术多样性打散机制,拓展展示的内容,避免同类型内容过度集中。

如用户在使用我们提供的站内搜索服务时,需要查看不针对其个人特征的排序,可以在搜索结果页面选择“销量”、“价格”等排序方案。

算法应用场景

手机天猫入口页的搜索等商品或服务的检索

算法目的意图

帮助用户快速找到想要的商品或信息

备案编号

网信算备330110046572904220017号


算法名称

天猫搜索算法

算法基本原理

为向手机天猫用户展示更契合搜索意图的商品或服务信息,天猫搜索算法将针对用户输入的搜索词,使用算法模型预测、匹配相关可能感兴趣的商品或服务信息,最终完成搜索结果的展示

算法运行机制

在用户输入的搜索词后,我们将使用文本匹配的倒排索引和基于神经网络的向量匹配召回算法,根据搜索关键词特征、商品特征、用户在手机天猫的使用情况等对商品和服务进行召回,并结合相关性模型保障结果页展现的商品结果与搜索的关键词相关。同时,为满足用户多元需求,我们会在排序过程中引入多样化推荐技术多样性打散机制,拓展展示的内容,避免同类型内容过度集中。

如用户在使用我们提供的站内搜索服务时,需要查看不针对其个人特征的排序,可以在搜索结果页面点击“筛选”,选择其中的“销量”、“价格”、“店铺”进行设置。

算法应用场景

手机天猫首页搜索框等商品或服务的检索

算法目的意图

帮助用户快速找到想要的商品或信息

备案编号

网信算备330110046572904220025号

4.个性化推送类算法

算法名称

手机天猫推荐算法

算法基本原理

为向手机天猫用户展示商品或服务信息,包括用户的访问足迹、历史搜索情况,我们会收集和使用您在访问或使用手机天猫时的浏览、搜索记录。我们会结合依法收集的设备信息、服务日志信息,以及其他取得用户授权的信息,通过算法模型预测人群的偏好特征我们会基于人群偏好特征在天猫及其他第三方应用程序向相关人群推送可能感兴趣的商业广告及其他信息,或者商业性短信息。

算法运行机制

个性化推荐类算法会基于模型预测人群偏好特征,匹配人群可能感兴趣的商品、服务或其他信息,对展示的商品、服务或其他信息进行排序。我们会根据用户使用产品过程中的浏览行为,对推荐模型进行实时反馈,不断调整优化推荐结果。为满足多元需求,我们会在排序过程中引入多样性打散机制,拓展推荐的内容,避免同类型内容过度集中。

如用户不想看到我们在首页或支付完成页面等推荐的商品或服务,用户可以通过长按被推荐的商品或服务图片,在随后出现的弹窗中根据提示选择屏蔽类似商品或者商品或服务所属的类目;如用户想管理我们为其推送的个性化内容,可以在“我的-设置-隐私设置”中进行设置。

算法应用场景

手机天猫首页、支付完成页面等的商品或服务信息展示

算法目的意图

向用户展示商品或服务信息

备案编号

网信算备330110046572902220015号


算法名称

天猫push算法

算法基本原理

为向手机天猫用户展示商品或服务信息,我们会收集和使用您在访问或使用手机天猫时的浏览、搜索记录。我们会结合依法收集的设备信息、服务日志信息,以及其他取得用户授权的信息,通过算法模型预测人群的偏好特征我们会基于人群偏好特征在天猫及其他第三方应用程序向相关人群推送可能感兴趣的商业广告及其他信息,或者商业性短信息。

算法运行机制

天猫push算法会基于模型预测人群偏好特征,匹配人群可能感兴趣的商品、服务或其他信息。我们会根据用户使用产品过程中的浏览行为,对推荐模型进行实时反馈,不断调整优化推荐结果。为满足多元需求,我们会引入多样性打散机制,拓展推荐的内容,避免同类型内容过度集中。

如用户不想看到我们通过桌面push推荐的商品或服务,用户可以通过在“我-设置-消息提醒设置”中进行设置。

算法应用场景

手机天猫端外桌面push的商品或服务信息展示

算法目的意图

向用户展示商品或服务信息

备案编号

网信算备330110046572902220023号

5、生成合成类算法

算法名称

天猫小蜜智能客服

算法基本原理

手机天猫使用用户相关咨询内容,在进行去标签化处理后,经过深度学习,为用户提供智能问答对话、智能语音客服服务。

算法运行机制

用户通过客服进行了相关咨询,咨询的内容,经过去标识化处理,在无法识别用户身份的情况下,手机天猫以问题为维度进行抽样,用于智能客服算法模型训练,用于不断提升用户体验。在用户接受智能客服服务期间,我们会对用户进行显著提示,基于智能客服使用情况,不断改进智能客服的服务质量。

算法应用场景

天猫小蜜智能客服

算法目的意图

较人工客服更高效、快捷的响应用户咨询

备案编号

网信算备330110046572901220019号


6、深度合成服务


算法名称

天猫对话生成算法

算法基本原理

天猫对话生成算法通过交互式对话方式,为用户提供购物搜索、信息内容服务等,最终提升电商平台购物体验。对话生成算法使用了基于自然语言处理技术的对话生成模型,它通过大量的数据训练模型来模拟人类的语言交互能力,实现在各种对话场景下的聊天对话。算法在线应用时,会使用用户实时输入的文本数据,在安全过滤的基础上,结合对话场景等向用户生成准确、得体的文本回复,部分场景下还会展示商品图片信息。 

算法运行机制

对话生成算法使用Transformer神经网络架构,以预训练和微调技术为核心。在用户输入问题后,将依据意图分类模型识别出意图类型,生成符合用户消费习惯、搜索目的的文本。天猫对话生成算法的训练数据来源于天猫平台合法取得的数据。在此过程中,我们会通过安全过滤模型分别对输入、输入-输出进行风险检测。如我们发现用户输入的内容违反法律、行政法规等有关规定,我们将依法及时采取拦截、消除等处置措施。此类服务在用户选择特定功能或服务后启用,如用户不需要此类服务,可通过我们提供的指引自行关闭。 

算法应用场景

天猫平台首页、购物车、客服页面、商品页面等的商品或信息内容展示,如智能导购、智能客服、智能问答等。 

算法目的意图

向用户展示商品信息、提供信息内容服务,提高电商平台信息服务的趣味性。 

备案编号

网信算备330110046572901230021号