——————
天猫精灵平台算法原理及数据处理情况说明
发布日期:2022年11月11日
更新日期: 2023年10月20日
为依法保障用户对算法推荐服务的基本原理、目的意图和主要运行机制的知情权和选择权,告知用户天猫精灵平台提供的算法推荐服务基本情况,天猫精灵平台服务提供者(或简称“我们”)特制定本《天猫精灵平台算法原理及数据处理情况说明》,帮助用户充分了解在使用天猫精灵平台产品或服务的过程中,了解我们如何通过利用生成合成类、个性化推送类、内容过滤类、信息检索类算法技术向用户提供信息或服务,充分保障用户合法权益。
一、适用范围
本说明适用于天猫精灵平台以智能硬件设备、网站、客户端、小程序等形式,向您提供的各项产品或服务。
二、算法原理说明
1、个性化推送类算法
算法名称 | 天猫精灵内容推荐算法 |
算法基本原理 | 为向天猫精灵用户提供语音请求、带屏展示需求的内容推荐服务。推荐算法依据第三方内容库满足用户个性化推荐需求。需使用包括用户的访问足迹、历史搜索情况,我们会收集和使用用户在访问或使用天猫精灵及第三方内容库时的浏览、搜索、收听、观看记录特别是历史播放中“完播率”情况。根据三方内容在天猫精灵的播放次数、完播率等行为统计,我们会结合依法收集的设备信息、服务日志信息,以及其他取得用户授权的信息,通过算法模型预测人群偏好特征。我们会基于人群偏好特征在天猫精灵及其他第三方应用程序向相关人群推荐可能感兴趣的第三方内容及其他信息,或者商业性短信息。 |
算法运行机制 | 个性化推荐算法会基于模型预测人群偏好特征,匹配人群可能感兴趣的内容、服务或其他信息,对展示的内容、服务或其他信息进行排序。我们会根据用户使用产品过程中的浏览行为,对推荐模型进行实时反馈,不断调整优化推荐结果。为满足多元需求,我们会在排序过程中引入多样性打散机制,并设置“疲劳度”,拓展推送的内容,避免同类型内容过度集中或重复播放。 如用户想管理我们为其推荐的个性化内容,可以在“我的-设置-关于天猫精灵-个性化推荐设置”中关闭“个性化推荐设置” |
算法应用场景 | “未来精灵”品牌及“天猫精灵”品牌(本文中统称为“天猫精灵”)带屏设备首页、Tab页、锁屏、频道中的部分场景;无屏音箱(无屏幕)设备及音箱无需屏幕触控时的部分语音指令,如点歌等提供个性化内容供给。 |
算法目的意图 | 向用户展示感兴趣的内容或服务信息 |
备案编号 | 待公示 |
2、内容安全算法
算法名称 | 天猫精灵内容安全算法 |
算法基本原理 | 我们基于大量样本数据的分析,形成内容安全算法模型,依法对天猫精灵平台上发布的文本、图片、音频、视频等信息内容进行识别和处置,防范违反相关法律法规规定的淫秽、色情、赌博、暴力、恐怖、教唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信等信息,以及可能侵害他人隐私、知识产权等合法权益的信息的发布和传播。 |
算法运行机制 | 内容安全算法的运行过程包括数据源接入、算法识别、审核、处置决策等。我们对天猫精灵平台上文本、图片、音频、视频等信息,通过深度学习、知识图谱推理、时序模型和融合模型等风险分类模型进行安全风险识别,形成不同的风险置信度分级,对于高置信度的信息由算法直接完成审核,对于低置信度的信息将引入人工审核,最后完成对违规信息的处置决策。 |
算法应用场景 | 天猫精灵平台上的语音互动、语音播报、商品、评价、问答、论坛等信息发布相关的所有场景 |
算法目的意图 | 及时发现、处置违反法律、行政法规或违反社会公德、公序良俗的信息内容。 |
备案编号 | 待公示 |
3、生成合成类算法
算法名称 | 天猫精灵生成合成算法 |
算法基本原理 | 基于符合规范的训练数据,使用深度学习方法训练模型学习文本到文本、文本到语音的对应关系,形成聊天机器人、语音合成等人机交互服务的算法能力。 |
算法运行机制 | 输入用户请求文本、输出应答反馈文本,具备上下文记忆能力聊天对话机器人。输入文本将文本合成为反馈语音输出。根据用户实际请求产生的应答文本(聊天反馈文本、任务执行结果反馈文本等)作为输入,并返回对应的应答音频作为输出。 |
算法应用场景 | 天猫精灵设备AI聊天服务 |
算法目的意图 | 形成准确的人机交互,执行用户指令 |
备案编号 | 待公示 |
4、信息检索类算法
算法名称 | 天猫精灵搜索算法 |
算法基本原理 | 内容点播(音乐、视频)是天猫精灵高频场景,算法根据用户输入的指令请求(比如我要看XXX),从“资源内容库”(内容多来自于第三方服务、内容本身存储于第三方服务器)中使用文本相似度匹配算法检索出最为匹配的资源呈现给用户。 |
算法运行机制 | 通过语音识别、文字输入等接收用户指令,针对指令进行初步分析,确定应请求的服务领域。进行自然语言理解,对文本指令进行意图和槽位抽取,意图指用户发起请求的目的是什么,槽位指的是实体识别,把人名、地名、歌曲名、视频名等抽取出来,进行理解,并通过关键词召回等方法不断优化提高内容呈现准确率。 |
算法应用场景 | 用户在天猫精灵平台搜索音视频、应用并进行播放或打开。 |
算法目的意图 | 提供搜索及结果呈现服务 |
备案编号 | 待公示 |