淘宝闪购平台算法原理及信息处理情况说明

淘宝闪购平台算法原理及信息处理情况说明

为依法保障用户对算法推荐服务的基本原理、目的意图和主要运行机制的知情权和选择权，告知用户淘宝闪购平台提供的算法推荐服务基本情况，淘宝闪购平台服务提供者（或简称“我们”）特制定本《淘宝闪购平台算法原理及信息处理情况说明》，帮助用户充分了解在使用淘宝闪购平台产品或服务的过程中，了解我们如何通过利用个性化推送类、检索过滤类等算法技术向用户提供信息或服务，以便用户更好的做出选择。

一、适用范围

本说明适用于淘宝闪购平台以网站、客户端、小程序等形式，向您提供的各项产品或服务。

二、算法原理说明

1、个性化推送类算法

算法名称	淘宝闪购个性化推荐算法
算法基本原理	算法主要包括召回、粗排、精排、重排、多样性打散等几部分。召回&粗排模型使用dnn双塔模型刻画用户向量特征，取回用户可能感兴趣的商户；精排使用大型dnn模型精准刻画用户的兴趣和需求；重排模型在top店铺中寻找最优排序序列；为了保证展现给用户的店铺的多样性，最后进行打散操作。
算法运行机制	用户进入app发起推荐请求后，先取回用户画像特征，根据用户画像特征生成用户特征向量，然后使用该向量召回用户可能感兴趣的店铺并进行粗排序；对召回的店铺进行精排，精准刻画用户的兴趣和需求；然后使用重排模型，在top店铺中寻找最优排序序列；最后，为了保证展现给用户的店铺的多样性，会进行打散操作。
算法应用场景	淘宝闪购商品、店铺推荐
算法目的意图	算法目的意图是提升点击率、转换率。通过展示用户感兴趣的店铺和商品，降低用户搜索时间，有效提升用户使用效率，提高用户满意度；长尾商户匹配用户的多样化需求，避免商家的马太效应。
备案编号	网信算备310107429160602220019号

2、检索过滤类算法

算法名称	淘宝闪购搜索算法
算法基本原理	通过用户输入的query文本信息，组合用户画像特征、商户商品离线特征，query文本特征扩展信息及统计用户、商户、商品及query历史行为，作为底层特征输入，首先通过神经网络进行召回，然后再次通过神经网络模型结合更细粒度的特征进行排序操作，最终拟合出搜索词下商品的相关性分数，并输出top商品、店铺。
算法运行机制	用户进入app首页输入query文本信息后，通过对文本信息进行搜索纠错处理（通用纠错、商户/品牌纠错等），然后进行意图识别（商品类目意图、商户类目意图、搜索词性类目），通过搜索召回模块召回符合本地服务宗旨、满足时效性及可配送范围、满足用户检索诉求的相关商户和商品，通过对召回的商户、商家进行排序操作（深度学习模型、相关性建模等）,在排序结果的接触上引入打散、去重机制，最终输出与用户最相关的top商品和商户。
算法应用场景	淘宝闪购商品及店铺搜索
算法目的意图	1.帮助用户进行信息筛选，满足用户对商品的诉求。 2.帮助商户找到自己的潜在人群。
备案编号	网信算备310107429160604220011号

3、生成合成类算法

算法名称	淘宝闪购用户对话导购算法
算法基本原理	在导购场景下，用户输入问题，平台基于该信息并结合用户位置信息及过往的偏好信息，进行意图理解返回用户感兴趣的内容知识，并提供具体商品的搜索列表。
算法运行机制	用户可以进入用户对话导购场景；基于用户输入的导购问题，大模型理解用户的导购意图，生成并提供后续链路所需的条件特征；基于上述条件特征，结合用户个性化标签、地理位置和内部业务物料，大模型生成餐饮知识类回复和具体店铺/商品的搜索列表。最后，对整体内容进行风控过滤，触达至用户。
算法应用场景	外卖导购场景
算法目的意图	帮助淘宝闪购用户获取饿了么相关的知识，并高效点餐
备案编号	网信算备310107429160601240011号

算法名称	淘宝闪购智能客服
算法基本原理	根据用户在线咨询的内容，通过算法进行多轮追问交互以识别用户的真实意图，并通过搜索、匹配、过滤等操作，输出基于知识库的标准答案。
算法运行机制	我们使用大语言算法模型，根据用户输入的客服咨询文本进行多轮对话交互，以确定用户真正的意图，并将其与知识库中的知识进行匹配，执行内部的配置流程，最终输出给对应的问题答案。用户如果对答案不满意可以转入人工客服继续咨询。用户咨询内容经去标识化处理，且无法识别用户身份的情况下，可能用于智能客服算法模型训练，用于不断提升服务体验。
算法应用场景	用户、商户和骑手在线咨询客服时，提供智能客服服务
算法目的意图	更高效、快捷地响应用户咨询，提升饿了么客服服务能力，提升用户体验。
备案编号	网信算备310107429160601250031号

算法名称	淘宝闪购AI找药算法
算法基本原理	1.根据用户核心用药需求，获取用户症状提供细节，细节包括判断用户的就医情况、过往体检信息、过往使用药品情况、症状部位、症状持续时间、症状严重程度问题的收集，通过 AI 主动追问能力，将问题收集完整。 2.系统根据症状-疾病-药品匹配度的关系，给出合理用药建议。 3.面向用户医学问题生成内容，在健康知识、药物咨询等方面提供非诊断类咨询服务内容。 4.医学预训练大模型是在阿里云Qwen2-72B-Instruct 的通用大模型基础上，使用海量医学文本数据开展继续预训练和指令增强训练所得。Qwen2-72B-Instruct的基础网络架构为 Transformer，训练框架为 MegatronLM。在医学预训练大模型基础上，根据算法任务类型和任务训练数据，继续使用大模型微调训练方法得到了意图分类、回复生成的大模型。 4.1 意图分类大模型的作用是识别用户的场景诉求，输入是用户对问题的描述文本，输出是意图标签文本； 4.2 回复生成大模型的作用是回复用户问题的答案文本，输入是用户问题和知识点，输出是问题的答案，输出症状-疾病-药品关系的最终结果，给出最终用药建议。在这过程中使用知识检索增强的能力，基于用户问题找到相关医学知识。如上过程结合输入输出端的干预算法策略共同组成了饿了么生成式算法，其中干预算法的相关风险控制方法是负责安全风险全面防控。
算法运行机制	基于生成式人工智能大模型基座，采用医药领域语料进行补充训练和微调、对齐，输入和输出端设置安全风险拦截机制，实现为用户提供非诊断类医学咨询服务内容。 1.数据预处理：输入数据包括医学书籍、指南、专家共识、文献、药品说明书、中国药典等。对数据进行人工加算法的清洗、标注和标准化处理，以适应算法模型的要求。 2.模型训练：在阿里云通义千问 Qwen2-72B-Instruct 的通用大模型基础上利用大规模医疗领域的数据进行继续训练，并通过大量的医疗任务，如实体识别、关系抽取、疾病分类、辅助诊断等，开展模型的微调，并在使用过程中通过专家反馈来进一步与专家对齐，形成医学大模型。 3.文本生成：该算法为生成式模型，根据用户输入的文本内容，自动识别用户的指令及意图，通过知识增强来降低模型的幻觉，提高准确性。 4.专业医学评测：通过专业医学人工以及算法自动评价模型，搭建专业垂直的评测数据集，包含客观题和主观题。通过反复评测迭代，不断提升模型的准确性。 5.用户反馈与迭代：收集用户反馈，了解算法在实际应用中的表现和需求。根据反馈进行模型迭代，不断优化以满足需求。
算法应用场景	在线健康问答方式，向用户提供非诊疗类健康咨询问题的在线交流服务，建议科学合理用药建议。
算法目的意图	利用医学内容生成式算法，就用户提出的健康问题生成回答，在健康知识、药物咨询、指标解读等方面提供非诊断类咨询服务内容。
备案编号	网信算备310107429160601250049号