飞猪平台算法原理及数据处理情况说明
为依法保障用户对算法推荐服务的基本原理、目的意图和主要运行机制的知情权和选择权,告知用户飞猪平台提供的算法推荐服务基本情况,飞猪平台的网络及软件技术服务提供者(或简称“飞猪”、“我们”)特制定本《飞猪平台算法原理及数据处理情况说明》,帮助用户充分了解在使用飞猪平台产品或服务的过程中,了解我们如何通过检索过滤类、个性化推送类和生成合成类算法技术向用户提供信息或服务,便于用户更好地做出选择,并充分保障用户合法权益。
一、适用范围
本说明适用于飞猪平台以网站、客户端、小程序等形式,向您提供的各项产品或服务。
二、算法原理说明
1、检索过滤类算法
算法名称 | 飞猪内容安全算法 |
算法基本原理 | 我们基于大量样本数据的分析,形成内容安全算法模型,依法对飞猪平台上发布的文本、图片、音频、视频等信息内容进行识别和处置,防范违反相关法律法规规定的淫秽、色情、赌博、暴力、恐怖、教唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信等信息,以及可能侵害他人隐私、知识产权等合法权益的信息的发布和传播。 |
算法运行机制 | 内容安全算法的运行过程包括数据源接入、算法识别、审核、处置决策等。我们对飞猪平台上文本、图片、音频、视频等信息,通过深度学习、知识图谱推理、时序模型和融合模型等风险分类模型进行安全风险识别,形成不同的风险置信度分级,对于高置信度的信息由算法直接完成审核,对于低置信度的信息将引入人工审核,最后完成对违规信息的处置决策。 |
算法应用场景 | 飞猪平台上的商品、评价、问答等信息发布相关的所有场景 |
算法目的意图 | 及时发现、处置违反法律、行政法规或违反社会公德、公序良俗的信息内容。 |
备案编号 | 网信算备330110863392905220013号 |
2、个性化推送类算法
算法名称 | 飞猪个性化推荐算法 |
算法基本原理 | 为向您展示商品或服务信息,包括您的访问足迹、历史搜索情况,我们会收集和使用您在访问或使用飞猪网站或客户端时的浏览、搜索记录。我们会结合依法收集的设备信息、服务日志信息,以及其他取得您授权的信息,通过算法模型预测人群偏好特征。我们会基于人群偏好特征在飞猪网站或客户端向相关人群推送可能感兴趣的商业广告及其他信息、或者商业性短信息。 |
算法运行机制 | 个性化推荐算法会基于模型预测人群偏好特征,匹配人群可能感兴趣的商品、服务或其他信息,对展示的商品、服务或其他信息进行排序。我们会根据用户使用产品过程中的浏览行为,对推荐模型进行实时反馈,不断调整优化推荐结果。为满足多元需求,我们会在排序过程中引入多样化推荐技术,拓展推荐的内容,避免同类型内容过度集中。 如您不想看到我们在首页给您推荐的商品或服务,您可以通过长按首页猜你喜欢部分商品或服务图片,在随后出现的弹窗中根据提示选择屏蔽商品或同类商品; 如您想管理我们给您发送的个性化广告,您可以在“我的-设置-隐私”中进行设置; 如您想管理我们给您推送的个性化内容,您可以在“我的-设置-隐私”中进行设置。 |
算法应用场景 | 飞猪平台首页猜你喜欢、支付完成页面等的商品或服务信息展示 |
算法目的意图 | 向用户展示商品或服务信息 |
备案编号 | 网信算备330110863392902230019号 |
3、 检索过滤类算法
算法名称 | 飞猪个性化检索算法 |
算法基本原理 | 为向飞猪网站或客户端用户展示更契合检索意图的商品或服务信息,检索类算法将针对用户输入的检索词,使用算法模型预测、匹配其相关可能感兴趣的商品或服务信息,最终完成检索结果的展示。 |
算法运行机制 | 在用户输入检索词后,我们将使用文本匹配的倒排索引和基于神经网络的向量匹配召回算法,根据搜索关键词特征、商品特征、用户在飞猪的使用情况等对商品和服务进行召回,并结合相关性模型保障结果页展现的商品结果与搜索的关键词相关。同时,为满足用户多元需求,我们会在排序过程中引入多样性打散机制,拓展展示的内容,避免同类型内容过度集中。 用户在使用我们提供的站内搜索服务时,需要查看不针对其个人特征的排序,可以在搜索结果页面点击“筛选”,选择其中的“销量”“价格”“通用排序”进行设置等。 |
算法应用场景 | 飞猪平台首页搜索框等商品或服务的检索 |
算法目的意图 | 帮助用户快速找到想要的商品或信息 |
备案编号 | 网信算备330110863392904230011号 |
4、生成合成类(深度合成)算法
算法名称 | 飞猪商家在线智能客服算法 |
算法基本原理 | 当消费者向平台内经营者(以下简称“商家”)在线发起咨询时,根据消费者的询问内容和商家的业务类型(例如交通票务、住宿预订、旅游度假和签证申请等),结合飞猪知识库,通过算法模型断识别和理解用户意图,生成回复内容文本,和消费者进行多轮交互对话,从而帮助商家快速地响应消费者提出的简单高频问题。 |
算法运行机制 | 将消费者向客服咨询的内容实施去标识化处理,在无法识别消费者身份的前提下,从问题维度对该类内容进行抽样并投入算法模型训练,不断优化算法模型的效果。在“飞猪商家在线智能客服”中,通过部署已训练的算法模型(Qwen-7B-Base V1.0.4)识别和理解消费者意图、生成回复文本等,帮助商家快速响应消费者的咨询和诉求。接入内容安全和敏感个人信息识别过滤,及时拦截违规内容或个人可识别信息。同时,在消费者使用“飞猪商家智能在线客服”时,我们会显著提示消费者该服务并非人工客服,并在消费者问题无法解决时,切换至商家人工客服。 |
算法应用场景 | 当消费者向商家发起在线会话时,帮助商家快速响应消费者的咨询和诉求。 |
算法目的意图 | 较人工客服更高效、快捷地响应消费者的咨询和诉求,帮助商家改善消费者体验、缓解服务压力。 |
备案编号 | 网信算备330110863392901240017号 |