大麦算法原理及信息处理情况说明
为依法保障用户对大麦算法推荐服务的基本原理、目的意图和主要运行机制的知情权,告知用户大麦提供的算法推荐服务情况,并保障用户的选择权,大麦服务提供者(或简称“我们”)制定本《大麦算法原理及信息处理情况说明》,帮助用户充分了解在使用大麦产品和服务的过程中我们如何通过利用生成合成类、个性化推送类、检索过滤类等算法技术向用户提供信息和服务,以便用户更好地作出选择。
一、适用范围
本说明适用于大麦服务提供者以网站、客户端、小程序以及随技术发展出现的新形态向您提供的各项产品和服务。
二、算法原理说明
1、个性化推送类算法
算法名称 | 大麦个性化推荐算法 |
算法基本原理 | 为向您展示商品或服务信息,我们会收集和使用您在访问或使用大麦应用程序时的浏览、搜索记录。我们会结合依法收集的设备信息、服务日志信息,以及其他取得您授权的信息,通过算法模型预测人群偏好特征。我们会基于人群偏好特征在大麦及其他第三方应用程序向相关人群推送可能感兴趣的商品展示、商业广告及其他信息,或者商业性短信息。 |
算法运行机制 | 大麦个性化推荐算法会基于模型预测人群偏好特征,匹配人群可能感兴趣的商品、服务或其他信息,对展示的商品、服务或其他信息进行排序。我们会根据用户使用产品过程中的浏览行为,对推荐模型进行实时反馈,不断调整优化推荐结果。为满足多元需求,我们会在排序过程中引入多样化推荐技术,拓展推荐的内容,利用打散、去重等机制避免同类型内容过度集中。如您想管理我们给您推送的个性化内容,您可以在“我的-设置-隐私设置-为你推荐”中进行设置;如您想关闭我们给您发送的商业性短信息,您可以在“我的-设置-消息推送”中进行设置。 |
算法应用场景 | 首页为你推荐、频道页精彩演出、商品详情页精彩演出 |
算法目的意图 | 向用户展示商品或服务信息 |
算法公示情况 |
2、检索类算法
算法名称 | 大麦搜索算法 |
算法基本原理 | 为向大麦平台用户展示附近的商品或服务信息,大麦搜索算法将针对用户授权收集的地理位置信息及搜索关键词,使用算法模型匹配、预测用户可能感兴趣的商品或服务信息,最终完成搜索结果的展示。 |
算法运行机制 | 在用户输入的搜索词后,我们将使用倒排召回及语义召回算法,根据搜索关键词特征、文档特征以及交叉特征对搜索词和文档的相关匹配程度进行预测打分,并结合内容文档的浏览转化数据、用户授权的位置信息、文本匹配度以及语义匹配度等对内容进行综合排序。同时,为满足用户多元需求,我们会在排序过程中引入多样性打散机制,拓展展示的内容,避免同类型内容过度集中。如您要删除您的搜索记录,可以在“搜索框-搜索历史”中选择删除。 |
算法应用场景 | 大麦首页主搜 |
算法目的意图 | 帮助用户快速找到想要的商品或信息 |
算法公示情况 |
3、过滤类算法
算法名称 | 大麦内容安全算法 |
算法基本原理 | 我们基于大量样本数据的分析,形成内容安全算法模型,依法对大麦平台上发布的文本、图片、音频、视频等信息内容进行依法识别和处置,防范违反相关法律法规规定的淫秽、色情、赌博、暴力、恐怖、教唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信等信息,以及可能侵害他人隐私、知识产权等合法权益信息的发布和传播。 |
算法运行机制 | 内容安全类算法的运行过程包括数据源接入、算法识别、审核、处置决策等。我们对大麦平台上发布的文本、图片、视频等信息,通过深度学习、知识图谱推理、时序模型和融合模型等风险分类模型进行安全风险识别,形成不同的风险置信度分级,对于高置信度的信息由算法直接完成审核,对于低置信度的信息将引入人工审核,最后完成对违规信息的处置决策。 |
算法应用场景 | 涉信息发布相关的所有场景,包括文本过滤、图片过滤、视频过滤 |
算法目的意图 | 及时发现、处置违反法律、行政法规或违反社会公德、公序良俗的信息内容 |
算法公示情况 |
4、生成合成类算法
算法名称 | 大麦小蜜智能客服算法 |
算法基本原理 | 大麦使用用户相关咨询内容,在进行去标签化处理后,经过深度学习,为用户提供智能问答对话、智能语音客服服务。 |
算法运行机制 | 用户通过客服进行咨询后,咨询的内容经过去标识化处理,在无法识别用户身份的情况下,大麦以问题为维度进行抽样,用于智能客服算法模型训练,用于不断提升用户体验。在用户接受智能客服服务期间,我们会对用户进行显著提示,基于智能客服使用情况,不断改进智能客服的服务质量。 |
算法应用场景 | 大麦小蜜智能客服 |
算法目的意图 | 较人工客服更高效、快捷的响应用户咨询 |
算法公示情况 |