UC浏览器算法原理及数据处理情况说明
为依法保障用户对算法推荐服务的基本原理、目的意图和主要运行机制的知情权和选择权,告知用户UC浏览器提供的算法推荐服务基本情况,UC浏览器服务提供者(或简称“我们”)特制定本《UC浏览器算法原理及数据处理情况说明》,帮助用户充分了解在使用UC浏览器产品或服务的过程中,了解我们如何通过利用生成合成类、个性化推送类、检索过滤类、排序精选类、调度决策类算法技术向用户提供信息或服务,充分保障用户合法权益。
一、适用范围
本说明适用于UC浏览器以网站、客户端、小程序等形式,向您提供的各项产品或服务。
二、算法原理说明
1. 检索类算法
算法名称 | UC浏览器通用搜索引擎算法 |
算法基本原理 | 为向UC浏览器用户展示搜索结果信息,包括用户的历史搜索情况,UC浏览器会收集和使用用户在访问或使用UC浏览器的浏览、搜索记录,并结合依法收集的设备信息、服务日志信息,以及其他取得用户授权的信息,通过算法模型预测用户的搜索意图。UC浏览器会基于人群偏好特征在在UC搜索结果中向相关人群展示可能感兴趣的商业广告及其他信息。 |
算法运行机制 | UC浏览器通用搜索引擎算法基于模型预测用户的搜索意图,匹配用户可能感兴趣的搜索结果信息,并搜索结果信息进行排序。我们会根据用户使用搜索服务过程中的浏览行为、通过提取公网网页的特征,并结合设备信息、服务日志信息,对排序模型进行实时反馈,不断调整优化检索排序结果。为满足用户的多元需求,我们会在排序过程中引入多样化排序技术,拓展推荐的内容,避免同类型内容过度集中。如用户要删除您的浏览和搜索记录,可以在“我的”“清除记录”中选择删除。 |
算法应用场景 | UC浏览器首页搜索框等信息或服务的检索 |
算法目的意图 | 应用于搜索引擎,根据用户输入的查询词,搜索满足需求的网页 |
备案编号 |
算法名称 | UC浏览器热榜算法 |
算法基本原理 | UC浏览器热榜榜单依据用户的搜索、点击和阅读等真实行为进行计算,综合结算UC浏览器平台内受到用户广泛关注的热点内容,形成实时榜单。 |
算法运行机制 | UC浏览器热榜话题主要依赖用户的搜索、点击和互动行为,通过特定的算法计算产生,被大量用户搜索、点击、评论、转发、点赞的关键词,都可能成为热榜榜单的话题词。UC浏览器会综合用户的搜索频次、点击阅读量、评论/转发/点赞量等数据指标,进行加权求和和指标化处理,生成热榜榜单,榜单计算过程中会包含严格的防水军、反垃圾机制和违法不良信息过滤机制,以确保榜单计算结果客观。 |
算法应用场景 | UC浏览器-头条-热榜 |
算法目的意图 | 为UC浏览器提供热门的资讯,提升用户发现信息资讯的效率。 |
2.个性化推荐类算法
算法名称 | UC 信息流内容推荐算法 |
算法基本原理 | 为展示用户可能感兴趣的文字、图片、视频资讯,UC 浏览器会 使用用户主动提交的用户属性信息,并结合依法采集的设备信 息、服务日志信息,通过算法模型预测不同人群对信息资讯的 偏好特征,并基于偏好特征向相关人群推送可能感兴趣的信息 资讯。上述使用信息包括:1)用户属性信息:如用户提交的性 别、阅读喜好标签;2)行为信息,如用户的浏览次数、点击、 收藏、关注、转发等;3)设备信息:如设备型号、操作系统版 本、设备设置、设备标识符、设备环境、应用列表、网络连接 方式等。 |
算法运行机制 | UC 浏览器会基于模型预测人群偏好特征,对不同的人群匹配、 下发人群可能感兴趣的信息资讯。我们会根据用户使用产品过程 中的浏览行为、反馈等,对推荐模型进行实时反馈,不断调整优 化推荐结果。为满足多元需求,我们会在排序过程中引入多样化 推荐技术,拓展推荐的内容,避免同类型内容过度集中。如用户不想看到 UC 浏览器信息流相关页面的资讯,可以通过点击资讯列表页的关闭按钮、点击资讯详情页的“不喜欢”选项向UC 浏览器进行反馈,或者进入视频资讯页面的举报投诉页面,根据页面提示选择用户不喜欢该信息资讯的原因。UC 浏览器在收到反馈后,会杜绝或减少该类资讯的推荐。如用户想管理推荐的个性化资讯,也可以在 UC 浏览器底部“我的-设置-隐私设置-个性化推荐”中进行设置。 |
算法应用场景 | UC 浏览器信息资讯的展示 |
算法目的意图 | 向用户展示用户可能感兴趣的信息资讯 |
备案编号 |
3. 过滤类算法
算法名称 | UC 信息流内容安全算法 |
算法基本原理 | UC 浏览器会通过对大量样本数据的分析,建立内容安全的算法 模型,依法对 UC 信息流发布的文本、图片、音频、视频等信息 内容,用户发布的评论、上传的小视频等内容进行风险识别和 处置,防范违法违规信息、违反 UC 浏览器平台规则内容的发布 和传播。这些信息包括:淫秽、色情、赌博、暴力、恐怖、教 唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信以及可能 侵害他人隐私或知识产权等合法权益的信息。 |
算法运行机制 | UC浏览器内容安全算法的运行过程包括样本数据源采集和接入、特征库建立、审核、处置决策等。我们对UC浏览器网站平台上发布的文本、图片、音频、视频等信息,通过深度学习、统计学习、基于规则等风险分类模型进行内容安全风险识别,形成不同的风险置信度分级,对于高置信度的信息由算法直接完成审核,对于低置信度的信息将引入人工审核,最后完成对违规信息的处置决策。 |
算法应用场景 | UC 信息资讯、用户评论等 |
算法目的意图 | 及时发现、处置违反法律、法规或违反社会公德、公序良俗或 违反平台规则的信息内容 |
备案编号 |
4. 过滤类算法
算法名称 | UC风险文本及图像识别算法 |
算法基本原理 | UC浏览器会通过对大量搜索样本数据的分析,建立搜索服务内 容安全的算法模型,依法对搜索引擎所聚合、展示、链接、展 示的网页文本标题、网页摘要、图片、音频、视频等内容,进 行风险识别和处置,防范违法违规信息的发布和传播。这些违 法违规信息可能包括:淫秽、色情、赌博、暴力、恐怖、教唆 犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信以及可能侵 害他人隐私或知识产权等合法权益的信息 |
算法运行机制 | UC 风险文本及图像识别算法的运行过程包括样本数据源采集和 接入、特征库建立、审核、处置决策等。我们对UC搜索服务聚 合、链接的网页信息(包括但不限于文本标题、摘要等),会 通过深度学习、统计学习、基于规则等风险分类模型进行内容 安全风险识别,形成不同的风险置信度分级,对于高置信度的 信息由算法直接完成审核,对于低置信度的信息将引入人工审 核,最后完成对违规信息的处置决策。 |
算法应用场景 | UC 浏览器搜索服务 |
算法目的意图 | 遵守法律法规规定,防范 UC 浏览器搜索服务出现违法违规不良有害信息 |
备案编号 |
5. 生成合成类算法
算法名称 | UC 小蜜智能客服算法 |
算法基本原理 | UC 小蜜智能客服算法根据用户咨询内容,结合 UC 智能客服知识 库,利用自然语言处理技术定位用户需要的知识,并给出对应的 解决方案;在用户获得解决方案之后,利用对历史咨询数据的统 计分析预估下一阶段可能咨询的问题,帮助用户更快速、便捷地 解决问题。 |
算法运行机制 | 用户通过客服进行了相关咨询,咨询的内容,经过去标识化处理, 在无法识别用户身份的情况下,UC 浏览器平台以问题为维度进行 抽样,用于智能客服算法模型训练,用于不断提升用户体验。 在 用户接受智能客服服务期间,我们会对用户进行显著提示,基于 智能客服使用情况,不断改进通知客服的服务质量。 |
算法应用场景 | 用于 UC 浏览器的客服中心 |
算法目的意图 | 为用户提供更智能、便捷的客诉解决方案 |
备案编号 |