UC浏览器算法原理及数据处理情况说明

为依法保障用户对算法推荐服务的基本原理、目的意图和主要运行机制的知情权和选择权，告知用户UC浏览器提供的算法推荐服务基本情况，UC浏览器服务提供者（或简称“我们”）特制定本《UC浏览器算法原理及数据处理情况说明》，帮助用户充分了解在使用UC浏览器产品或服务的过程中，了解我们如何通过利用生成合成类、个性化推送类、检索过滤类、排序精选类、调度决策类算法技术向用户提供信息或服务，充分保障用户合法权益。

一、适用范围

本说明适用于UC浏览器以网站、客户端、小程序等形式，向您提供的各项产品或服务。

二、算法原理说明

1. 检索类算法

算法名称	UC浏览器通用搜索引擎算法
算法基本原理	为向UC浏览器用户展示搜索结果信息，包括用户的历史搜索情况，UC浏览器会收集和使用用户在访问或使用UC浏览器的浏览、搜索记录，并结合依法收集的设备信息、服务日志信息，以及其他取得用户授权的信息，通过算法模型预测用户的搜索意图。UC浏览器会基于人群偏好特征在在UC搜索结果中向相关人群展示可能感兴趣的商业广告及其他信息。
算法运行机制	UC浏览器通用搜索引擎算法基于模型预测用户的搜索意图，匹配用户可能感兴趣的搜索结果信息，并搜索结果信息进行排序。我们会根据用户使用搜索服务过程中的浏览行为、通过提取公网网页的特征，并结合设备信息、服务日志信息，对排序模型进行实时反馈，不断调整优化检索排序结果。为满足用户的多元需求，我们会在排序过程中引入多样化排序技术，拓展推荐的内容，避免同类型内容过度集中。如用户要删除您的浏览和搜索记录，可以在“我的”“清除记录”中选择删除。
算法应用场景	UC浏览器首页搜索框等信息或服务的检索
算法目的意图	应用于搜索引擎，根据用户输入的查询词，搜索满足需求的网页
备案编号	网信算备440106203028804220013号

算法名称	UC浏览器热榜算法
算法基本原理	UC浏览器热榜榜单依据用户的搜索、点击和阅读等真实行为进行计算，综合结算UC浏览器平台内受到用户广泛关注的热点内容，形成实时榜单。
算法运行机制	UC浏览器热榜话题主要依赖用户的搜索、点击和互动行为，通过特定的算法计算产生，被大量用户搜索、点击、评论、转发、点赞的关键词，都可能成为热榜榜单的话题词。UC浏览器会综合用户的搜索频次、点击阅读量、评论/转发/点赞量等数据指标，进行加权求和和指标化处理，生成热榜榜单，榜单计算过程中会包含严格的防水军、反垃圾机制和违法不良信息过滤机制，以确保榜单计算结果客观。
算法应用场景	UC浏览器-头条-热榜
算法目的意图	为UC浏览器提供热门的资讯，提升用户发现信息资讯的效率。

2.个性化推荐类算法

算法名称	UC 信息流内容推荐算法
算法基本原理	为展示用户可能感兴趣的文字、图片、视频资讯，UC 浏览器会使用用户主动提交的用户属性信息，并结合依法采集的设备信息、服务日志信息，通过算法模型预测不同人群对信息资讯的偏好特征，并基于偏好特征向相关人群推送可能感兴趣的信息资讯。上述使用信息包括：1）用户属性信息：如用户提交的性别、阅读喜好标签；2）行为信息，如用户的浏览次数、点击、收藏、关注、转发等；3）设备信息：如设备型号、操作系统版本、设备设置、设备标识符、设备环境、应用列表、网络连接方式等。
算法运行机制	UC 浏览器会基于模型预测人群偏好特征，对不同的人群匹配、下发人群可能感兴趣的信息资讯。我们会根据用户使用产品过程中的浏览行为、反馈等，对推荐模型进行实时反馈，不断调整优化推荐结果。为满足多元需求，我们会在排序过程中引入多样化推荐技术，拓展推荐的内容，避免同类型内容过度集中。如用户不想看到 UC 浏览器信息流相关页面的资讯，可以通过点击资讯列表页的关闭按钮、点击资讯详情页的“不喜欢”选项向UC 浏览器进行反馈，或者进入视频资讯页面的举报投诉页面，根据页面提示选择用户不喜欢该信息资讯的原因。UC 浏览器在收到反馈后，会杜绝或减少该类资讯的推荐。如用户想管理推荐的个性化资讯，也可以在 UC 浏览器底部“我的-设置-隐私设置-个性化推荐”中进行设置。
算法应用场景	UC 浏览器信息资讯的展示
算法目的意图	向用户展示用户可能感兴趣的信息资讯
备案编号	网信算备440106203028802220011号

3. 过滤类算法

算法名称	UC 信息流内容安全算法
算法基本原理	UC 浏览器会通过对大量样本数据的分析，建立内容安全的算法模型，依法对 UC 信息流发布的文本、图片、音频、视频等信息内容，用户发布的评论、上传的小视频等内容进行风险识别和处置，防范违法违规信息、违反 UC 浏览器平台规则内容的发布和传播。这些信息包括：淫秽、色情、赌博、暴力、恐怖、教唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信以及可能侵害他人隐私或知识产权等合法权益的信息。
算法运行机制	UC浏览器内容安全算法的运行过程包括样本数据源采集和接入、特征库建立、审核、处置决策等。我们对UC浏览器网站平台上发布的文本、图片、音频、视频等信息，通过深度学习、统计学习、基于规则等风险分类模型进行内容安全风险识别，形成不同的风险置信度分级，对于高置信度的信息由算法直接完成审核，对于低置信度的信息将引入人工审核，最后完成对违规信息的处置决策。
算法应用场景	UC 信息资讯、用户评论等
算法目的意图	及时发现、处置违反法律、法规或违反社会公德、公序良俗或违反平台规则的信息内容
备案编号	网信算备440106203028805220019号

4. 过滤类算法

算法名称	UC风险文本及图像识别算法
算法基本原理	UC浏览器会通过对大量搜索样本数据的分析，建立搜索服务内容安全的算法模型，依法对搜索引擎所聚合、展示、链接、展示的网页文本标题、网页摘要、图片、音频、视频等内容，进行风险识别和处置，防范违法违规信息的发布和传播。这些违法违规信息可能包括：淫秽、色情、赌博、暴力、恐怖、教唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信以及可能侵害他人隐私或知识产权等合法权益的信息
算法运行机制	UC 风险文本及图像识别算法的运行过程包括样本数据源采集和接入、特征库建立、审核、处置决策等。我们对UC搜索服务聚合、链接的网页信息（包括但不限于文本标题、摘要等），会通过深度学习、统计学习、基于规则等风险分类模型进行内容安全风险识别，形成不同的风险置信度分级，对于高置信度的信息由算法直接完成审核，对于低置信度的信息将引入人工审核，最后完成对违规信息的处置决策。
算法应用场景	UC 浏览器搜索服务
算法目的意图	遵守法律法规规定，防范 UC 浏览器搜索服务出现违法违规不良有害信息
备案编号	网信算备440106203028805220027号

5. 生成合成类算法

算法名称	UC 小蜜智能客服算法
算法基本原理	UC 小蜜智能客服算法根据用户咨询内容，结合 UC 智能客服知识库，利用自然语言处理技术定位用户需要的知识，并给出对应的解决方案；在用户获得解决方案之后，利用对历史咨询数据的统计分析预估下一阶段可能咨询的问题，帮助用户更快速、便捷地解决问题。
算法运行机制	用户通过客服进行了相关咨询，咨询的内容，经过去标识化处理，在无法识别用户身份的情况下，UC 浏览器平台以问题为维度进行抽样，用于智能客服算法模型训练，用于不断提升用户体验。在用户接受智能客服服务期间，我们会对用户进行显著提示，基于智能客服使用情况，不断改进通知客服的服务质量。
算法应用场景	用于 UC 浏览器的客服中心
算法目的意图	为用户提供更智能、便捷的客诉解决方案
备案编号	网信算备440106203028801230019号