UC浏览器算法原理及数据处理情况说明
为依法保障用户对算法推荐服务的基本原理、目的意图和主要运行机制的知情权和选择权,告知用户UC浏览器提供的算法推荐服务基本情况,UC浏览器服务提供者(或简称“我们”)特制定本《UC浏览器算法原理及数据处理情况说明》,帮助用户充分了解在使用UC浏览器产品或服务的过程中,了解我们如何通过利用生成合成类、个性化推送类、检索过滤类、排序精选类、调度决策类算法技术向用户提供信息或服务,充分保障用户合法权益。
一、适用范围
本说明适用于UC浏览器以网站、客户端、小程序等形式,向您提供的各项产品或服务。
二、算法原理说明
1. 检索类算法
算法名称
UC浏览器通用搜索引擎算法
算法基本原理
为向UC浏览器用户展示搜索结果信息,包括用户的历史搜索情况,UC浏览器会收集和使用用户在访问或使用UC浏览器的浏览、搜索记录,并结合依法收集的设备信息、服务日志信息,以及其他取得用户授权的信息,通过算法模型预测用户的搜索意图。UC浏览器会基于人群偏好特征在在UC搜索结果中向相关人群展示可能感兴趣的商业广告及其他信息。
算法运行机制
UC浏览器通用搜索引擎算法基于模型预测用户的搜索意图,匹配用户可能感兴趣的搜索结果信息,并搜索结果信息进行排序。我们会根据用户使用搜索服务过程中的浏览行为、通过提取公网网页的特征,并结合设备信息、服务日志信息,对排序模型进行实时反馈,不断调整优化检索排序结果。为满足用户的多元需求,我们会在排序过程中引入多样化排序技术,拓展推荐的内容,避免同类型内容过度集中。如用户要删除您的浏览和搜索记录,可以在“我的”“清除记录”中选择删除。
算法应用场景
UC浏览器首页搜索框等信息或服务的检索
算法目的意图
应用于搜索引擎,根据用户输入的查询词,搜索满足需求的网页
备案编号
网信算备440106203028804220013号
算法名称
UC浏览器热榜算法
算法基本原理
UC浏览器热榜榜单依据用户的搜索、点击和阅读等真实行为进行计算,综合结算UC浏览器平台内受到用户广泛关注的热点内容,形成实时榜单。
算法运行机制
UC浏览器热榜话题主要依赖用户的搜索、点击和互动行为,通过特定的算法计算产生,被大量用户搜索、点击、评论、转发、点赞的关键词,都可能成为热榜榜单的话题词。UC浏览器会综合用户的搜索频次、点击阅读量、评论/转发/点赞量等数据指标,进行加权求和和指标化处理,生成热榜榜单,榜单计算过程中会包含严格的防水军、反垃圾机制和违法不良信息过滤机制,以确保榜单计算结果客观。
算法应用场景
UC浏览器-头条-热榜
算法目的意图
为UC浏览器提供热门的资讯,提升用户发现信息资讯的效率。
2.个性化推荐类算法
算法名称
UC 信息流内容推荐算法
算法基本原理
为展示用户可能感兴趣的文字、图片、视频资讯,UC 浏览器会
使用用户主动提交的用户属性信息,并结合依法采集的设备信
息、服务日志信息,通过算法模型预测不同人群对信息资讯的
偏好特征,并基于偏好特征向相关人群推送可能感兴趣的信息
资讯。上述使用信息包括:1)用户属性信息:如用户提交的性
别、阅读喜好标签;2)行为信息,如用户的浏览次数、点击、
收藏、关注、转发等;3)设备信息:如设备型号、操作系统版
本、设备设置、设备标识符、设备环境、应用列表、网络连接
方式等。
算法运行机制
UC 浏览器会基于模型预测人群偏好特征,对不同的人群匹配、
下发人群可能感兴趣的信息资讯。我们会根据用户使用产品过程
中的浏览行为、反馈等,对推荐模型进行实时反馈,不断调整优
化推荐结果。为满足多元需求,我们会在排序过程中引入多样化
推荐技术,拓展推荐的内容,避免同类型内容过度集中。如用户不想看到 UC 浏览器信息流相关页面的资讯,可以通过点击资讯列表页的关闭按钮、点击资讯详情页的“不喜欢”选项向UC 浏览器进行反馈,或者进入视频资讯页面的举报投诉页面,根据页面提示选择用户不喜欢该信息资讯的原因。UC 浏览器在收到反馈后,会杜绝或减少该类资讯的推荐。如用户想管理推荐的个性化资讯,也可以在 UC 浏览器底部“我的-设置-隐私设置-个性化推荐”中进行设置。
算法应用场景
UC 浏览器信息资讯的展示
算法目的意图
向用户展示用户可能感兴趣的信息资讯
备案编号
网信算备440106203028802220011号
3. 过滤类算法
算法名称
UC 信息流内容安全算法
算法基本原理
UC 浏览器会通过对大量样本数据的分析,建立内容安全的算法
模型,依法对 UC 信息流发布的文本、图片、音频、视频等信息
内容,用户发布的评论、上传的小视频等内容进行风险识别和
处置,防范违法违规信息、违反 UC 浏览器平台规则内容的发布
和传播。这些信息包括:淫秽、色情、赌博、暴力、恐怖、教
唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信以及可能
侵害他人隐私或知识产权等合法权益的信息。
算法运行机制
UC浏览器内容安全算法的运行过程包括样本数据源采集和接入、特征库建立、审核、处置决策等。我们对UC浏览器网站平台上发布的文本、图片、音频、视频等信息,通过深度学习、统计学习、基于规则等风险分类模型进行内容安全风险识别,形成不同的风险置信度分级,对于高置信度的信息由算法直接完成审核,对于低置信度的信息将引入人工审核,最后完成对违规信息的处置决策。
算法应用场景
UC 信息资讯、用户评论等
算法目的意图
及时发现、处置违反法律、法规或违反社会公德、公序良俗或
违反平台规则的信息内容
备案编号
网信算备440106203028805220019号
4. 过滤类算法
算法名称
UC风险文本及图像识别算法
算法基本原理
UC浏览器会通过对大量搜索样本数据的分析,建立搜索服务内
容安全的算法模型,依法对搜索引擎所聚合、展示、链接、展
示的网页文本标题、网页摘要、图片、音频、视频等内容,进
行风险识别和处置,防范违法违规信息的发布和传播。这些违
法违规信息可能包括:淫秽、色情、赌博、暴力、恐怖、教唆
犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信以及可能侵
害他人隐私或知识产权等合法权益的信息
算法运行机制
UC 风险文本及图像识别算法的运行过程包括样本数据源采集和
接入、特征库建立、审核、处置决策等。我们对UC搜索服务聚
合、链接的网页信息(包括但不限于文本标题、摘要等),会
通过深度学习、统计学习、基于规则等风险分类模型进行内容
安全风险识别,形成不同的风险置信度分级,对于高置信度的
信息由算法直接完成审核,对于低置信度的信息将引入人工审
核,最后完成对违规信息的处置决策。
算法应用场景
UC 浏览器搜索服务
算法目的意图
遵守法律法规规定,防范 UC 浏览器搜索服务出现违法违规不良有害信息
备案编号
网信算备440106203028805220027号
5. 生成合成类算法
算法名称
UC 小蜜智能客服算法
 
 
算法基本原理
UC 小蜜智能客服算法根据用户咨询内容,结合 UC 智能客服知识 库,利用自然语言处理技术定位用户需要的知识,并给出对应的 解决方案;在用户获得解决方案之后,利用对历史咨询数据的统 计分析预估下一阶段可能咨询的问题,帮助用户更快速、便捷地 解决问题。
 
 
 
 
算法运行机制
用户通过客服进行了相关咨询,咨询的内容,经过去标识化处理, 在无法识别用户身份的情况下,UC 浏览器平台以问题为维度进行 抽样,用于智能客服算法模型训练,用于不断提升用户体验。 在 用户接受智能客服服务期间,我们会对用户进行显著提示,基于 智能客服使用情况,不断改进通知客服的服务质量。
算法应用场景
用于 UC 浏览器的客服中心
算法目的意图
为用户提供更智能、便捷的客诉解决方案
备案编号
网信算备440106203028801230019号

确定