钉钉算法服务说明



引言

为告知用户钉钉提供的算法服务情况,保障用户对算法服务的基本原理、目的意图和主要运行机制的知情权,钉钉服务提供者(或简称“我们”)制定本《钉钉算法服务说明》,以便用户充分了解。


一、适用范围

本说明适用于钉钉以网站、客户端、小程序以及随技术发展出现的新形态向您提供的各项产品和服务。


二、算法说明

算法名称钉钉翻译算法

基本原理钉钉翻译算法基于深度学习技术向用户提供特定语种之间的翻译服务,在用户使用时,将用户发送或接收的内容进行切分处理、翻译和复合生成后,转换为对应语种的文字。

运行机制钉钉翻译算法基于深度学习的算法模型,在用户长按选中的文字进行翻译时,会根据文字的语义进行切分,并进行文字翻译,最后进行复合生成对应语种的句子。翻译完成后,文字下方会打上“阿里AI翻译”字样。钉钉翻译算法仅支持对用户主动选中的内容进行翻译。在内容安全方面,如果翻译的内容违反法律、行政法规等有关规定时,将依法及时采取拦截等处置措施。

应用场景钉钉即时通讯的翻译功能,钉闪会功能的会议纪要翻译

算法意图帮助用户进行语言翻译,提高沟通效率

备案编号:网信算备330110391028001220027号


算法名称钉钉图像识别文字算法

基本原理钉钉图像识别文字算法会对用户发送或接收的图片进行处理,将图片中的文字信息进行识别和提取后转换为可编辑的文字,方便用户复制粘贴。

运行机制钉钉图像识别文字算法采用OCR算法技术,基于深度学习的训练框架,优化文字识别的算法模型,在用户长按图片并选择使用“识别文字”功能后,会对用户发送或接收的图片进行云端处理,识别和提取其中的文字。用户可以对识别后的文字进行复制粘贴。识别完成后,对话框底部会打上“OCR识别服务由阿里巴巴达摩院提供”标识。钉钉图片识别文字算法仅支持对用户主动选中的图片进行识别。在内容安全方面,如果识别到图片中的文字内容违反法律、行政法规等有关规定时,将依法及时采取拦截等处置措施。

应用场景钉钉即时通讯的识别文字功能

算法意图帮助用户快速提取图片中的文字信息

备案编号:网信算备330110391028001220035号


算法名称钉钉语音识别算法

基本原理钉钉语音识别算法会对用户发送或接收的语音消息进行处理,将语音消息进行识别后转换为文字,满足用户不同场景的需求。

运行机制钉钉用户发送或接收语音消息后,长按语音消息使用“转文字”功能,钉钉语音识别算法会提取语音消息中的声学特征,再结合语言模型进行解码打分策略,最终将得分最高的文本串作为语音的文本内容。转换为文本后,对话框底部会展示“DAMO语音识别”字样。钉钉语音识别算法仅支持对用户主动选中的语音消息进行识别。在内容安全方面,如果识别到图片中的文字内容违反法律、行政法规等有关规定时,将依法及时采取拦截等处置措施。

应用场景钉钉即时通讯中的语音转文字功能

算法意图满足用户在不方便读取语音消息时查看消息的需求;也满足听障人士沟通交流的需求

备案编号:网信算备330110391028001220019号


算法名称钉钉信息流推荐算法

基本原理为向用户展示内容或服务信息,我们会收集和使用用户在访问或使用钉钉服务时的浏览记录,并结合依法收集的设备信息、服务日志信息、用户提交的基础信息、用户所在组织的信息(如行业、角色),通过算法模型预测人群偏好特征。我们会基于人群偏好特征匹配用户可能感兴趣的内容或服务。

运行机制钉钉信息流推荐算法会基于模型预测人群偏好特征,匹配人群可能感兴趣的内容或服务信息,对展示的内容或服务信息进行排序。我们会根据您使用产品过程中的浏览行为,对推荐模型进行实时反馈,不断调整优化推荐结果。为满足多元需求,我们会在排序过程中引入多样化推荐技术,拓展推荐的内容,避免同类型内容过度集中。如用户想管理我们推送的个性化内容,可以通过“设置-隐私-内容推荐管理”选择屏蔽相应内容或服务;如用户想关闭推送的个性化内容,您可以在“设置-隐私-个性化内容推荐”中进行关闭。

应用场景钉钉看看功能内的内容(文章、视频等)信息流展示

算法意图向用户展示内容或服务信息

备案编号:网信算备330110391028002220015号


算法名称:钉钉内容安全算法

基本原理我们基于大量样本数据的分析,形成内容安全算法模型,依法对钉钉平台上发布的文本、图片、音频、视频等信息内容进行识别和处置,防范违反相关法律法规规定的淫秽、色情、赌博、暴力、恐怖、教唆犯罪、欺诈、虚假、侮辱、诽谤、恐吓、封建迷信等信息,以及可能侵害他人隐私、知识产权等合法权益的信息的发布和传播。

运行机制:钉钉内容安全算法的运行过程包括数据源接入、算法识别、审核、处置决策等。我们对钉钉平台上文本、图片、频、视频等信息,通过深度学习、知识图谱推理、时序模型和融合模型等风险分类模型进行安全风险识别,形成不同的风险置信度分级,对于高置信度的信息由算法直接完成审核,对于低置信度的信息将引入人工审核,最后完成对违规信息的处置决策。

算法意图:及时发现、处置违反法律、行政法规或违反社会公德、公序良俗的信息内容

备案编号:网信算备330110391028005220013号


算法名称钉钉智能客服算法

基本原理钉钉智能客服算法根据用户咨询内容,结合钉钉智能客服知识库,利用自然语言处理技术定位用户需要的知识,并给出对应的解决方案;在用户获得解决方案之后,利用对历史咨询数据的统计分析预估下一阶段可能咨询的问题,帮助用户更快速、便捷地解决问题。

运行机制用户通过客服进行了相关咨询,咨询的内容,经过去标识化处理,在无法识别用户身份的情况下,钉钉以问题为维度进行抽样,用于智能客服算法模型训练,用于不断提升用户体验。在用户接受智能客服服务期间,我们会对用户进行显著提示,基于智能客服使用情况,不断改进通知客服的服务质量。

算法意图:较人工客服更高效、快捷地响应用户咨询

备案编号:网信算备330110391028001230039号


算法名称钉钉会议智能纪要生成算法

基本原理钉钉会议智能纪要生成算法,可依托钉钉App的会议功能,向用户提供智能生成会议纪要服务,帮助用户快速回顾会议内容及要点。

运行机制:钉钉会议智能纪要生成算法,可将用户使用钉钉会议过程中的语音内容识别为文字,将数据输入算法,算法对文字内容进行智能总结后,将内容反馈给用户,以便帮助参会用户快速总结会议要点,提高参会效率。

算法意图:满足钉钉用户在钉钉上高效开展协同办公等的需求,提升钉钉用户在线办公或学习的效率。

备案编号:网信算备330110391028001240025号