Docusign Iris 是我们的 AI 引擎,旨在理解多种语言的协议,帮助客户获得见解,无论他们在哪里开展业务 - 使用混合 AI 模型、安全的基础设施和内置治理来跨地区和语言可靠地执行。
关键要点:
- Navigator 多语言洞察 – Docusign Navigator 以英语、法语和德语提供 AI 驱动的协议洞察,并于 4 月增加了扩展的洞察 ,并计划在今年晚些时候支持巴西葡萄牙语、西班牙语和日语。
- AI 辅助审查 – Docusign AI 辅助审查将于 5 月提供法语和德语版本,并计划在今年晚些时候扩展到巴西葡萄牙语和西班牙语。
- 混合 AI 方法 – 将第三方大型语言模型与专有的多语言 AI 相结合,以大规模提取协议见解。
- 大规模的全球企业基础设施 – Docusign Iris 在安全的全球分布式基础设施上运行,确保大规模的低延迟性能,以支持全球协议管理。
- AI 治理是核心 – 信任和透明度推动了我们的 AI 全球化工作,产品内控制使客户能够全面监督 AI 训练的数据使用情况。
为客户提供多语言 AI 模型
Docusign 为全球 180 多个市场的组织提供服务,这就是为什么我们在 AI 开发方面采用全球优先的思维方式 — 从一开始就设计我们的模型,以多种语言为客户提供 AI 驱动的协议见解。2024 年 12 月,我们推出了 AI 全球化支持,扩展了我们的智能协议管理 (IAM) 平台,以大规模提供特定于协议的多语言 AI 功能,从而达到了一个重要的里程碑。
作为一个旗舰示例,Navigator 是应用这种 AI 驱动的方法的第一步。它现在使客户能够提取英语、法语和德语的协议见解,并计划在今年晚些时候支持巴西葡萄牙语、西班牙语和日语。2025 年 4 月,我们在 12 月的初始版本的基础上,添加了英语(全球)、法语和德语的其他洞察。请参阅语言和区域支持主题,了解每种语言的可用见解的完整列表,以及有关语言可用性和区域扩展的更多详细信息。所有这一切都通过 Docusign Iris 实现,Docusign Iris 是一个 AI 引擎,可在整个协议生命周期中为 AI 功能提供支持,使您能够更快地创建协议、更有信心地提交并进行管理以实现最大的业务影响。
看点重要
AI 全球化对于增强用户体验至关重要,可确保所有人都可以使用我们的 AI 工具,并在不同语言和地区之间保持一致的性能。对于客户来说,这意味着可以用他们的母语处理、审查和分析协议,不仅可以翻译,而且可以深入理解,从而减少手动工作并提高生产力。将 AI 功能扩展到多种语言,使企业能够依靠 Docusign Iris 在全球市场进行一致的协议管理。
让我们探索推动 Docusign AI 全球化工作的方法、基础构建块和关键技术。
大规模的全球企业基础设施
Docusign 的一个关键区别在于我们强大的全球分布式基础设施,旨在为大型企业大规模运营。随着 AI 服务部署在北美 (NA)、欧洲 (EU)、加拿大 (CA)、澳大利亚 (AU) 以及即将在日本 (JP) 部署,我们可以在客户开展业务的地区提供低延迟性能和数据驻留。这种基础设施使我们能够无缝处理多种语言的大量协议,这是许多提供商通常难以实现的壮举。
客户的主要优势:
- 可扩展的基础设施 – 无论是处理 100 个还是 100,000 个协议,Docusign Iris 都可以扩展以满足业务需求。多语言 AI 模型在全球范围内部署,确保弹性和可用性,并拥有适应不断增长的运营需求的管道。
- 数据驻留 – 协议和提取的数据可以存储在特定于区域的数据中心内,让客户高枕无忧并保护客户数据。
- 跨区域的一致性 – 企业客户受益于所有区域的统一企业级性能,确保平稳运营。
构建多语言 AI 模型
我们采用混合 AI 模型方法,在多种语言中实现准确且可扩展的 AI。这涉及利用第三方大型语言模型(如 Azure Open AI)以及专为合同处理和协议智能设计的内部模型。
数据采集和选择
采购高质量、多样化的数据集是协议 AI 全球化的基础。现实世界的合同和协议因语言和国家/地区而异,因此很难为每个使用案例构建具有全球代表性的数据集。我们的方法侧重于通过以下方法确保数据质量和相关性:
-
供应商合作伙伴关系 – 与值得信赖的数据供应商合作,寻找多语言合同,扩大我们数据集的广度和深度。
-
匿名、聚合的客户数据 – 通过利用来自同意客户的匿名和聚合客户数据,Docusign 提高了 AI 辅助产品的准确性和性能。
- 这包括匿名化技术,例如编辑、屏蔽和替换为非敏感替代方案,以及将数据组合和合并为一个统一集合以使源数据脱敏的聚合方法。
- 请务必注意,客户保留对其数据的完全控制权,并且可以随时禁用 AI 训练的数据共享。在 Docusign 的 AI 驱动的未来中了解更多信息,其核心是客户控制 。
-
高质量数据 – 我们系统地选择一套反映不同法律结构和语言的代表性协议。删除重复项、模板和不相关的内容,以确保为模型训练提供高质量的输入。
通过利用这种多样化的数据采集管道,我们改进了跨语言的 AI 开发,减少了偏见,并增强了模型性能。
注解
大规模标记多语言数据集很复杂,需要精确度才能确保 AI 模型在不同语言中的性能一致。AI 模型的质量取决于它们训练所依据的数据 为了解决这个问题,我们正在通过以下举措加强自动化并加强质量控制:
- 注释自动化 – 我们正在投资智能标记工具,这些工具通过将机器学习与人工监督相结合来自动化数据注释,从而在保持准确性的同时加快流程。
- 并行注释 – 跨多种语言同时对数据集进行注释,以确保标签的一致性,减少可变性并跨区域调整数据质量。
- 质量控制和验证循环 – 我们特定于地区的主题专家验证大量带注释的数据,迭代应用他们的专业知识来优化标签,直到始终达到所需的精度。
通过将自动化与人类专业知识相结合,我们构建了高质量的数据集,为可靠的多语言 AI 模型提供支持。
模型开发
通过利用 AI 技术的组合,我们完善了我们的模型,以大规模提供一致、高质量的协议见解。
我们方法的关键组成部分:
- 片段选择 - 我们使用 Docusign AI 模型采用 AI 驱动的片段选择,从冗长的合同中提取最相关的部分,从而减少噪音并提高准确性。文档大小的减少加快了合同分析速度,为客户提供更快、更可靠的洞察。
- 提示工程 - 我们将快速工程与大型语言模型结合使用,以增强多语言数据提取。提示旨在考虑特定于语言的法律细微差别,并根据反馈和观察到的性能进行迭代优化。
- 后处理和规范化 - 提取的数据经过后处理,以提高跨语言的准确性和一致性。这包括纠错、筛选不相关结果和标准化以保持标准化输出。
- 微调模型 - 我们的策略包括微调 AI 模型,以随着时间的推移提高准确性和可扩展性。通过迭代模型改进,我们增强了跨多种语言高效处理协议的能力。
通过 AI 治理建立信任
AI 治理是我们全球化战略的核心。从模型开发的最早阶段开始,我们就通过将强大的治理实践嵌入我们的 AI 系统来优先考虑建立信任。重点领域包括:
- 数据保护和安全 - 当您使用 Docusign Iris 时,您的数据在传输和静态时都会被加密,防止未经授权的用户访问客户数据。如果您同意共享数据用于 AI/ML 训练,则在使用前会对其进行汇总和匿名化处理。当匿名数据用于自定义 AI 模型时,这些模型仅可供 Docusign 使用。
- 透明度 - 您的匿名数据仅在您同意的情况下用于 AI/ML 训练,您可以灵活地管理您的同意。借助触手可及的清晰文档,自信地做出明智的决策。
- 准确性和公平性 - Docusign Iris 旨在最小化错误和有害输出,这在高风险的场景中至关重要,如续订或谈判。我们使用多样化的数据集和彻底的检查来纠正扭曲的输出,并在模型部署之前确保质量。您还拥有批准输出的最终决定权,因此它们始终符合您的标准。
- 可扩展性和适应性 - 我们的合规存储和计算平台用于数据标签和 AI 训练,设计为可扩展。旨在满足 GDPR 要求并采用其他框架(包括 NIST AI 标准),以保持与不断变化的法规保持一致。
通过将治理嵌入到 AI 开发的每一步,我们构建了安全、合规且可扩展的解决方案,帮助满足全球客户群的需求。