ISO/IEC 5259-4:2024《人工智能 - 分析和机器学习(ML)的数据质量 - 第 4 部分:数据质量过程框架》的发布是中国在国际标准制定领域取得的重要成就,特别是对于推动全球人工智能技术的发展具有积极的意义。这一标准强调了高质量数据在机器学习和数据分析中的重要性,并提供了一个全面的过程框架来确保数据的质量。
该标准覆盖了多个方面,包括但不限于:
1. **监督机器学习**:提供了关于如何为训练数据创建标签的方法指导,这对于保证模型的准确性和可靠性至关重要。
2. **无监督机器学习**:处理没有明确输出标签的数据集时所需考虑的因素。
3. **半监督机器学习**:结合了少量标记数据与大量未标记数据进行学习的方法。
4. **强化学习**:涉及通过奖励机制使智能体学习最佳行为策略的数据处理方式。
5. **分析**:涵盖使用上述方法得到的结果进行深入解析的过程。
此外,该标准还适用于从多种来源收集到的数据,涵盖了从采集到使用的整个生命周期管理。这有助于组织建立一个系统化的流程来维护其数据资产的质量,从而支持更加可靠的人工智能应用和服务开发。
值得注意的是,尽管此标准设定了广泛适用的原则与指南,但它并未针对特定的服务、平台或工具给出具体规定。这意味着无论企业规模大小或是所属行业特性如何,都可以根据自身情况灵活地采用这些原则以提高其AI项目中所用数据的质量。
这样的国际标准不仅能够帮助提升中国在全球人工智能领域的影响力和技术领导力,同时也促进了跨国界的技术交流与合作,有利于形成更加统一和规范化的国际人工智能生态系统。
此外,
国际标准组织(ISO)和国际电工委员会(IEC)等机构制定了大量的国际标准,这些标准覆盖了从信息技术、质量管理到环境管理等多个领域。在人工智能(AI)及相关技术领域,除了ISO/IEC 5259-4:2024之外,还有其他一些重要的国际标准或正在开发中的标准。如下:
1. **ISO/IEC 2382-37:2018 - 信息技术 - 词汇 - 第37部分:人工智能 - 基本概念与术语**
这是关于人工智能基本术语的标准,它定义了一系列与AI相关的术语及其含义,为业界提供了一个共同的语言基础。
2. **ISO/IEC 22989 - 信息技术 - 人工智能系统生命周期过程框架**
此标准提供了一个人工智能系统的整个生命周期的过程框架,包括规划、设计、开发、部署、操作以及退役阶段的指导原则。
3. **ISO/IEC 42001 - 人工智能管理系统 - 要求**
该标准旨在帮助组织建立、实施、维护并持续改进一个有效的AI管理系统,确保AI应用符合伦理和社会责任的要求。
4. **ISO/IEC TR 24028:2019 - 信息技术 - 人工智能 - 信任值得性**
提供了对AI系统中信任问题的理解,并探讨了如何提高AI系统的可信度。
5. **ISO/IEC 27001 - 信息安全管理体系 - 要求**
虽然这不是专门针对AI的标准,但它对于保护包含敏感信息的数据集非常重要,特别是在使用AI进行数据分析时。
6. **ISO/IEC 2382-39:2020 - 信息技术 - 词汇 - 第39部分:大数据**
定义了与大数据相关的关键术语,这对于理解和交流大数据项目非常有用,而大数据通常是现代AI系统的基础。
7. **IEEE P7000系列标准**
IEEE也在制定一系列标准来应对AI领域的挑战,例如P7000系列专注于AI和自主系统的伦理考量。
8. **ISO/IEC JTC 1/SC 42 - 人工智能**
ISO/IEC联合技术委员会下的第42分委会负责所有与AI有关的工作,它正在开发多个标准,涵盖了从AI系统的偏见到透明度等多个方面。
这些标准有助于确保AI技术的安全性、可靠性和道德性,促进其在全球范围内的健康发展。
随着AI技术的不断进步,可以预见未来会有更多的标准被提出和采纳,以适应新的技术和应用场景。