加拿大联邦政府在2017年的预算中加大了对人工智能(AI)的投入,立志使加拿大成为AI领域的世界领先者。联邦政府投资数百万美元用于制定支持AI研究和商业化的国家战略。政府希望通过吸引高素质人才和获得重要企业支持,利用强大的AI研究成果,将加拿大建设为经济强国。
资金和人员一直是首要的政策优先项,但其他的阻碍依然存在。例如,加拿大的限制性版权规则可能会阻碍企业和研究人员测试并最终将新的人工智能服务推向市场的能力。
使机器智能化,无论是自动翻译、大数据分析或新的搜索功能,都是基于系统对数据的使用。机器通过扫描、阅读、聆听或观看作品进行学习。输入的数据越好,输出的结果就越好,输入数据的减少可能会造成结果的偏差或不准确。
版权法的限制性规则可能会减少机器学习可以使用的数据集,从而导致系统可用的训练集减少。鉴于加拿大版权法(通常被称为文本和数据挖掘例外)对允许机器学习缺乏明确的规则,这使得加拿大的法律框架落后于其他降低了在人工智能活动中使用数据集需要承担的风险的国家。
例如,考虑到如何训练机器翻译语言。2016年,联合国以六种联合国官方语言(英语、法语、西班牙语、阿拉伯语、俄语和中文)手工翻译了80万份文书,以供机器学习使用。包含多种语言版本完美翻译的文档有助于创建更好的自动翻译系统。实际上,官方政府文件一直是自动翻译系统重要的数据来源,因为它们提供了相同内容不同语言的专业翻译材料。
然而官方文件中的条约和外交辞令与日常交流不同。更好的系统需要更为广泛的数据来源,例如流行的书籍或电视节目的翻译。目的不是为了重新出版或与版权材料竞争,而是确保研究人员和AI公司能够为了信息分析的目的进行文本和数据挖掘。
加拿大法院裁定公平交易(版权法的基本例外条款,允许用户在无事先许可的情况下使用版权材料)是用户的权利,需要以更为广泛和自由的方式进行释义。在几个特定的目的下允许一些文本和数据挖掘活动,特别是适用于研究、教育和私人学习目的的例外条款。然而,鉴于加拿大重视人工智能的商业利益,法律可能无法提供足够的灵活性安全地将研究从实验室或教室转移到市场。
有两种方法可以克服人工智能的版权障碍。首先,加拿大可以效仿美国的公平使用模式,举例列出目前适用于公平交易条款的目的。美国可以在任何的目的下适用例外条款,因为寻求公正的平衡取决于作品的使用,而非拷贝作品的目的。由于机器学习不会损害原始作品的主要利益,因此大多数的文本和数据挖掘应该被视为合理使用。
其次,其他国家已经尝试通过为文本和数据挖掘或计算机信息分析创建一个特定的例外条款来解决这个问题。例如,英国的例外条款允许未经版权持有人许可,为了自动分析技术分析文字和数据的模式、趋势和其他信息的目的拷贝作品。法律不允许合同限制数据挖掘活动,但是例外条款仅适用于非商业研究。
文本和数据挖掘例外越来越受到欢迎(日本的版权法突出一个例外条款,欧盟也一直在争论增加例外条款),这意味着由于版权法的限制过大,加拿大在AI研究商业化中有落后的风险。在今年晚些时候,创新、科学与经济发展部部长Navdeep Bains以及加拿大文化遗产部部长Mélanie Joly将开展对版权法的审查,清理不必要的限制性法律障碍必将列入议程中。
本文作者:Michael Geist,加拿大渥太华大学法学院互联网与电子商务法研究主席。